Presenter: Remove this page prior to use
Download
Report
Transcript Presenter: Remove this page prior to use
®
IBM Software Group
DB2 Information Integrator Software
Марк Ривкин IBM EE/A
IBM Software Group | DB2 Information Management Software
Виды интеграции
Интеграция интерфейсов - Portal
Интеграция приложений - WS BI Server
Интеграция данных
Хранилища данных
Information Integrator
7/20/2015
2
IBM Software Group | DB2 Information Management Software
Два подхода к интеграции данных
Консолидация данных для локального доступа (DW)
Высокая производительность и доступность (HA) при централизации данных.
Нужны не самые свежие, а согласованные на данный момент времени данные
Для семантической согласованности данных нужны сложные преобразования (ETL)
Production applications, data warehouses, operational data stores
Обычно используется ETL (Extract, Transform, and Load) или репликация
Нужны исторические данные
Большие объемы данных
Структурированные данные
Интегрированный доступ к распределенным источникам (II)
Производительностью доступа и загрузки можно пожертвовать в угоду простоте и снижению цены
Нужны самые свежие данные
Политики безопасности, лицензирования или внутренние правила ограничивают возможность
перемещения данных
Смешение форматов данных, например customer ODS и контрактные документы или изображения
Данные нужны редко и нет смысла их хранить в DW
Наибольшие выгоды – при комбинации обоих подходов
7/20/2015
3
IBM Software Group | DB2 Information Management Software
DB2 Information Integrator - “Зонтик”
Федеративный сервер данных – Работать с распределенными данными
так, как будто они находятся в одном источнике данных
Описать интегрированный взгляд на разнотипные распределенные данные
Широкий диапазон источников данных и контента
Расширяемость на любые источники данных
Запросить как бы из единого источника
Использовать стандартные SQL запросы и SQL выражения
Использовать контекстный поиск
Реализовать специализированные функции в SQL
Integrated SQLView
Использовать оптимизацию запросов и хэширование
Работать с XML документами
Комбинировать различные источники
Использовать DTDs или XML схемы
Единый источник, реляционное обновление
DB2, Oracle, SQL Server, Sybase, Teradata, OLE DB, ODBC, Excel, XML, message queues, Web
services, flat files, document repositories, content repositories, LDAP directories, WWW, email
databases, and more.
7/20/2015
4
IBM Software Group | DB2 Information Management Software
Сценарии использования II
Business Intelligence
Portal
Расширение данных
хранилища свежими
данными
Единый интерфейс
к разным
источникам
Взгляд на все
данные
предприятия
Доступ к старым
данным
Непрерывное
пополнение DW
свежими данными
7/20/2015
Единые портлеты
Migration/Coexist
Слияние и
приобретение
Миграция между
БД
Синхронизация
БД
Единый поиск
5
IBM Software Group | DB2 Information Management Software
Расширение Data Warehouse оперативными данными
DB2 z/OS
SQL
Historical Data
Data Warehouse
Federated
Server
Analysis
Transformation
Optimize query
Cache
7/20/2015
SQL Server
Real-time Data
Operational Data Store
6
IBM Software Group | DB2 Information Management Software
Обеспечение единого взгляда на данные компании
Обеспечение единого взгляда на клиентов и контракты, хранящиеся в
разных системах
Доступ к данным на месте хранения – не надо их копировать
Oracle
SQL
Financial Services
Federated
Server
Analysis
Transformation
Optimize query
Cache
Sybase
Retail Bank
Документы, контракты, текущая инф
7/20/2015
7
IBM Software Group | DB2 Information Management Software
Ускорение разработки портала
Обеспечение доступа приложениям портала к множеству
структурированных и неструктурированных источников данных
Упрощение разработки и сопровождения
Oracle
SQL
Account Status
Federated
Server
Analysis
Transformation
Optimize query
Cache
Reference Documents
E-mail
Логика в одном месте
7/20/2015
8
IBM Software Group | DB2 Information Management Software
Сосуществование различных СУБД
Analysis
Transformation
Optimize query
Cache
Приложения прозрачно
работают с несколькими
СУБД на этапе
сосуществования и
миграции
Federation
Server
DB2 UDB
Strategic Store
Oracle, IMS
Replication
Server
Consolidation
Transformation
Manage Copies
7/20/2015
Legacy Store
Репликация для
синхронизации данных
9
IBM Software Group | DB2 Information Management Software
IBM DB2 Information Integrator обеспечивает:
Federate
Place Transform
Information
IntegrationPublish
7/20/2015
Metadata management and interchange
Виртуализацию данных
Стандартные языки доступа
• SQL, XQuery, Content, Search
Доступ на чтение/запись к различным источникам
данных и контента
Расширение доступа
Data placement
Кэширование, извлечение и загрузка, репликация
разнородной информации
Преобразование данных
Контроль качества данных
Data analysis and mining
SQL, XML, Web services
Advanced search
Управление метаданными
Data publishing
Publishing changed data events from diverse sources
MQ интеграция
WebSphere business integration
IBM Confidential
10
IBM Software Group | DB2 Information Management Software
Федеративный доступ к распределенным данным
DB2 UDB
DB2 UDB
on MVS
Integrated SQL View
DB2 Information Integrator
VSAM
DB2 II Classic
Federation
IMS
O
D
B
C
Software AG
Adabas
Sybase
SQL, SQL/XML
Federation Engine
Informix
Wrappers and functions
SQL Server
CA-Datacom
…
Ne
w
CA-IDMS
Oracle
Teradata
Package
d apps
Web services
7/20/2015
Biological
Data and
Algorithms
IBM
Extended
Search
Text
XML
Excel
WebSphere MQ
WWW, email,…
ODBC
11
IBM Software Group | DB2 Information Management Software
Data sources accessible by IBM Lotus Extended Search:
Lotus Notes, Lotus Domino.doc, Lotus Discovery Server, Lotus
QuickPlace, Lotus Sametime
IBM WebSphere Portal Search Engine, Microsoft Index Server,
Microsoft Site Server, Microsoft Exchange, LDAP Directories,
18 Web search engines (Yahoo!, Lycos, Excite, HotBot, Google, Alta
Vista, ABCNews.com, AOL.com Search, Business Wire, CNN,
Canada.com, EuroSeek, FAST Search, GoTo.com, NBCi, PR
Newswire WebCrawler, and Yahoo News)
Documentum, FileNet, DB2 Content Manager
7/20/2015
12
IBM Software Group | DB2 Information Management Software
Federated Sources
SQL
SQL
Mainframe
databases
Mainframe
files
IMS
VSAM
Adabas
Sequential
CA-Datacom
CA-IDMS
Content
Relational
databases
DB2 UDB
Informix
Oracle
Sybase
Teradata
Microsoft
SQL
Server
ODBC
XML
Web services
Packaged
applications
WebSphere
BI Adaptors
SAP
PeopleSoft
Siebel
Web
Other
Collaboration
Systems
OLE DB
Excel
Flat files
IBM Lotus
Extended
Search
Web
search
LDAP
Custom-built
Lotus Notes
Microsoft
Index Server
IBM Lotus
Extended
Search
Sametime
QuickPlace
Microsoft
Exchange
Content
& Imaging
Workflow
systems
DB2 CM WebSphere
Family
FileNet
Domino.doc
Documentum
FileNet
Open Text
Stellent
Interwoven
Hummingbird
Дополнительно инструменты BP предоставляют доступ к большему кол-ву источников
7/20/2015
13
IBM Software Group | DB2 Information Management Software
Концепции
Глобальный каталог
Системные таблицы
MQTs
Пользовательские данные
7/20/2015
Nickname
Локальные данные:
Server
Nickname
Использует инф о:
Статистике источника
Индексах источника
Функциях источника
Скорости сервера и сети
Nickname
Global optimizer
Server
Wrapper
Wrapper: библотека,
обеспечивающая доступ к
отдельному классу
источников данных или
протоколов (Net8...).
Содержит информацию о
характеристиках
источника
Server: представляет
конкретный источник
данных
Nickname: локальный
алиас для образа данных,
размещающихся на
удаленном сервере
(отображенных в строки и
колонки)
14
IBM Software Group | DB2 Information Management Software
Wrappers
Выполняют 4 основные задачи:
ƒ Моделирование данных
– Отображают исходную модель данных в реляционную модель
данных (таблицы с строчками и столбцами)
– Отображают функции в SQL операции
ƒ Планирование запроса
– Предоставляют информацию об источнике
– Выталкивают на источники как можно больше работы
– Определяют функции, отсутствующие на источнике (их
компенсирует II)
– Обеспечивают информацию для оптимизатора (cost and cardinality)
ƒ Connection and transaction management
ƒ Выполнение запросов и извлечение данных
– Выполняют части запроса пользователя на различных источниках
данных
7/20/2015
15
IBM Software Group | DB2 Information Management Software
Nicknames, Push down and Compensation
S
E
L
E
C
T
n
a
m
e
,
i
d
F
R
O
M
g
l
o
b
a
l
_
m
o
l
e
c
u
l
e
s
S
Q
L
A
P
I
(
J
D
B
C
/
O
D
B
C
)
O
r
a
c
l
e
D
a
t
a
D
a
t
a
S
o
u
r
c
e
Wrapes
D
a
t
a
b
a
s
e
A
p
p
l
i
c
a
t
i
o
n
F
e
d
e
r
a
t
e
d
S
e
r
v
e
r
c
l
i
e
n
t S
E
L
E
C
T
M
.
n
a
m
e
,
T
.
s
c
o
r
e
F
R
O
M
M
o
l
e
c
u
l
e
s
M
,
T
e
s
t
s
T
W
H
E
R
E
M
.
i
d
=
T
.
i
d
A
N
D
T
.
s
c
o
r
e
>
5
0
A
N
D
T
.
t
y
p
e
=
'
C
A
N
C
E
R
'
C
a
t
a
l
o
g
D
a
t
a
M
O
L
E
C
U
L
E
S
(инф о молекуле)
0
0
0
0
1
|
5
1
|
C
A
N
C
E
R
0
0
0
0
2
|
4
0
|
C
A
N
C
E
R
0
0
0
0
4
|
8
5
|
C
A
N
C
E
R
0
0
0
0
3
|
7
0
|
M
I
G
R
A
I
N
E
.
.
.
.
.
.
.
(результаты тестов)
T
E
S
T
S
Push down обработку данных, чтоб улучшить
производительность
7/20/2015
Компенсация для пропущенной функции (sort)
16
IBM Software Group | DB2 Information Management Software
Администрирование – Control Center
Create nickname wizard
Помогает создать nickname
Выбирает/создает wrapper, server, nickname
Create cache table wizard
Помогает создать кэш таблицы.
Выбирает/создает nickname, cache table и конфигурирует
репликацию
Export/ Deploy
Запоминает действия control center и записывает их в скрипт.
Позволяет редактировать скрипты и выполнять их в Task
Center
Monitoring
Мониторит набор nicknames, чтобы определить изменения в
схеме данных, которые могут повлиять на эти описания
nickname
Определяет состояние серверов (работает или недоступен)
Обновляет статистику
Запускает по расписанию обновление статистики для
nickname
Server discovery
Конфигурирование II
7/20/2015
17
IBM Software Group | DB2 Information Management Software
Обработка запросов к федеративным данным
Разбор и семантика
Query Rewrite
ƒ Трансформация запроса на основе эвристик и знаний об источнике
Pushdown Анализ
ƒ Анализирует как декомпозировать запрос
Cost-Based Optimization
ƒ Генерирует оптимальный план выполнения запроса, используя знания
об источнике: database statistics, indexes, source functions, server
capacity, network capacity
Генерация SQL
ƒ Производит эффективный для конкретного источника данных SQL
(для SQL источников)
Выполняет запрос над локальными и распределенными данными
Выполняет компенсацию функций и virtual database view
7/20/2015
18
IBM Software Group | DB2 Information Management Software
Гетерогенное кэширование
Улучшает производительность и надежность
выполнения запроса
Администратор описывает Materialized Query
Table
Заранее вычисленные или часто используемые
значения
User Application
Write
Read
Read
Любые данные из федеративных реляционных
источников
A B C
Неявное или явное использование (automatic
routing)
Разработчик включает использование кэша
Если включено – читает из кэша, пишет в источник
Если выключено – работает напрямую с источником
Обновление кэша:
Вручную
A
B
C
DB2
Microsoft
Репликация
Различные стратегии обновления задаются при
проектировании
7/20/2015
19
IBM Software Group | DB2 Information Management Software
DB2 Information Integrator OmniFind Edition
New
Быстрый ответ
Сложные алгоритмы для корпоративного контента
• Intranet, file systems, collaboration systems, content managers, and databases
Stemming, lexical analysis, anchor point analysis, dynamic summary, highlighted text
Легко встраивается в приложения
Java APIs
Document level security
GO
Может работать с большими объемами
500K документов и более
Тысячи одновременных пользователей
7/20/2015
Crawl
Index
Search
20
IBM Software Group | DB2 Information Management Software
OmniFind Crawlers
New
Web content
HTTP/HTTPS
News groups (NNTP)
WebSphere Portal web content sources
Collaboration
Crawlers
Web
Web
News
NNTP
Information
Integrator
DB2 II
Lotus Notes databases
DB2 CM
MS Exchange public folders
Domino
File systems
Content management systems
PDM
Other IBM
Sources
DB2 Content Manager
Relational Data sources
DB2 family (DB2, Informix, DB2 for z/OS)
DB2 Information Integrator relational data
sources (Oracle)
Exchange
Oracle
DB2 CM
Notes
WPS
IBM
Servers
MS
Exchange
Unix File
File
Servers
Unix File
Servers
3rd party
Other
Win File
DB2 for
z/OS
Informix
Data Listener
Custom
Crawler
7/20/2015
21
IBM Software Group | DB2 Information Management Software
DB2 Information Integrator 8.1
A Replication Server
Реплицирует данные между реляционными
СУБД
DB2, Informix, Microsoft, Oracle, Sybase, Teradata
Поддерживает гибкие топологии
DB2
Дистрибуция: один ко многим
Консолидация: многие к одному
Различные режимы репликации
Table-at-a-time (потабличный) для пакетной загрузки DW
в ограниченное время
Microsoft
Microsoft
Транзакционно-консистентный для оперативных данных
Выбор характеристик задержки
По расписанию, через интервал, непрерывный
Применение преобразований на лету
Стандартные SQL выражения или выполнение хранимых
процедур
7/20/2015
22
IBM Software Group | DB2 Information Management Software
Концепции гетерогенной репликации
IMS
DB2
DB2
Log based
Staging tables
Control
Sybase
Oracle
SQL
Server
Capture
Informix
Control
Apply
Federation
Engine
7/20/2015
Oracle
SQL
Server
Informix
Trigger based
Any
source
External application
Sybase
Teradata
Каждая стейдж-таблица содержит
изменения для одной исходной
таблицы
Формат стейдж-таблиы опубликован
для внешнего использования
Nicknames
23
IBM Software Group | DB2 Information Management Software
Расширение архитектуры репликации
New
Малая задержка, высокая пропускная способность
Высокая надежность
Database event publishing
Control
Source
Control
Apply
Capture
Federation
Engine
Target
Parallel
Log based
WebSphere MQ
7/20/2015
Каждое сообщение представляет транзакцию
XML формат сообщения
Высоко параллельный apply process
Определение и разрешение конфликтов репликации
Гетерогенные источники и подписчики
Wizard для конфигурирования
24
IBM Software Group | DB2 Information Management Software
Доступ к Web Services
Language Translate
Service
Providers
We
Currency Rate
b
SELECT l.city, t.degreesFahr
FROM location l, temperature t
Airline Fare
Stock Quote
Temperature
WHERE t.city=l.city
Интегрирует SQL предложения и вызов Web Service
Один оператор может работать с локальными и удаленными данными и с web
services
Поддержка генерации SQL функций и табличных UDFs, на основе WSDL web
service description ( WebSphere Studio)
7/20/2015
25
IBM Software Group | DB2 Information Management Software
Использование Web Services
Любой Web Service становится функцией или источником данных
Invoke single
conversion
web service
Conversion
Service
SQL Query:
select t.supplier, t.part_num, t.qty, to_dollars(currency,price) as dollars
from supplier_ops s, table(get_quote (s.supplier,s.url,'abc',20,current date)) t
where s.operation = 'GET_QUOTE';
Invoke many
quote web
services
Quote
Services
7/20/2015
26
IBM Software Group | DB2 Information Management Software
Публикация событий (или захват изменений в данных)New
WebSphere Business Integration
Workflow
ODBC Client
JDBC Client
DB2 Information Integrator
Classic Federation for z/OS
VSAM
7/20/2015
IMS
Асинхронная коммуникация
между слоем данных и слоем
приложений
DB2 UDB
for z/OS
27
IBM Software Group | DB2 Information Management Software
Связь с пакетными приложениями
New
Генерируются связанные иерархи
реляционных схем для бизнес объектов
пакетных приложений.
Запрос через SQL.
Можно соединиться с другими
приложениями и БД.
Websphere MQ
WBI Adapter
7/20/2015
WBI Adapter
WBI Adapter
28
IBM Software Group | DB2 Information Management Software
Information Integration
Мост в мир XML
XML wrapper
– Доступ к XML документам без их
занрузки
– Соединение XML с другими
данными
XML Extender
– Объектно-реляционное исполнение
– Хранить, извлекать, разбирать,
собирать XML
– Оценивать по DTD или Схеме
– Извлекать, преобразовывать
– Хранение
– куском
– Разбросать по таблицам
XML расширения в SQL
– Публиковать федеративные данные
как XML документы
7/20/2015
XML
world
29
IBM Software Group | DB2 Information Management Software
Интеграция с WebSphere MQ
Доступ из приложений к очередям
WebSphere MQ с помощью SQL
Читать очередь (destructively or
non-destructively)
Послать сообщение
Опубликовать сообщение на
определенную тему
Зарегистрировать интерес к
определенной теме
Insert into PENDING_ORDERS
select t.msg from table(MQRECEIVEALL());
Two-phase commit integrity
7/20/2015
30
IBM Software Group | DB2 Information Management Software
Инструментарий
Фокус: Сделать DB2 Information Integrator прозрачным для средств
разработки
DB2 Centers ( Control Center, Development Center, etc)
•
Поддержка для ДБА и разработчиков серверных приложений
WebSphere Studio (Eclipse Platform)
•
Web разработчики, J2EE разработчики, Data разработчики, XML
разработчики и т д
DB2 Microsoft Visual Studio
•
Поддержка разработчиков приложений для DB2
Business Intelligence Tools
•
7/20/2015
Протестировано с. Crystal Decisions, Business Objects, MicroStrategy, Brio,
Cognos…
31
IBM Software Group | DB2 Information Management Software
Ценность DB2 Information Integrator
Расширяет отдачу от сделанных инвестиций
Работает с существующей инфраструктурой
Консолидирует данные и обеспечивает доступ к распределенным
данным, включая старые системы, так, как будто они находятся в
одном источнике данных
Объединяет существующие данные и контент
Использует знакомую SQL программную модель и существующие
средства разработки
Построен на стандартной платформе
Уменьшает время разработки сложных приложений
Уменьшает ручное кодирование 40%-65%
Уменьшает требования к квалификации разработчиков
Наполовину сокращает время разработки
7/20/2015
32