Презентация

Download Report

Transcript Презентация

<Insert Picture Here>
Шестнадцатая ежегодная
техническая конференция
«Корпоративные базы данных-2011»
Машина баз данных Oracle - Oracle Exadata
Марк Ривкин
Oracle CIS
Время доступа к сверхбольшим ХД
10 Hour
Table Scan Time
Обычное
хранилище
5 Hour
1 Hour
Exadata
1TB
10 TB
100TB
Table Size
Проблема производительности
сверхбольших ХД
• Большие хранилища сканируют десятки, сотни и тысячи дисков
• Соединения между дисками и серверами ограничивают скорость
передачи данных в десятки и сотни раз
• В результате хранилища становятся медленнее по мере роста
Решение проблемы
• Прокачивать меньше данных
• Увеличить количество каналов связи
• Сделать каналы связи шире
Пропускная способность Infiniband
Пропускная способность одного соединения
1400
1200
1000
MB/sec 800
600
400
В 12 раз
медленнее
В 3 раза
медленнее
200
0
Gigabit Ethernet
4Gb Fibre
20Gb Infiniband
Конфигурация системы с Exadata
Single-Instance
Database
RAC
Database
InfiniBand Switch/Network
Exadata Cell
Exadata Cell
Exadata Cell
• Каждая ячейка Exadata – самостоятельный сервер с
установленными дисками и ПО Exadata
• Данные «размазаны» между многими ячейками Exadata
• Нет ограничения на количество ячеек в системе
Традиционное выполнение запроса

SELECT
customer_id
FROM calls
where amount >
200;

Определяются
экстенты
таблиц

Выполняется
поиск

Возвращается
результат
• Пример:
• Оператор хочет найти
клиентов, которые тратят
больше $200 на один
звонок
• С традиционным

хранилищем, анализ данных
БД уменьшает
производится сервером БД
терабайт данных до
1000 имен, которые • Большая часть данных
отсеивается за
возвращаются
клиенту
ненадобностью
• Данные, которые
отсеиваются, тем не менее

тратят время на их передачу
Поиск завершен:
1 ТБ данных
возвращается на
сервер
Выполнение запросов с Exadata

SELECT
customer_id
FROM calls
where amount >
200;

Умный запрос
передается
ячейкам

Определяются
записи и колонки
внутри терабайтной
таблицы,
удовлетворяющие
условиям

Возвращаются
записи

Обобщаются
результаты
полученные
с разных
ячеек

2MB данных
возвращается на
сервер
• Только нужные колонки
• customer_id
И нужные записи
• where amount>200
Возвращаются на сервер БД
• Разгружается процессор БД
• Не передается лишний
объем данных
Exadata Smart Scan
• Ячейки Exadata реализуют механизм передачи
запросов на сторону хранилища (scan offload) с тем,
чтобы значительно уменьшить объем данных
возвращаемых на сторону серверов БД
•
•
•
•
11.2 •
•
Фильтрация строк на основе “where” предиката
Фильтрация колонок
Фильтрация соединений (join)
Фильтрация инкрементального backup
Фильтрация зашифрованных данных
Работа с функциями Data Mining
11.2
• 10x уменьшение данных является
обычным (на тестах заказчиков)
• Полностью прозрачно для приложения
• Даже если происходит сбой ячейки или диска во
время запроса
Прозрачность технологии Smart Scan для
приложений
• Smart scans прозрачен для приложения
• Не требуется изменения приложения или SQL кода
• Возвращаемые данные полностью консистентны
• В случае выхода из строя ячейки во время smart scan
незавершенная часть запроса прозрачно
перенаправляется на ячейку, содержащую копию
данных
• Smart Scans корректно обрабатывает следующие
случаи:
• Неподтвержденные записи (uncommitted) и
заблокированные записи
• Цепочки строк (chained rows)
• Сжатые таблицы
• Обработку национальных языков
• Работа с датами
• Регулярные выражения
• Партиционированные таблицы
Database Machine Software
Архитектура
11g Database
Server
• Oracle Database 11g на
8 или 2 узлах RAC
ASM
• ASM обеспечивает
зеркалирование,
чередование и
балансировку
Exadata
• ПО Exadata
обеспечивает smart
scan с помощью
протокола iDB
Управление
пулом хранения
Интеллектуальная
система хранения
Автоматическая степень параллелизма
Как это работает
SQL
оператор
SQL разобран и
оптимизатор определил
план выполнения
Если оцениваемое
время выполнения
меньше
Если оцениваемое
время выполнения
больше чем задано
параметром
Оптимизатор
определяет
идеальную DOP
Реальная DOP = MIN(default DOP, ideal DOP)
PARALLEL_MIN_TIME_THRESHOLD
SQL выполняется без
параллелизма
© 2009 Oracle Corporation – Proprietary and Confidential
New
11.2
SQL выполняется
параллельно
Параллельное выполнение в памяти
New
11.2
Как это работает
Определяет размер
просматриваемой
таблицы
SQL
оператор
Таблица очень
маленькая
Фрагменты таблицы
читаются в буферные
кэши каждого узла
Таблица очень
большая
Читает в буферный
кэш любого узла
© 2009 Oracle Corporation – Proprietary and Confidential
Таблица – хороший
кандидат для
параллельного
выполнения в памяти
Всегда использует
прямые чтения с
диска
Только параллельный сервер того же
узла RAC будет
обрабатывать этот
фрагмент
Инновации Exadata Storage Server
• Intelligent storage
• Hybrid Columnar Compression
• Smart Scan query offload
• Масштабируемый storage
+
+
– Сжатие до 10 раз для DW
– Сжатие до15-50 раз для архивов
+
• Smart Flash Cache
Данные
остаются
сжатыми
– Ускорение случайного I/O до 20 раз
– Удваивает скорость сканирования
данных
Несжатые
primary backup
Выгоды
мультиплексируются
test
standby
dev’t
Сжатые
Copyright © 2011, Oracle Corporation and/or its affiliates
Exadata Smart Flash Cache
Расширяет ограничения произвольного в/в дисков
300 I/O в секунду
• Компромисс между традиционными дисками и Флэш
памятью
• Диски дешевы, имеют большую ёмкость, но ограничены
низким в/в (300 IOPS на диск)
• Флэш память дорогая, имеет малую ёмкость, но может
поддержать тысячи операций в/в в секунду
• Идеальное решение - Exadata Smart Flash Cache
Десятки тысяч
операций в секунду
Copyright © 2009, Oracle Corporation and/or its affiliates
• Хранение данных на диске из-за стоимости
• Прозрачно перемещает “горячие” данные на флэш
кэш
• Используются флэш карты вместо флэш дисков, что
исключает ограничения дисковых контроллеров
• Флэш карты в Exadata
• Высокая пропускная способность, низкая лэтентность
• 4 x 96GB PCI Express Flash Cards на Exadata Server
– 15 –
Почему кэш SMART ?
• Exadata интегрирована с СУБД Oracle, поэтому умеет точно
определять что и когда кэшировать:
• Согласно атрибутам объекта CELL_FLASH_CACHE
• NONE, DEFAULT & KEEP
• DB caching hint (defined for different I/O types)
• CACHE, NOCACHE, EVICT
• ASM primary/secondary IOs
• I/O size (Small I/O are cached if KEEP is not set)
• < 128KB IO is small
• Подозрителен к сканированию таблиц – большим операциям
чтения
Примеры:
•
•
•
•
Операции с Control File кэшируются
Заголовки файлов, блоки индексов и таблиц кэшируются
Пропускает кэширование операций записи зеркальных копий
Пропускает кэширование форматирования табличных пространств
Гибридное колоночное сжатие
Hybrid Columnar Compression
• Данные группируются по
колонкам и затем сжимаются
• Query Mode для хранилищ
данных
• Оптимизированы для быстрого
доступа
• 10X сжатие
• Время сканирования уменьшается
соответственно
• Archival Mode для редко
используемых данных
Оптимизировано для уменьшения
занимаемо места
• 15X сжатие
• До to 50X раз для некоторых данных
• Помощник по сжатию
DBMS_COMPRESSION PL/SQL пакет
Exadata Hybrid Columnar Compression
Как это работает
Compression
Unit
• Таблица делится на группы из нескольких тысяч строк
• Compression Units (CUs)
• В CU данные режутся по колонкам и затем сжимаются
• Колонка позволяет хранить похожие данные вместе,
увеличивая степень сжатия
• Полезно при прямой загрузке и выборке данных
Reduces
4x
to 50x
Table
Size
Reduction
4x to 40x
• Низкая активность по обновлению
• Степень сжатия как у лучших промышленных
алгоритмов – Gzip, Bzip2 (LZO/ZLIB/BZ2 )
• Exadata выгружает на ячейки фильтрацию, проекции
и т д для сканирования сжатых данных
• Выборка по индексу возвращает сжатые блоки в БД, так
что экономится буферный кэш
Copyright © 2010, Oracle Corporation and/or its affiliates
– 18 –
Реальные результаты
Oracle Production E-Business Suite
Size Reduction Factor by Table
52
50
45
40
35
30
25
20
15
10
5
0
OLTP Compression (avg=3.3)
43
Query Compression (avg=14.6)
Archive Compression (avg=22.6)
10
10
10
11
29
16
19
19
19
20
• Коэффициенты колоночного сжатия
• Query = 14.6X
• Archive = 22.6X
• Зависит от приложения
21
Другие возможности ПО Exadata
• Exadata Storage Indexes
• Структура в памяти, которая исключает
ненужные дисковые операции В/В
• Хранит МИН и МАКС значения для каждой
колонки
• Обычно одна запись в индексе для каждого
Мб диска
• I/O Resource Manager (IORM)
• Обеспечивает приоритет операций В/В для
обеспечения предсказуемой
производительности
Copyright © 2009, Oracle Corporation and/or its affiliates
– 20 –
Exadata резко снижает трафик
10 TB данных
требуют IO для 10 TB
1 TB
после сжатия
100 GB
с partition pruning
милисекунды
на Database
Machine
20 GB
с Storage Indexes
5 GB
с Smart Scans
Данных в десятки раз меньше, Scans в 2000 раз быстрее
Copyright © 2009, Oracle Corporation and/or its affiliates
– 21 –
Архитектура Exadata
Single-Instance
Database
DB Server
DB Instance
DBRM
ASM
RAC
Database
DB Server
DB Server
DB Instance
DBRM
ASM
DB Instance
DBRM
ASM
iDB Protocol over
InfiniBand with
Path Failover
InfiniBand Switch/Network
OEL
MS
IORM
RS
Exadata Cell
CELLSRV
OEL
MS
IORM
RS
Exadata Cell
CELLSRV
Enterprise
Manager
OEL
MS
IORM
RS
Exadata Cell
CELLSRV
Cell
Control
CLI
Oracle Grid Computing
Кластеры серверов приложений
•
•
•
•
Storage Grid
Database Grid
Application Grid
Grid Control
Кластеры баз данных
Grid Control
Сетевые устр. хранения
Архитектура Exadata X2-2
Database Grid
• 8 compute servers (1U)
• 2 Intel Sockets
Storage Grid
• 14 storage servers (2U)
• 2 Xeon CPUs per server
InfiniBand Network
• Redundant 40Gb/s switches
• Unified server & storage net
• 100 TB High Speed disk,
or
336 TB High Capacity
disk
• 5 TB PCI Flash
• Data mirrored across
storage servers
Новая модель. Exadata X2-8
Database Grid
• 2 64-core Intel EX Servers
• 2 TB Memory
• Выбор:
• Oracle Linux Unbreakable
Enterprise Kernel
• Solaris 11 Express
Network
• Redundant 40Gb/s Infiniband
• 10 Gb Ethernet to Data Center
Storage Grid
• Same Storage Grid as
Exadata X2-2
• CPUs updated to latest
6-core Xeon
Можно начать с четверти Exadata
Quarter
Rack
Half Rack
Full
Rack
Масштабируемость до 8 шкафов
2368 ядер
2.6 петабайт несжатых данных
Радикальное упрощение развертывания
• Database Machine упрощает
развертывание систем БД
• Месяцы конфигурации, разрешение проблем, настройки
• Database Machine готова к
назначенному сроку
• Уже созданная, протестированная , стандартная и
поддерживаемая конфигурация
• Прозрачно для существующих приложений – не
нужно никаких изменений!
Не месяцы,
а дни
• Экстремальная производительность
“прямо из коробки”
Copyright © 2009, Oracle Corporation and/or its affiliates
– 28 –
Sun Oracle Database Machine
Экстремальная Производительность для всего
• Для хранилищ данных
• Параллельные запросы в памяти или в Flash
• Сжатые 4TB данных в памяти, 50 TB на flash
• В среднем в 10X-20X быстрее традиционных хранилищ
• Для OLTP-систем
• Масштабирование реальных приложений в grid - среде
• Smart flash кэш обеспечивает 1 млн операций ввода/вывода
в секунду
• Сжатые 1.2 TB данных в памяти, 15 TB в Flash
• Сжатие в 50x для архивных данных
• Защищенность и отказоустойчивоть
• Для консолидации баз данных
• Поддерживает масштабирование любых типов нагрузки
• Предсказуемое время отклика в многопользовательском
окружении
Машина БД Exadata
Консолидация всех существующих приложений
• На Exadata могут совместно выполняться
приложения любого типа. Это гарантируется:
ERP
CRM
Warehouse
Data Mart
HR
• Широкими каналами и масштабируемой системой
ввода/вывода;
• Instance Caging – ограничение на ресурсы ЦПУ между
БД на одном узле;
• Менеджер ресурсов ввода/вывода;
• Большой объем памяти и процессорные
мощности для онлайн задач;
• Оффлоадинг операций (smart scans, storage
indexes) для пакетных задач, отчетности,
хранилищ;
• Встроенная компрессия – существенная
сэкономить на дисковом пространстве для
любых приложений.
• Архивы и данные для отчетности
Copyright © 2010, Oracle Corporation and/or its affiliates
– 30 –
Exadata на рынке
• Была выпущена в 2008
• Применяется в всех регионах и индустриях
© 2010 Oracle Corporation
31
Итак, Exadata – это не только ценный мех
высокая производительность, НО и:
Поколоночное сжатие
Распарралеливание запроса на 128+ процессоров
Огромная память 2 Тб на 1 машине
Компактность (1 холодильник вместо 22 комп + диски)
Масштабируемость – 0.25 -> 1 -> 8 …..
HA внутри коробки
Сбалансированная архитектура
Предустановлено, преконфигурировано
Быстрое развертывание
Единая точка тех поддержки
Единая консоль управления, патчи и т д
Дешево (особенно если oracle уже есть)
DSS+DW+OLTP+ mixed
Итд
Why Should Customers Upgrade to 11g Training
33
X2-2 Database Server (Sun Fire X4170 M2)
Processors
2 Six-Core Intel® Xeon® X5670 Processors (2.93 GHz)
Memory
96GB (12 x 8GB)
Local Disks
4 x 300GB 10K RPM SAS Disks
Disk Controller
Disk Controller HBA with 512MB Battery Backed Cache
Network
2 (Two) x InfiniBand 4X QDR (40Gb/s) Ports (1 Dual-port PCIe 2.0
HCA)
4 (Four) x 1GbE Ethernet Ports
2 (Two) x 10GbE Ethernet SFP+ Ports (1 Dual-port 10GbE PCIe
2.0 network card based on the Intel 82599 10GbE Controller
technology)
Remote
Management
1 Ethernet port (ILOM)
Power supplies
2 Redundant Hot-Swappable power supplies
Copyright © 2010 Oracle Corporation and/or its affiliates
– 35 –
X2-8 Database Server (Sun Fire X4800)
Processors
8 x Eight-Core Intel® Xeon® X7560 Processors (2.26 GHz)
Memory
1 TB (128 x 8GB)
Local Disks
8 x 300GB 10K RPM SAS Disks
Disk Controller
Disk Controller HBA with 512MB Battery Backed Cache
Network
8 (Eight) x InfiniBand 4X QDR (40Gb/s) Ports (4 Dual-port PCE 2.0
Express Modules)
Two Network Express Modules (NEM), providing a total of
• 8 (Eight) x 1GbE Ethernet Ports
• 8 (Eight) x 10 GbE Ethernet SFP+ Ports (via 4 Fabric Express
Modules (FEM) based Intel 82599 10GbE Controller technology)
Remote
Management
1 Ethernet port (ILOM)
Power supplies
4 Redundant Hot-Swappable power supplies
Copyright © 2010 Oracle Corporation and/or its affiliates
– 36 –
Exadata Storage Server X2-2 (Sun Fire X4270 M2)
Processors
2 Six-Core Intel® Xeon® L5640 Processors (2.26 GHz)
Memory
24 GB (6 x 4GB)
Disks
12 x 600 GB 15K RPM High Performance SAS
OR
12 x 2 TB 7.2K RPM High Capacity SAS
Flash
4 x 96 GB Sun Flash Accelerator F20 PCIe Cards
Disk Controller
Disk Controller HBA with 512MB Battery Backed Cache
Network
2 (Two) InfiniBand 4X QDR (40Gb/s) Ports (1 Dual-port PCIe
2.0 HCA)
4 Embedded Gigabit Ethernet Ports
Remote
Management
1 Ethernet port (ILOM)
Power Supplies
2 Redundant Hot-Swappable power supplies
Copyright © 2010 Oracle Corporation and/or its affiliates
– 37 –