データウェアハウス・アプライアンス の紹介

Download Report

Transcript データウェアハウス・アプライアンス の紹介





なかじ(@nakaji)
blog http://d.hatena.ne.jp/nakaji999/
お仕事
大阪にあるN系子会社
去年の7月からは名古屋でBIシステム(DWH)の
導入をやってた
住んでる所
兵庫県尼崎市
でも、4月1日に東京勤務の異動通知が出たらしい (´・ω・`)
データベース使ってますか?
データがどんどん増えてませんか?
データが増え過ぎると性能でなくて困っちゃいますよね?
というわけで(どういうわけ?)、
この前まで名古屋で使ってたデータベース製品
の紹介をします
お客さん:検索に時間がかかりすぎます!遅いです!
管理者 :チューニングします!・・・ ドデスカ!?
お客さん:まだ遅いです!使い物になりません!!
(ワッショイワッショイ
管理者:(持てる知識を使い切ってがんばったけど・・・
もうむりぽ・・・)
ってのがあるんですYO!

いわゆる「DWHアプライアンス」製品

アプライアンスとは
特定の機能に特化したコンピュータのこと。
※「IT用語辞典e-Words」より
要はDWH専用のハード&ソフト
1.買ってきて
2.電源差して
3.スイッチオン
4.データベース作って
5.データ流し込んで
6.後は検索するだけ
インストールや細かい設定なんていらない!
冷蔵庫みたいなもんですね!
はい。速いです。
チューニングしたOracleで5分かかるクエリが5秒とか
Netezza社の説明によると、
従来の DWH システムに比べ 1/3 のコストで
10 倍~ 100 倍のパフォーマンス向上
らしいです
独自のMassively Parallel Processing
(超並列処理)アーキテクチャ
ホスト
ブレード
ディスク


データを各ディスクに分散&圧縮して格納
読み込み時は各ブレードでデータを伸張しながら絞り込み



100台のブレード
100台のディスク
※ディスク性能100MB/s
テーブルサイズが10GB
→各ディスクに100MBずつデータが格納
各ブレードがディスクから全データを読むのに1秒
速い!

インデックスの概念がない
理由:インデックスなくても速いんだからいらないよね

制約の概念もない
理由:そんなのがあるとチェックする分更新が遅くなるじゃん
スピードこそ正義!
1.オンライン系の処理させちゃ…
ダメ。ゼッタイ。
・基本的にテーブルをフルスキャン
→少量データを抜き出すのにも一定の時間がかかる
2.データベースエンジニアとしての感覚が…
良くある一コマ
A:データが1000万件増えるんだけど…
B:あー、それくらいなら数秒だから誤差の範囲だよ!
オソ、ロッシイ。
あるんですよ。奥さん。
HP Enterprise Data Warehouse Appliance
どんな製品なの?
特殊なスキルを必要とするシステム運用、使いなれないハードと手のかかる管理、高額な費用と引き換えに実
現する高パフォーマンス。これらデータウェアハウ ス(DWH)の悩みを一挙に解決するのが、HP Enterprise
Data Warehouse Applianceです。HPとマイクロソフトとの共同設計により、実績豊富なHP ProLiantサー
バーにMicrosoft SQL Server 2008 R2 Parallel Data Warehouseエディションを標準搭載し、超大規模並
列処理で大量のデータ処理をこなす、高性能、高スループット、大容量を実現するソリューションで す。アプラ
イアンスという提供形態がハード・ソフトの徹底した一体化を実現し、運用開始までの日数を大幅に短縮するほ
か、管理の簡素化を実現します。 (製品ホーム-ページより抜粋)
詳しくはWebで!
あるんですよ。奥さん。
Oracle Exadata
どんな製品なの?
• オンライン系も大量データの分析にも使える!
• 簡単にRACが組める(らしい)
• みんなが好きな(?) Oracle
• チューニングすればもっと速くなる
スバ、ラッシイ。
データベースサーバもお手軽で高性能な製品が
出てきてるんですよっていう紹介でした。
お高いですけどね(TωT)