PPTダウンロード - dsl.gr.jp

Download Report

Transcript PPTダウンロード - dsl.gr.jp

データベース論
朝日大学大学院
経営学研究科
奥山 徹
[email protected]
2006/06/05
データベース論(8回目)
1
講義日程
•
•
•
•
•
•
•
•
•
•
•
4月17日
4月24日
5月01日
5月08日
5月15日
5月22日
5月29日
6月05日
6月12日
6月19日
6月26日
2006/06/05
ガイダンスおよび集合論の基礎
リレーショナルデータベースの基礎
データ操作言語
データベースの論理設計
SQL(データベース操作言語)の基礎
データベース管理システム
データベースの内部スキーマ
質問処理とその最適化
トランザクション処理
分散データベース序説
定期試験
データベース論(8回目)
2
質問処理とは
2006/06/05
データベース論(8回目)
3
構文解析木
2006/06/05
データベース論(8回目)
4
2006/06/05
データベース論(8回目)
5
インデックスによる処理
• インデックスXAがファイルRのフィールドA上で
定義されているとする
– インデックスXA(でA値がaのXAレコード)を調べる
– A値がaのRレコードへのポインタ集合Sを求める
– Sの指示するファイルRのレコード内容をユーザに
返す
2006/06/05
データベース論(8回目)
6
2006/06/05
データベース論(8回目)
7
内部スキーマレベルでの処理
• インデックスXA(でA値がaなるXAレコード)を
調べ、 A = aなる条件を満たすレコードの位
置決めをする
• 当該レコード(を含むページ)を主記憶に
フェッチする
• 結果リレーションを構成しユーザに返す
2006/06/05
データベース論(8回目)
8
質問処理のコスト
• ni:フェッチしたインデックスページの総数
• nd:フェッチしたデータページの総数
• tc:処理に要したcpu時間
C = ni + nd + w × t c
2006/06/05
データベース論(8回目)
9
2006/06/05
データベース論(8回目)
10
2006/06/05
データベース論(8回目)
11
2006/06/05
データベース論(8回目)
12
結合質問処理
• リレーションRとSの直積をとる
• その直積の属性R.BとS.B上の等号選択をと
る
• その結果得られる中間リレーションを
{R.A, R.B, S.C}上で射影する
2006/06/05
データベース論(8回目)
13
2006/06/05
データベース論(8回目)
14
入れ子型ループ結合方のコスト
• CR:アウターリレーションをアクセスするコスト
• N:RのタプルのうちSのタプルと結合可能なタプ
ルの数
• CS:インデックスXS.Bを使って、アウターリレーショ
ンの1本のタプルと結合可能なSのタプルを全て
とってくるのに要する平均コスト
C = CR + N × CS + w × tc
2006/06/05
データベース論(8回目)
15
2006/06/05
データベース論(8回目)
16
2006/06/05
データベース論(8回目)
17
2006/06/05
データベース論(8回目)
18
2006/06/05
データベース論(8回目)
19
2006/06/05
データベース論(8回目)
20
2006/06/05
データベース論(8回目)
21
2006/06/05
データベース論(8回目)
22
2006/06/05
データベース論(8回目)
23
2006/06/05
データベース論(8回目)
24
2006/06/05
データベース論(8回目)
25
ソーとマージ結合法のコスト
C = Csort(R) + Csort(S) + Cmerge(L1,L2) + w × tc
2006/06/05
データベース論(8回目)
26
(i) (R[A = a])(A, B)
(ii) (R[A, B])[A = a]
2006/06/05
データベース論(8回目)
27
(i) (R(A, B)*S(B, C))[A = a]
(ii) (R(A, B)[A = a])*S(B, C)
2006/06/05
データベース論(8回目)
28
2006/06/05
データベース論(8回目)
29
2006/06/05
データベース論(8回目)
30
単純質問処理のコスト推定
TCARD(R):Rの(レコードを含んでいる)データページの総数
NINDX(XA):インデックスXAのインデックスページの総数
ICARD(XA):ファイルRの異なったA値の数
NCARD(R):Rのレコードの総数
2006/06/05
データベース論(8回目)
31
2006/06/05
データベース論(8回目)
32
2006/06/05
データベース論(8回目)
33
結合質問処理のコスト推定
2006/06/05
データベース論(8回目)
34
2006/06/05
データベース論(8回目)
35
2006/06/05
データベース論(8回目)
36
2006/06/05
データベース論(8回目)
37
第2のリレーションを考慮した拡張探索木(ソートマージ結合法)
2006/06/05
データベース論(8回目)
38
入れ子型質問処理コストの推定
2006/06/05
データベース論(8回目)
39
2006/06/05
データベース論(8回目)
40
2006/06/05
データベース論(8回目)
41
2006/06/05
データベース論(8回目)
42
2006/06/05
データベース論(8回目)
43
2006/06/05
データベース論(8回目)
44
2006/06/05
データベース論(8回目)
45
2006/06/05
データベース論(8回目)
46
2006/06/05
データベース論(8回目)
47
2006/06/05
データベース論(8回目)
48
2006/06/05
データベース論(8回目)
49
2006/06/05
データベース論(8回目)
50
2006/06/05
データベース論(8回目)
51
2006/06/05
データベース論(8回目)
52
2006/06/05
データベース論(8回目)
53
2006/06/05
データベース論(8回目)
54
2006/06/05
データベース論(8回目)
55
2006/06/05
データベース論(8回目)
56
まとめ
• 質問処理に関する問題
– 質問処理の実装
– インデックスの利用
– 各種質問に対するコスト
• 実際の実装との関係
2006/06/05
データベース論(8回目)
57
レポート課題(八回目)
• レポート課題
– 一般に、質問処理の最適化を行う場合、最適化と実
際の処理内容のオーバーヘッドがトレードオフの関
係あると言われる。どのようなトレードオフとなるの
か、自分の意見を示せ。
• 締め切り:6月19日タイムスタンプ有効にて電子
メールで
– メールアドレス:[email protected]
– サブジェクト:データベース論第八回課題
– 本文の最初に必ず学籍番号、氏名を記入
2006/06/05
データベース論(8回目)
58