Transcript ocn
卒業制作最終発表 LinkPoint: ネットワーク負荷軽減のために DNSによる近接性を取り入れたP2Pシステム 慶應義塾大学環境情報学部 黒宮 佑介(kuro) 親: 斉藤(ks91)さん サブ親: 重近(nazo)さん 目的 P2Pネットワークにおいて 下位層トポロジを考慮した網の構築を可能にする • ネットワーク・計算機資源の有効活用 – 近接通信で完結するデータ転送 – バックボーンへの負荷を低減 – 利便性の向上・新しいサービスの創発 2015/10/5 卒業制作最終発表 2 背景 • P2Pシステムの普及 – クライアント・サーバモデルとは異なる応用方法 によって構築されたネットワークシステム • 特徴 – ○利点:負荷分散性・耐障害性に優れる • 動画などの大容量コンテンツの配信 • インターネットクラウドなどの高負荷な処理への対応 – ×欠点:管理・制御が難しい • 展開されるネットワークの全容を把握することが困難 • ネットワークトポロジが流動的 2015/10/5 卒業制作最終発表 3 問題点 • P2Pシステムにおける管理性・制御性の欠如 – 不規則なP2Pネットワークトポロジを形成 同じデータなのに遠くから… Edge Network 組織A Regional Routers Internet Transit Search & File Transfer 組織B Regional Routers Edge Network • 下位層を考慮しないトポロジにより – 必要以上のトラフィックが発生しバックボーンを圧迫 2015/10/5 卒業制作最終発表 4 考え方:ネットワーク距離 • 下位層ネットワークトポロジ – そのものを取得するには大量のコストが必要 • 間接的に表現する指標 – ネットワーク距離 「指標」を用いることでコストを低減 2015/10/5 卒業制作最終発表 5 P2Pネットワークにおけるネットワーク距離 • 既存手法ではRTTやHop Countが使用される – RTTはデータ転送パフォーマンスの向上のため 本研究の目的には適さない – Hop Countは計測ができないノードが多い • トラフィックを集約するための指標が必要 2015/10/5 卒業制作最終発表 6 アプローチ • DNSを利用したネットワーク距離 root . – 管理ドメインに着目 jp Top Level Domain • 管理ドメインのラベル: FQDN ne – 同一のドメイン名を持つノード 2nd Level Domain Network Distance • 単一の組織に属している ためネットワーク的に近い – 優先的に接続する ad A B C 3rd Level Domain Network Distance • トラフィックの削減・ 集約が可能に A-a A-b B-a B-b C-a C-b Sub Domain a b Distance 2015/10/5 卒業制作最終発表 c d Distance 7 FQDNの解析 • Fully Qualified Domain Name(FQDN) – 組織名・地理情報・ネットワークIDなどが含まれる • FQDNの解析手順 1.ドメインレベルの判定 一致しなかったところで終了 2.レーベンシュタイン距離を計算 自分のホスト名との差を求める レーベンシュタイン距離 ドメインレベル p1234-ipbf5678marunouchi.tokyo.ocn.ne.jp p1234-ipbf2222marunouchi.tokyo.ocn.ne.jp 2015/10/5 卒業制作最終発表 8 レーベンシュタイン距離 • 2つの文字列の類似度を示す数値 – 編集距離ともいわれる • 文字列操作 出典: Wikipedia 例)レーベンシュタイン距離: 3 1. kitten – 置換 2. sitten (“k”を“s”に置換) – 挿入 3. sittin (“e”を“i”に置換) 4. sitting (“g”を挿入して終了) – 削除 必要な手順の最小回数を求める • 類似度が低いほど大きな数値が出る 2015/10/5 卒業制作最終発表 9 FQDNによる優先度 • FQDNを解析、「優先度」としてスコアを求める – ドメインレベル • ドメインレベルごとに64点を加算 – レーベンシュタイン距離 • 64点からレーベンシュタイン距離を引いた点を加算 – 64点 • “.”で区切られる最大長(63文字)+1点 • FQDNを詳しく解析すること – ネットワーク距離を細かく分析することにつながる 2015/10/5 卒業制作最終発表 10 評価 • 実測データを用いた検証 – FQDNによる優先度を実測データによって検証する • OCN • BBTEC • 提案アルゴリズムの検証 – FQDNの解析アルゴリズムを他のドメインのFQDN の命名規則をもとに検証する • 実ネットワークを用いた評価 – FQDNによる優先度によってトラフィックの影響範囲 が集約される様子を評価する 2015/10/5 卒業制作最終発表 11 実測データを用いた検証 • 実P2Pネットワーク上のノードに対して検証 – 対象: Winny・Share • 取得した実測データ – FQDN – Hop Count • 観測期間とノード数 – OCN:12/11~12/17(168時間) 35,000ノード – BBTEC:1/16~1/17(48時間) 13,750ノード 2015/10/5 卒業制作最終発表 12 Hop Countを指標として用いること • 本手法の目的 – インターネットにおけるトラフィックの局所化 ネットワーク負荷の軽減 • ネットワーク負荷 – フロースループット×リンク数 • Hop Count – 経由するリンク数を示している – 小さくすることでネットワーク負荷は低減される Hop Countを小さくすることが重要 2015/10/5 卒業制作最終発表 13 OCNから取得した実測データ • Hop CountとFQDNによる優先度の比較 30 アルゴリズムの境界 p****-adsao01yokonib1-acca.kanagawa.ocn.ne.jp p****-adsao01yokonib1-acca.kanagawa.ocn.ne.jp Domain Level Levenshtein Distance 12 分布: 粗 20 10 分布: 密 ノード数 8 ノード数 10 5 . jp ne 0 64 128 2015/10/5 p****-ipbf****hodogaya.kanagawa.ocn.ne.jp p****-ipbf****hodogaya.kanagawa.ocn.ne.jp ocn 192 256 320 384 295 300 305 310 315 320 優先度が高くなるにつれてHop Countが小さくなる 卒業制作最終発表 14 BBTECから取得した実測データ • Hop CountとFQDNによる優先度の比較 アルゴリズムの境界 30 30 Domain Level Levenshtein Distance 分布: 粗 softbank************.bbtec.net 分布: 密 20 20 ノード数 ノード数 10 10 . net 0 64 2015/10/5 128 192 178 180 182 184 186 188 190 優先度が高くなるにつれてHop Countが小さくなる 卒業制作最終発表 15 Hop CountとFQDN優先度の一致率 • OCN 一致 81% 0% • BBTEC 20% 40% 不一致 19% 60% 80% 一致 76% 0% • 一致率 20% 40% 100% 不一致 24% 60% 80% 100% – 実測データから任意の2つのノードを抜き出す – 優先度の高いノード=Hop Countが小さい 2015/10/5 卒業制作最終発表 16 他のドメインの命名規則 • 地域名・IDのみが入るもの – – – – p123a45.tokynt01.ap.so-net.ne.jp nttkyo123456.tkyo.nt.ngn.ppp.infoweb.ne.jp pl123.nas955.p-tokyo.nttpc.ne.jp OFSfb-123p123-123.ppp11.odn.ad.jp • IPアドレスのみが入るもの – 123-45-67-89.eonet.ne.jp – 89.67.45.123.dy.bbexcite.jp • IPアドレスの一部が入るもの – q6789.dynamic.ppp.asahi-net.or.jp • 地域名・ID とIPアドレスが入るもの – FL1-123-45-67-89.tky.mesh.ad.jp – i123-45-67-89.s05.a015.ap.plala.or.jp – 123x45x67x89.ap123.gyao.ne.jp 2015/10/5 卒業制作最終発表 17 FQDN評価アルゴリズムの検証 • 本アルゴリズム – ドメインレベル+レーベンシュタイン距離 • 他のアルゴリズム – ドメインレベルアルゴリズム – レーベンシュタイン距離アルゴリズム – 最長一致アルゴリズム 2015/10/5 卒業制作最終発表 18 ドメインアルゴリズム • 特徴 – レーベンシュタイン距離を計算しなくて良い – ホスト名の類似度が低い場合 同じ優先度になってしまう – 例) p3002-ipbf1710hodogaya.kanagawa.ocn.ne.jp • 256pt: p3044-ipbf1710hodogaya.kanagawa.ocn.ne.jp • 256pt: p8210-adsao01yokonib1-acca.kanagawa.ocn.ne.jp 2015/10/5 卒業制作最終発表 19 ドメインアルゴリズム ノード数 • OCNの場合 優先度256 30 12 20 10 Max Priority ノード数 8 ノード数 10 5 . jp ne 0 64 128 ocn kanagawa 192 256 2 256 208 224 240 256 272 288 304 320 Hop Countに関わらず1つの優先度に集約 2015/10/5 卒業制作最終発表 20 レーベンシュタイン距離アルゴリズム • 特徴 – ドメインレベルの判定を行う必要が無い – 本来優先度の低いノード群を選ぶ場合がある – 例)本アルゴリズム • 1位群: p****-ipbf****hodogaya.kanagawa.ocn.ne.jp • 2位群: p****-adsao01yokonib1-acca.kanagawa.ocn.ne.jp – 例)レーベンシュタイン距離 • 1位群: p****-ipbf****hodogaya.kanagawa.ocn.ne.jp • 2位群: p****-ipbf****kagawa.kagawa.ocn.ne.jp 2015/10/5 卒業制作最終発表 21 レーベンシュタイン距離アルゴリズム • OCNの場合 p****-adsao01yokonib1-acca.kanagawa.ocn.ne.jp 優先度32 p****-ipbf****kagawa.kagawa.ocn.ne.jp p****-ipbf****kagawa.kagawa.ocn.ne.jp 30 15 12 20 10 2nd Group ノード数 ノード数 8 10 5 1st Group 32 0 10 20 30 40 50 第2位群が神奈川から香川へ 2015/10/5 p****-ipbf****hodogaya.kanagawa.ocn.ne.jp p****-ipbf**** hodogaya.kanagawa.ocn.ne.jp 30 35 40 45 50 p****-ipbf****hodogaya.kanagawa.ocn.ne.jp 卒業制作最終発表 22 最長一致アルゴリズム • 文字列を右(後方)から最長一致する • 特徴 – 最も単純なアルゴリズム – 有効に働く場合と働かない場合がある – 例1) p3002-ipbf1710hodogaya.kanagawa.ocn.ne.jp • 有効に働く – 例2) softbank219209190116.bbtec.net • 有効に働かない(ネットワークIDがあるため) 2015/10/5 卒業制作最終発表 23 最長一致アルゴリズム • OCNの場合 優先度 30 下位 上位 p****-adsao01yokonib1-acca.kanagawa.ocn.ne.jp p****-adsao01yokonib1-acca.kanagawa.ocn.ne.jp 20 10 ノード数 8 ノード数 10 5 Lower 0 10 p****-ipbf****hodogaya.kanagawa.ocn.ne.jp p****-ipbf****hodogaya.kanagawa.ocn.ne.jp Upper 20 30 40 20 25 30 35 本アルゴリズムと同じ傾向に 2015/10/5 卒業制作最終発表 24 最長一致アルゴリズム ノード数 • BBTECの場合 優先度 30 下位 上位 30 20 10% 10% 90% 90% 20 ノード数 ノード数 10 10 Hop Count: 10以下 Lower Upper 0 2 5 8 10 12 9 10 11 12 13 14 近いものも優先度が低くなる 2015/10/5 卒業制作最終発表 25 FQDN評価アルゴリズムの検証 • ドメインレベルアルゴリズム – ホスト名が違う場合に対応できない • レーベンシュタイン距離アルゴリズム – 第2位群の精度の判定を間違う場合がある • 最長一致アルゴリズム – 有効に働く場合と働かない場合がある • 本アルゴリズム – すべての場合に適用可能であり、汎用性がある 2015/10/5 卒業制作最終発表 26 実装 • LinkPoint – ネットワーク距離にFQDNを用いたP2Pシステム • 動作 – メタ情報管理 • P2Pシステム内のファイルの情報を管理 • FQDNをメタ情報に付加 – データ転送 • メタ情報に含まれるFQDNから接続ノードを決定 • ネットワーク距離の近いノードからデータを取得 2015/10/5 卒業制作最終発表 27 評価 • 実ネットワークを用いた実験 – 実装のテスト:データ転送時のノード選択 • 自分以外のノードが同じデータを保持 自分にとって近いノードからデータを取得するか確認 – アルゴリズムの評価:データ拡散時のノード選択 • 各ノードがそれぞれ個別のデータを保持 データ拡散時にデータ転送が近接で収束するか検証 • データを3種類用意 – 10MB, 100MB, 1000MB – ノードあたりのデータ転送量を取得 2015/10/5 卒業制作最終発表 28 実験環境 ① bbexcite.jp 15 ③ ocn.ne.jp ⑤ bbtec.net 15 15 18 other Domain 15 20 12 19 The Internet 16 11 18 13 6 8 keio.ac.jp Domain dmc.keio.ac.jp ② 2015/10/5 7 sfc.keio.ac.jp ics.keio.ac.jp ④ ⑥ 卒業制作最終発表 29 FQDNによる優先度 • 本アルゴリズムによって計算した優先度 bbexcite. jp bbexcite. jp ocn. ne.jp bbtec. net dmc. keio.ac.jp sfc. keio.ac.jp ics. keio.ac.jp 2015/10/5 ocn. ne.jp bbtec. net dmc. keio.ac.jp sfc. keio.ac.jp ics. keio.ac.jp - 64 0 64 64 64 64 - 0 64 64 64 0 0 - 0 0 0 64 64 0 - 192 192 64 64 0 192 - 192 64 64 0 192 192 - 卒業制作最終発表 30 実験結果(データ通常転送時) • 異なるドメイン間の結果 bbexcite 遠くからもデータを受信 ocn bbtec 400 300 200 100MB 15 16 17 18 11 12 13 14 15 15 16 17 18 19 20 同じドメインがいない場合ネットワーク距離は関係ない 2015/10/5 卒業制作最終発表 31 実験結果(データ通常転送時) • 同じドメイン間の結果 dmc 近くからデータを受信 sfc ics 600 500 400 300 200 100MB 8 10 12 15 18 20 8 10 12 15 18 20 8 10 12 15 18 同じドメインがいる場合ネットワーク距離は有効に働く 2015/10/5 卒業制作最終発表 32 実験結果(データ拡散時) • 異なるドメイン間の結果 ①bbexcite 遠くからもデータを受信 ③ocn ⑤bbtec 3000 2000 1250 1500 1000 2000 750 1000 500 1000 500 250MB 15 16 17 18 11 12 13 14 15 15 16 17 18 19 20 同じドメインがいない場合ネットワーク距離は関係ない 2015/10/5 卒業制作最終発表 33 実験結果(データ拡散時) • 同じドメイン間の結果 ②dmc 近くからデータを受信 ④sfc ⑥ics 5000 5000 4000 4000 3000 3000 2000 2000 1000 1000 1250 1000 750 500 250MB 8 10 12 15 18 20 8 10 12 15 18 20 8 10 12 15 18 同じドメインがいる場合ネットワーク距離は有効に働く 2015/10/5 卒業制作最終発表 34 実ネットワークによる実験 • 同じドメイン名を持つノードが存在しない場合 – ネットワーク距離は有効に働かない 遠くからもデータを取得 • 同じドメイン名を持つノードが存在する場合 – ネットワーク距離は有効に働く 近くからデータを取得 • ネットワーク負荷の軽減が可能 2015/10/5 卒業制作最終発表 35 まとめ • 目的: P2Pネットワークにおけるネットワーク 資源の有効活用 – 問題点:不規則なネットワークトポロジ • アプローチ:DNSの管理ドメイン – FQDNに着目 • 評価:FQDNの解析アルゴリズム – ドメインレベル+レーベンシュタイン距離 – 汎用性・精度の面において優位(80%の一致率) 2015/10/5 卒業制作最終発表 36 今後の展望 • 新しい指標の検討 – FQDN以外のパラメータの導入 – BGPのルーティング情報の利用 • 評価方法の検討 – スループット・セッション数に着目 • 研究成果の社会への貢献 – 様々なP2Pシステムへの対応 – ISPへの提言 • 近傍性の判定に有用になるようなFQDNの利用 2015/10/5 卒業制作最終発表 37 ご清聴ありがとうございました [email protected] 2015/10/5 卒業制作最終発表 38 参考文献 [1] ISPを取り巻く状況と提案 http://www.soumu.go.jp/joho_tsusin/policyreports/chousa/inte rnet_policy/pdf/080627_2_si5-2.pdf 2015/10/5 卒業制作最終発表 39