Transcript PPT

ネットワーク構成法
スケール
第6回
11月19日
Web Service


個人のHPから、大規模な情報提供
どうやってスケールさせるか!

キャッシュを用いる




Proxy Server
Transparent キャッシュ
CDS
Serverの負荷分散


サーバのクラスタ化
サーバの地理的分散化
キャッシュ

通常のWeb Serviceには、いくつかのキャッ
シュが存在する



Client側のキャッシュ
組織レベルでのキャッシュ: Proxy
Network上でのキャッシュ: トランスペアレント
キャッシュ
Transparent Cash
キャッシュの問題点



UP to Dateな情報の提供
CGIなどのプログラム
データベースなどへのアクセス
Streaming Service



もともとキャッシュできるようなデータではない
Feeder と Distributor
Real Server


Encoder, Server, Splitter
Multicast
CDS





Contents Delivery Service
Akamai
Acceria
コンテンツ配信のためのキャッシュ網
Streaming のスプリッタ
Web Serverのスケール

Single Server


Memoryの増強や、Pre Forkの数の増加
Multi Server


クラスタ化
地理的分散化
オリンピックの特殊性

世界的なイベントである。


膨大なアクセス数



世界中からアクセスされる
Hit rate: 100,000,000 per day
= 1157 per second
IBMとしての実験(サービス?。。)


アトランタオリンピック
USオープンテニス
技術的な要件


世界中からのアクセスに対して、良好なレスポン
スを返す
膨大なアクセス数をさばく
アクセス予測

オリンピックホームページ



400 Pages / Language最初のページ
500 Pages (400 new images) 毎日の追加分
アクセス予測




100 Million hits / day = 1157 per second
20% from Japan
30% from Europe
50% from US(Australia include)
世界中からのアクセスの処理

世界数箇所にサーバを分散配置



アクセスを分散する仕組み
複数サーバでのコンテンツの透過性の確保
各所に設置されたサーバの処理能力の向上


Multi NodeシステムであるSP2の利用
Multi Nodeへの負荷分散の仕組み
アーキテクチャの概要
(Atlantaの場合)
JAPAN
US 1
US 2
Internet
UK
Germany
各地のサーバ

長野オリンピックのサーバ設置場所


IBM RS/6000 SP2



東京、アメリカ3箇所
30 Node (at main server)
40 Gigabytes
Net Dispatch (TCP Router)
国内のネットワーク構成
東京地区
Open net
Info98
HTTP/Notes
長野地区
T3 Backbone
NSPIXP-2
Internet
Net Dispatch(TCP Router)


SP2のMulti Nodeへの負荷分散機構
TCP Sessionレベルでルーティングする
HTTP Request
Net Dispt
Response
Node
Load Info.
TCP Session
Nodes Map Table
Node 1
Node 2
Node 3
Node 4
….
Node N
コンテンツの内容の透過性


各地に設置されたサーバ間 および
サーバ内のNode間 で すべて同様の内容を保
持する必要がある。
すべてのサーバおよびすべてのNodeで参照される
ディスクは、DFSによって共有されている。
With DFS client-side caching, only 5% of the 12 15 million hits per day required information to be
retrieved directly from a DFS server.
(Transarc Home Page said)



More Detail Configuration
Routing Info.
Hacked Gated
HTTP Request
Net Dispt
Response
Node
Load Info.
TCP Session
Nodes Map Table
Node 1
Node 2
Node 3
Node 4
….
Node N
More Detail Info (2)
Node 15
….
CISCO
Net Dispt
Internet
Node 1
Node 2
Net Dispt
CISCO
Node 2
Node 3
Node 4
Node 3
….
Node 15
世界各地のサーバへの負荷分散




結論: Single IP Address architecture
サーバ内のNodeは、TCP Routerのアドレスに
よってアクセスされる。
世界各地に設置されたサーバが同じIPアドレス
でサービスを提供する。
ネットワーク距離(経路制御的距離)の近いサー
バがアクセスできる。
Single IP Address Arch.
Open Net
NSPIXP-2
MAE-WEST
MAE-EAST
Links
DNS hack
クラスタ サーバ
L4 Switch