Transcript 生物統計学2のパワポ
生物統計学・第2回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013年10月7日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之 先週のレポート ★生機ですが…… ♦ 講義の繋がりを説明しましたが、講義ごとに独立 しています。植物の遺伝子に注目しますが、分子 生物学的情報を使いますので、生命機能の人で も十分に役立つと思います。 先週のレポート ★統計学の授業は初めてで不安です ♦ この講義だけで十分に理解できるように説明して いきます。数式は必要最低限にする予定です (まったく出てこない、ということはありません が)。 先週のレポート ★実用的な授業を期待します ♦ 実際の生物データを利用して説明していきます。 生物データを全体的に眺めて、自分なりに理解を 深めて、この生物の遺伝子の働きを知っていくよ うに構成しています。深く理解したい人向けに、 自習用のデータセットを提供します。 先週のレポート ★風立ちぬ…… ♦ たくさんの感想、ありがとうございました。本当に いろいろな意見があることを実感しました。 まずは先週のリマインド ★全体を眺める ★みんなを納得させる ★木を見て森を見てまた木を見る 今週のキーワードの前に ★生物データセットの説明をします ♦ シロイヌナズナの遺伝子発現データを使います ★シロイヌナズナとは…… ♦ モデル植物:植物で初めてゲノムが読まれた ♦ 染色体5本(普通は10数本)でも、ちゃんと植物です ♦ いろいろ実験がしやすい 遺伝子発現とは ★遺伝子が転写されること ♦ つまり遺伝子が働いていること 複製:DNAをもうひとつ作 る 転写:DNAからRNAを作る 翻訳:RNAからタンパク質を作 る 遺伝子発現解析 ★どうやって調べるか ♦ ゲノム規模なら「マイクロアレイ」 • 最近は「次世代シーケンシング」ですが…… ♦ マイクロアレイとは…… • 遺伝子の発現量が分かる 生物データセット ★シロイヌナズナのマイクロアレイデータ ♦ 79実験条件 • 組織、発達段階 ♦ 3反復 ♦ 合計237実験 なぜ3反復するのか? ★237種類の実験ができたのに…… ★統計解析のためです ♦ データが3つあると統計指標をつけられます ♦ ばらつき(広がり)を評価できます • もともと生物データには、ばらつきが大きいです チェックポイント・I 1. シロイヌナズナとはどんな植物です か? 2. マイクロアレイは何を調べる道具です か? 3. 生物データセットではなぜ反復実験を するのですか? ようやく本題へ ★本日のキーワード:平均 ♦ データの「代表値」のことです ♦ 大きく3種類 + 1種類 ♦ 次の平均を計算してください。 • 6.1, 5.8, 6.1 6.1+5.8+6.1 • =6.0 3 – 正確には「算術平均」といいます • それでは、それ以外の平均は? いろいろな平均値(代表値) ★中央値(「真ん中」) ♦ データを大きい順に並べたときの真ん中 • 6.1, 5.8, 6.1なら、中央値は…… • 6.1 ★最頻値(「一番多い」) ♦ 一番多く出てくる値 • 6.1, 5.8, 6.1なら、最頻値は…… • やっぱり6.1 もうひとつの平均値 ★調和平均 ♦ ちょっと違う値で説明します 1 1 ♦ と の平均を求めなさい。 2 3 3+2 5 • 算術平均なら、 ÷2= 6 12 1+1 2 • 調和平均では、 = 2+3 5 – 昔、こんな間違いをしたことないですか? – 算術平均よりちょっと簡単です 平均値の使い分け ★算術平均 ♦ 普通には、これを使ってください ★中央値 ♦ 値がばらついているときに使います ★最頻値 ♦ ひどいばらつき、実際に代表を選ぶ、数値ではない ★調和平均 ♦ 分数で間の値をすぐに探したいとき(暗算) チェックポイント・II 4. 4種類の代表値の使い分けは? 今日のキーワード:分散 ★ばらつきのことです ♦ 詳しくは「標準偏差」の回でやります ♦ 標準偏差 = 分散 ♦ 平均とばらつきをセットで使います 平均 ばらつき 平均 平均 いろいろなグラフ ★円グラフ ♦ 全体の中での割合を見る ★折れ線グラフ ♦ 変化を見る、量の変化は棒グラフ ★棒グラフ ♦ 量を比べる、量の変化を見る ★そのほかのグラフ 生物データとグラフ At1g56650の遺伝 子発現データ 79実験条件 折れ線でいいの か? 生物データとグラフ At1g56650と似た 遺伝子発現データ をもつ遺伝子群 こうなると折れ線で ないと眺めにくい これも森を見るためのグラフで す チェックポイント・III 5. 円グラフ、折れ線グラフ、棒グラフの使 い分けは? 6. シロイヌナズナの遺伝子発現データ全 体を眺める方法は? 今日の自習のポイント ★提供されるデータセットをダウンロードす る(AtGE_dev_gcRMA.txt)。 ♦ 圧縮されているので、解凍する。 ♦ エクセルで開く。 ★実験条件の説明ファイルもダウンロード する(file.pdf)。 ★CTRL+fを押して、「At1g56650」を検索 する。 次回までの予習 ★次回は「主成分分析」です ♦ だんだん本格的な解析に入ります ♦ でも、丁寧に説明していきます 本日の課題 ★シロイヌナズナの遺伝子発現データを 79実験条件、各3反復、手に入れまし た。 1. 各実験の3反復を纏める方法について 述べなさい。 2. 3反復を纏めた後で、79実験条件をど のように眺めたらよいか述べなさい。