生物統計学2のパワポ

Download Report

Transcript 生物統計学2のパワポ

生物統計学・第2回
全体を眺める(1)
平均と分散、各種グラフ、ヒストグラム
2013年10月7日
生命環境科学域 応用生命科学類
植物バイオサイエンス課程
尾形 善之
先週のレポート
★生機ですが……
♦ 講義の繋がりを説明しましたが、講義ごとに独立
しています。植物の遺伝子に注目しますが、分子
生物学的情報を使いますので、生命機能の人で
も十分に役立つと思います。
先週のレポート
★統計学の授業は初めてで不安です
♦ この講義だけで十分に理解できるように説明して
いきます。数式は必要最低限にする予定です
(まったく出てこない、ということはありません
が)。
先週のレポート
★実用的な授業を期待します
♦ 実際の生物データを利用して説明していきます。
生物データを全体的に眺めて、自分なりに理解を
深めて、この生物の遺伝子の働きを知っていくよ
うに構成しています。深く理解したい人向けに、
自習用のデータセットを提供します。
先週のレポート
★風立ちぬ……
♦ たくさんの感想、ありがとうございました。本当に
いろいろな意見があることを実感しました。
まずは先週のリマインド
★全体を眺める
★みんなを納得させる
★木を見て森を見てまた木を見る
今週のキーワードの前に
★生物データセットの説明をします
♦ シロイヌナズナの遺伝子発現データを使います
★シロイヌナズナとは……
♦ モデル植物:植物で初めてゲノムが読まれた
♦ 染色体5本(普通は10数本)でも、ちゃんと植物です
♦ いろいろ実験がしやすい
遺伝子発現とは
★遺伝子が転写されること
♦ つまり遺伝子が働いていること
複製:DNAをもうひとつ作
る
転写:DNAからRNAを作る
翻訳:RNAからタンパク質を作
る
遺伝子発現解析
★どうやって調べるか
♦ ゲノム規模なら「マイクロアレイ」
• 最近は「次世代シーケンシング」ですが……
♦ マイクロアレイとは……
• 遺伝子の発現量が分かる
生物データセット
★シロイヌナズナのマイクロアレイデータ
♦ 79実験条件
• 組織、発達段階
♦ 3反復
♦ 合計237実験
なぜ3反復するのか?
★237種類の実験ができたのに……
★統計解析のためです
♦ データが3つあると統計指標をつけられます
♦ ばらつき(広がり)を評価できます
• もともと生物データには、ばらつきが大きいです
チェックポイント・I
1. シロイヌナズナとはどんな植物です
か?
2. マイクロアレイは何を調べる道具です
か?
3. 生物データセットではなぜ反復実験を
するのですか?
ようやく本題へ
★本日のキーワード:平均
♦ データの「代表値」のことです
♦ 大きく3種類 + 1種類
♦ 次の平均を計算してください。
• 6.1, 5.8, 6.1
6.1+5.8+6.1
•
=6.0
3
– 正確には「算術平均」といいます
• それでは、それ以外の平均は?
いろいろな平均値(代表値)
★中央値(「真ん中」)
♦ データを大きい順に並べたときの真ん中
• 6.1, 5.8, 6.1なら、中央値は……
• 6.1
★最頻値(「一番多い」)
♦ 一番多く出てくる値
• 6.1, 5.8, 6.1なら、最頻値は……
• やっぱり6.1
もうひとつの平均値
★調和平均
♦ ちょっと違う値で説明します
1
1
♦ と の平均を求めなさい。
2
3
3+2
5
• 算術平均なら、
÷2=
6
12
1+1
2
• 調和平均では、
=
2+3
5
– 昔、こんな間違いをしたことないですか?
– 算術平均よりちょっと簡単です
平均値の使い分け
★算術平均
♦ 普通には、これを使ってください
★中央値
♦ 値がばらついているときに使います
★最頻値
♦ ひどいばらつき、実際に代表を選ぶ、数値ではない
★調和平均
♦ 分数で間の値をすぐに探したいとき(暗算)
チェックポイント・II
4. 4種類の代表値の使い分けは?
今日のキーワード:分散
★ばらつきのことです
♦ 詳しくは「標準偏差」の回でやります
♦ 標準偏差 = 分散
♦ 平均とばらつきをセットで使います
平均
ばらつき
平均
平均
いろいろなグラフ
★円グラフ
♦ 全体の中での割合を見る
★折れ線グラフ
♦ 変化を見る、量の変化は棒グラフ
★棒グラフ
♦ 量を比べる、量の変化を見る
★そのほかのグラフ
生物データとグラフ
At1g56650の遺伝
子発現データ
79実験条件
折れ線でいいの
か?
生物データとグラフ
At1g56650と似た
遺伝子発現データ
をもつ遺伝子群
こうなると折れ線で
ないと眺めにくい
これも森を見るためのグラフで
す
チェックポイント・III
5. 円グラフ、折れ線グラフ、棒グラフの使
い分けは?
6. シロイヌナズナの遺伝子発現データ全
体を眺める方法は?
今日の自習のポイント
★提供されるデータセットをダウンロードす
る(AtGE_dev_gcRMA.txt)。
♦ 圧縮されているので、解凍する。
♦ エクセルで開く。
★実験条件の説明ファイルもダウンロード
する(file.pdf)。
★CTRL+fを押して、「At1g56650」を検索
する。
次回までの予習
★次回は「主成分分析」です
♦ だんだん本格的な解析に入ります
♦ でも、丁寧に説明していきます
本日の課題
★シロイヌナズナの遺伝子発現データを
79実験条件、各3反復、手に入れまし
た。
1. 各実験の3反復を纏める方法について
述べなさい。
2. 3反復を纏めた後で、79実験条件をど
のように眺めたらよいか述べなさい。