生物統計学8のパワポ

Download Report

Transcript 生物統計学8のパワポ

生物統計学・第8回
違いを調べる(3)
判別分析、多重比較
2013年11月25日
生命環境科学域 応用生命科学類
尾形 善之
まず最初に……
★前回のレポート
♦ 対応のあるなしが分からない
♦ ふたつのU検定の違いが分からない
♦ 標準化した主成分分析で何が良くなったか分か
らない
データセットの対応
対応なし
繰り返し
At1g56650
対応あり
At3g43660
1
113.3
8.7
2
58.4
25.5
3
59.9
19.7
並べ替えても同じ意味
実験
At1g56650
At3g43660
1
308.5
27.5
2
77.2
18.0
3
69.7
20.5
4
96.2
13.3
5
40.3
16.8
6
53.1
17.7
⋮
⋮
⋮
79
77.7
99.4
勝手に並べ替えてはダメ
ふたつのデータセットの検定
パラメトリック
対応あり
対応のある𝒕検定
対応なし
対応のない𝒕検定
ノンパラメトリック
ウィルコクスンの検定
定
(正確には、ウィルコクスンの符
の符号付順位和検定)
マン・ホイットニーの検
の検定
もうひとつの𝑼検定
★ウィルコクスンの検定
♦ 実験ごとに差を計算
• 注目遺伝子の発現量-対照遺伝子の発現量
♦ 差の絶対値の大きい順に順位づけ
♦ 差が正のときの順位の合計を計算
♦ 検定表で𝑝値を得る
本日の課題
★ふたつの遺伝子の79実験での発現データ
に関して
1.
𝒕検定について、検定の種類・検定統計
量の算出・有意の判定方法を答えなさい。
2.
𝒕検定、𝑼検定、標準化データの主成分
分析の印象・疑問点を書いてください。
本日の課題
★ふたつの遺伝子の79実験での発現データ
に関して
1. このデータセットを使って 𝒕検定をする場
合の検定の種類・検定統計量の算出・有
意の判定方法を答えなさい。
2.
𝒕検定、𝑼検定、標準化データの主成分
分析の印象・疑問点を書いてください。
標準化データのPCA
★ランダムデータとの寄与率の比較
標準化前の寄与率
標準化後の寄与率
ランダムの寄与率
標準化データでの主成分分析
標準化前の負荷量
標準化後の負荷量
負荷量のグラフに原点が出現!
標準化データのPCA
★各主成分の寄与率
チェックポイント・I
1. データセットの対応、ふたつのデータ
セットの検定の使い分け、標準化データ
での主成分分析の利点は理解できまし
たか?疑問点があれば書いてください。
分散分析
★判別分析とともに次回取り上げます
★分散分析の目的
♦ 複数グループでの差の検定
• 𝑡検定は2グループでの検定
• でも、どこかに違いがあることがわかるだけ……
3つ以上のデータセットの検定
★分散分析
♦ データセット間のどこかに違いがある
• どのデータセット間に違いがあるかは分からない
★判別分析
♦ データセットをグループに分ける
• 分散分析の後にやることが多い
– 絶対に分散分析が必要なわけではない
分散分析
★まず教科書で説明します
♦ 持っていない人はスライドを見てください
エクセルでやる分散分析
★3つの遺伝子の79実験での発現データ
♦ 実演します
•
•
•
•
•
•
A1~C79セルにデータ入力
データ → データ分析 → 分散分析:一元配置
入力範囲をA1~C79に設定
「先頭行をラベルとして使用」のチェックを外す
𝛼を0.05に設定
結果の分散分析表の「𝑝値」を読めばOK
♦ 手計算を求めません
でも、手計算したい人のために
★分散分析を実演します
♦ ここは理解しなくても大丈夫です
♦ エクセルファイル
分散分析の纏め
★3つ以上のデータセットの違いを示す
★作業はエクセルでできる
★𝒇分布を使う
★𝒑値を読み取る
★言えることは「データセットのどこかに違
いがある」というだけ
チェックポイント・II
2. 分散分析の目的は?
3. 分散分析をソフトウェア(エクセル)で実
行する手順は?
4. 分散分析で言えることは?
判別分析
判別分析
判別分析
判別分析の纏め
★2つ以上のデータをグループ分けする。
♦ 実際はクラスタリングの方が便利
♦ 統計的な有意が必要な場合に使う
★エクセルの分析ツールには含まれない。
♦ Rや各種統計ソフトを使う
♦ 線形判別分析は手計算もなんとかできる
今日の自習のポイント
★分散分析の作業はエクセルでできます!
♦ 「anova131125.xlsx」をダウンロード
次回までの予習
★次回は「相関係数」です
♦ 教科書
• 相関係数、スピアマンの順位相関係数、共分散
♦ インターネット
• コサイン相関
本日の課題
★三つの遺伝子の79実験での発現データに
関して以下の問いに答えなさい。
1. 三つの遺伝子の発現データに違いがあ
るかどうかを調べる手順を書きなさい。
2.
分散分析・判別分析の疑問点を書いて
ください。