Transcript 生物統計学8のパワポ
生物統計学・第8回 違いを調べる(3) 判別分析、多重比較 2013年11月25日 生命環境科学域 応用生命科学類 尾形 善之 まず最初に…… ★前回のレポート ♦ 対応のあるなしが分からない ♦ ふたつのU検定の違いが分からない ♦ 標準化した主成分分析で何が良くなったか分か らない データセットの対応 対応なし 繰り返し At1g56650 対応あり At3g43660 1 113.3 8.7 2 58.4 25.5 3 59.9 19.7 並べ替えても同じ意味 実験 At1g56650 At3g43660 1 308.5 27.5 2 77.2 18.0 3 69.7 20.5 4 96.2 13.3 5 40.3 16.8 6 53.1 17.7 ⋮ ⋮ ⋮ 79 77.7 99.4 勝手に並べ替えてはダメ ふたつのデータセットの検定 パラメトリック 対応あり 対応のある𝒕検定 対応なし 対応のない𝒕検定 ノンパラメトリック ウィルコクスンの検定 定 (正確には、ウィルコクスンの符 の符号付順位和検定) マン・ホイットニーの検 の検定 もうひとつの𝑼検定 ★ウィルコクスンの検定 ♦ 実験ごとに差を計算 • 注目遺伝子の発現量-対照遺伝子の発現量 ♦ 差の絶対値の大きい順に順位づけ ♦ 差が正のときの順位の合計を計算 ♦ 検定表で𝑝値を得る 本日の課題 ★ふたつの遺伝子の79実験での発現データ に関して 1. 𝒕検定について、検定の種類・検定統計 量の算出・有意の判定方法を答えなさい。 2. 𝒕検定、𝑼検定、標準化データの主成分 分析の印象・疑問点を書いてください。 本日の課題 ★ふたつの遺伝子の79実験での発現データ に関して 1. このデータセットを使って 𝒕検定をする場 合の検定の種類・検定統計量の算出・有 意の判定方法を答えなさい。 2. 𝒕検定、𝑼検定、標準化データの主成分 分析の印象・疑問点を書いてください。 標準化データのPCA ★ランダムデータとの寄与率の比較 標準化前の寄与率 標準化後の寄与率 ランダムの寄与率 標準化データでの主成分分析 標準化前の負荷量 標準化後の負荷量 負荷量のグラフに原点が出現! 標準化データのPCA ★各主成分の寄与率 チェックポイント・I 1. データセットの対応、ふたつのデータ セットの検定の使い分け、標準化データ での主成分分析の利点は理解できまし たか?疑問点があれば書いてください。 分散分析 ★判別分析とともに次回取り上げます ★分散分析の目的 ♦ 複数グループでの差の検定 • 𝑡検定は2グループでの検定 • でも、どこかに違いがあることがわかるだけ…… 3つ以上のデータセットの検定 ★分散分析 ♦ データセット間のどこかに違いがある • どのデータセット間に違いがあるかは分からない ★判別分析 ♦ データセットをグループに分ける • 分散分析の後にやることが多い – 絶対に分散分析が必要なわけではない 分散分析 ★まず教科書で説明します ♦ 持っていない人はスライドを見てください エクセルでやる分散分析 ★3つの遺伝子の79実験での発現データ ♦ 実演します • • • • • • A1~C79セルにデータ入力 データ → データ分析 → 分散分析:一元配置 入力範囲をA1~C79に設定 「先頭行をラベルとして使用」のチェックを外す 𝛼を0.05に設定 結果の分散分析表の「𝑝値」を読めばOK ♦ 手計算を求めません でも、手計算したい人のために ★分散分析を実演します ♦ ここは理解しなくても大丈夫です ♦ エクセルファイル 分散分析の纏め ★3つ以上のデータセットの違いを示す ★作業はエクセルでできる ★𝒇分布を使う ★𝒑値を読み取る ★言えることは「データセットのどこかに違 いがある」というだけ チェックポイント・II 2. 分散分析の目的は? 3. 分散分析をソフトウェア(エクセル)で実 行する手順は? 4. 分散分析で言えることは? 判別分析 判別分析 判別分析 判別分析の纏め ★2つ以上のデータをグループ分けする。 ♦ 実際はクラスタリングの方が便利 ♦ 統計的な有意が必要な場合に使う ★エクセルの分析ツールには含まれない。 ♦ Rや各種統計ソフトを使う ♦ 線形判別分析は手計算もなんとかできる 今日の自習のポイント ★分散分析の作業はエクセルでできます! ♦ 「anova131125.xlsx」をダウンロード 次回までの予習 ★次回は「相関係数」です ♦ 教科書 • 相関係数、スピアマンの順位相関係数、共分散 ♦ インターネット • コサイン相関 本日の課題 ★三つの遺伝子の79実験での発現データに 関して以下の問いに答えなさい。 1. 三つの遺伝子の発現データに違いがあ るかどうかを調べる手順を書きなさい。 2. 分散分析・判別分析の疑問点を書いて ください。