Transcript 生物統計学1のパワポ
生物統計学・第1回 統計解析を始める前に 2013年9月30日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之 本講義の特徴ですが ★「講義」ではありますが、「実習」を想定し ています ♦ ノートパソコンなどで実習可能です ★来年度前期の「植物バイオサイエンス情 報処理演習」(B301860001)に繋がります まずは授業の進め方から ★宿題は出しません ♦ 自主学習の材料はどんどん提供します ★当日レポートを出します ♦ 講義の終わりに提出してください ♦ 出席を兼ねています ♦ 「チェックポイント」と「本日の課題」 ★期末テストをやります ♦ 平常点(4x15点)、期末テスト(60点) 予習と復習 ★予習 ♦ 次回の内容の方法について教科書・インターネッ トなどで調べておいてください ★復習 ♦ 研究室HPで復習用の材料を提供します ♦ 授業のパワポも提供します • リンクも貼っておきますので、活用してください – 例えば、NCBI 「統計解析」とは ★なるべく「全体」を眺める(統べて計る) ♦ 木を見て森を見ず ★誰でも納得させる(客観性) ♦ 「統計的に有意」 • 全体を眺めてみて何か意味があることが分かる チェックポイント・I 1. 皆さんの名前のふりがなを書いてくだ さい。 2. 皆さんの「確率・統計」体験を説明して ください。 3. 皆さんの「統計解析」体験を説明してく 第4問 ださい。 1 から9 までの数字が1 つずつ書かれた9 枚の□□□から5 枚の□□□を同時に取 り出す。このような□□□の取り出し方はアイウ通りある。 (1) 取り出した5 枚の□□□の中に5 と書かれた□□□がある取り出し方は エオ 通 りであり, 5 と書かれた□□□がない取り出し方は カキ 通りである……… 統計学基礎I、II 「生物統計学」とは ★「生物学」+「統計学」 ♦ 「生物データを使って統計解析」…… ♦ それだと、実際に習うのは「統計学」 ★「生物情報解析」 ♦ 「生物情報」+「統計解析」 • いずれ「バイオインフォマティクス」へ ♦ 「生物情報」を「統計解析」して「生物学的理解」に 繋げる • 「木」を見て「森」を見てまた「木」を見る 「生物情報」とは ★生物から得られる各種情報 ♦ たとえば、遺伝情報 • 遺伝子、交配、進化 ★今回は「遺伝子情報」を扱います ♦ 研究室HPで練習データを提供していきます ★注目するのは「At1g56650」です ♦ 遺伝子の名前(遺伝子座)です。 統計解析に入る前に・1 ★妥当なデータか ♦ 元のデータにエラーが含まれている • 解析結果は変わる ♦ 生データは割と恣意的にいじれてしまう • 勝手にデータを省いてはダメ ♦ 数値データからはエラーを見つけにくい • 統計的にエラー(ノイズ)を省くことはできる • でも、もう一度データを見直してください 統計解析に入る前に・2 ★標準化は可能か ♦ 統計解析するためには「標準化」が必要 ♦ 計算尺(「風立ちぬ」を見ましたか?) ♦ 単位を揃える 統計解析の第一歩・1 ★全体を眺める ♦ 統計指標をつける • 代表値(例えば「平均」) ♦ 全体をグラフ化する • 折れ線グラフ • 棒グラフ 統計解析の第一歩・2 ★みんなを納得させる ♦ 検定(テスト)する • 「統計的有意」を出す – t検定、U検定、ほかいろいろ ♦ 実際に飛ばしてみる • うまくいかないことも多い 本格的な統計解析 ★多変量解析 ♦ 生物現象を解明するためには、多くの種類の データを集める • 中には必要のないデータも含まれているかも • どのデータに注目していいのか ♦ データ全部を纏めて解析 • どの方法を使えばいいのか チェックポイント・II ★全体を眺める統計学的手法について説 明しなさい ★みんなを納得させる統計学的手法につ いて説明しなさい。 HPを紹介します ★URL(来週から対応) ♦ http://www.plant.osakafu-u.ac.jp/~ogata/ • Download → 2回生 ♦ http://www.plant.osakafu-u.ac.jp/plantbio/ • ダウンロード → 2回生 一歩進んだ自主学習のために ★情報は複数のソースから集める ★まずは何を明らかにしたいか考える ★生のデータを眺めて特徴を予想する ★最適な統計解析の手法を自分で考え る ★結果を素直に解釈する ★もう一度生のデータに戻る 来週までの予習 ★平均(各種平均) ★分散 ★グラフ(各種グラフ) ★ヒストグラム(頻度分布) 本日の課題 ★今日の授業を振り返って、「生物統計 学」についてどういう印象を持ちました か?