2014/8/23

Transcript 2014/8/23

2014/8/23 香川県看護協会
看護に役立つデータ分析
（研修資料）
田中潔
岡山商科大経営学部商学科教授
（教学部長）
スケジュール予定など
• 10:00-11:00頃
看護研究・データ分析再考
– データ分析の基礎知識・用語
– データ相談のための共通認識
• 11:00-12:00頃
基礎統計とグラフ
– エクセルによる素データ準備
•
• 13:00-14:30頃
昼食
回帰分析の要点
– エクセルで散布図から回帰分析へ
• 14:30-16:00
統計サイトと検定
– ネットを利用した統計分析（検定を試す）
About 研修講師
• 田中潔（たなかきよし）
–
–
–
–
–
–
–
–
–
略歴：岡山大、九州大修了後岡山商大へ勤務。教授
岡山県を中心に看護研修を30年近く
主な科目：ネットワークシステム演習、社会調査実践他
連絡先岡山商科大学〒700-8601（専用番号で届く）
[email protected] （ｅメール、推奨）
http://www.nahaha.org (Web)
検索エンジン「岡山商大田中潔」で検索
大学電話 086-252-0642
大学FAX 086-255-6947
After 研修後アポイントメント
• 質問・相談はeメール[email protected]
が最適。メールなら返事確実。その他電話・ＦＡＸは
086-284-7726（自宅）でも可能。
• 相談の「三種の神器」（あると便利、なくても結構）
– 看護研究計画書
– 使用アンケート用紙
– データ入力エクセルファイル
• 遠方の場合メールだけで指導する場合もある（PC
用メールがあるとファイルのやり取りが便利。連絡
なら携帯メールでも可能）
• 看護研究やデータ分析を考える
あなたはなぜデータ分析を迫られるのか？
• 素直なあなたはスタッフから相談を受けます
– アンケートの集計を手伝って→手伝いが中心に
– あなたはエクセルが分かるから分析ね！
– ＰＣができることと統計が分かることを混乱した上司に恵
まれた
• 院内研究が回ってきた
– 予算はあまりない、スタッフの協力にたよる
• 学外･論文投稿が迫ってきた
– 国内や世界標準での点検・確認
その結果
• 断ることは許されない
• 自分は統計を知らない→習っていないものがわか
るものか
• 私は理屈っぽく考えるのがイヤ！
• 私は数学がいやで看護へ来たのに
• 看護に統計はいらないと思う
• 調査では患者ひとり一人は援助できない
• パソコンに興味はあるのだが難しそう
•
統計ギライがこの世にまたひとり
看護研究に問われる量か質か
• 量的研究（学部卒レベル）
– 通常のアンケート調査、多くの場合対象者全員からの回
答は無理→標本調査
– 量的研究の主目的は、市場の現況を把握すること
• 質的研究（院レベル）
– インタビュー調査、症例研究、観察など
– 未知なる問題の場合、仮説を発見するために比較的小規
模にて行う
– http://www.geocities.co.jp/Technopolis-Mars/4688/ 南
小樽病院瀬畠さん
データ分析の背景
• 国勢調査や行政調査
– 国・県などの公的調査
– 国勢調査は統計法に基づく(2010年は調査年）
http://www.stat.go.jp/index/seido/houbun2n.htm
– 政府統計ポータルサイト（政府統計の窓口）
– http://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do
• マーケティング（市場調査）・世論調査
– ある目的のため市場を調査する
– アンケート調査
• 実験や臨床研究、業務改善
– 比較的小規模、実験データ
看護研究
はこのあ
たりか
そもそも医療分野で
統計的分析が好まれるわけ
• 統計分析の考え方：「目標達成のために満足のできるもの
であれば良しとする接近法」（ネイマン・ピアソン流）
•
•
•
•
•
•
•
医療で解決すべき課題（目標仮説）
（ここに看護的意味づけが必要）
データで証明する（実現仮説または達成仮説）
つまり、調査や実験の成否判定
（有意になれば良いのではありません。
有意にならないことが大事なときもあります）
仮説設計、データ収集、集計、統計分析の各作業
「統計」のことば始め
• 「高き屋にのぼりて見れば煙けぶり立つ民の
かまどはにぎはひにけり」（新古今和歌集、
仁徳天皇）帝王の学問
• 最も古いのはBC3800年代バビロン王朝で行
われ、約BC3000年エジプトや中国などで見
られる。
• 大化の改新（645年）によって班田収授の法。
• 1920（大正９）年10月１日を期して、第１回
「国勢調査」。
統計＝ｓｔａｔ(istics)
•
近代統計学の父ケトレー(コペルニクスに影響）
• 英語で統計または統計学＝ statistics。
• 語源はラテン語で「状態」を意味するstatisticum 。
• イタリア語で「国家」を意味するようになり、国家の人力、財
力等といった国勢データを比較検討する学問。
• さらに費用対効果から、必要最低限度の数を調査して、そ
の場合の精度が、「目標達成のために満足のできるもので
あれば良しとする接近法」が考案される。⇒現代の「統計
学」の基本原理
• 推測統計学(stochastics)。
看護研究における統計の立場
２つの視点
• １つめ：国家統計の視点
– 自分が「王」となり、対象集団の状況を広く知る、
報告する立場、疫学調査など
– 母集団よりも標本集団をまとめること
• ２つめ：推測統計的な視点
– 自分の得た標本から母集団を推し量りたい
– 自分は「標本」という実験結果を元に、真の集団
（母集団）にたどり着きたい。真の看護や看護方
式に近づきたい
データ分析の流れ
• データの正しい収集法（集める）
– 計画的な抽出や正しい質問の作り方
• データの集計方法（サンプル・標本集団の分析）
– 基礎統計量とクロス表、グラフ化
• データの分析方法（背景の母集団を意識）
– 検定、回帰・相関、因子分析など多変量解析法
• 統計分析、データ分析、データ科学、
• データマイニングなど呼び方はさまざま
母集団と標本
• 母集団：未知、標本：既知
• 仮説の下で考える理想的な集団。標本はこ
の母集団から無作為に取り出された部分集
団
母集団：未知
無作為
抽出
標本・サンプル
既知：データ分析の対象
未知または既知
標本は分析できる
大まかな統計分析の流れ４段階
•
•
•
•
•
母集団（未知であり不可視）
標本（可視）
データの収集
アンケート調査
無作為抽出
•
•
•
集計
データ集計
推定・検定
統計解析
平均値やクロス表
基礎統計量や集計表
ｔ検定やカイ２乗検定結果（有意かどうか）
•
•
神の領域
第一段階
第二段階
人間界
第三段階
第四段階
データ分析の道のり
• 母集団を想定する（想像する）、仮説を決める
– 見えないけれど、どんな現象集団
• 標本集団を収集する（実験や調査）
– 精密でなく正確な回答か？答えやすい用紙？、回収率
• 分析に合うよう素データの加工や集計
– 度数表、基礎等計量、グラフ、クロス表など
– 仮説をうらづけるグラフ？
• 統計手法で分析する
– 種々の統計解析法、仮説を説明できた？
情報処理と看護研究のハザマ
• 看護研究
– 看護の中で、課題を立証し客観的結論を得る
•
•
•
•
エビデンス
明白なこと、証拠や根拠
心がけなければならない先人のコトワザ
情報面ＧＩＧＯ（ぎーご）
– Garbege Iｎ Garbege Out
– ゴミからはゴミしか生まれない
• 統計学
群盲評象（ぐんもうひょうぞう）
– 尻尾を握って象がわかったつもりになっていませんか？
統計解析法の目的
• ○標本が集まった時の「統計」＝集計
• データの姿を知る統計
• 記述統計：平均、標準偏差、分散、グラフ化
• ○集計後の「統計」＝統計的分析
• 原因や要因、あるいは影響や判定など決定付ける
• 推定・推測：標本から母集団値を求める
– 一般には標本値±誤差を決める
• 予測：時系列データから将来を推測
– 方程式を作成する
• 検定・テスト：比較し判定する、○×効果
• 多変量分析群
– ３つ以上の項目からなるデータを分析する
主な多変量解析手法
• 予測：
– 回帰分析、数量化１・２類、判別分析
• 指標：
– 回帰分析、数量化１～３類、主成分分析、因子分析
• 視覚化：
– グラフ解析、数量化３・４類、主成分分析
• 分類：
– クラスター分析
• 潜在構造：
– 因子分析、共分散構造分析
統計ソフトについて
• 記述統計、グラフなどはエクセルで十分
• 検定、多変量分析となると専用ソフトが望ましい
• http://aoki2.si.gunma-u.ac.jp/ 群馬大青木先生のサイトで
間に合うことも多い。いつまで続くかは不明
• 市販ソフトとしては
• ＳＰＳＳ高い、施設向き、論文投稿には望ましい。世界的に
権威あるソフト新規18万円論文投稿向け
– ライバル会社にSASがある。安価版としてJUMPも有名
• エクセル統計 4万円、エクセルのアドイン、おおむね使える
が細かな使い勝手はあまり良くない
• フリーソフト（無料）Ｒ良くできているが上級者でなければ
使いにくい！研究者向け
分析Webサイトで解いてみる
• 「U検定サイト」で検索、その中で
• 「こんにちは統計学」で計算ページがあった
• 計算させてみる
• 使えそうな計算サイト
• 「こんにちは統計学」サイトすがやみつる
• 「おしゃべりな部屋」サイト青木繁伸
一番の悩み
• 私のデータに一番ふさわしい分析方法は
何？
• 確実な答え（必須事項）
• ⇒記述統計平均、グラフ記述は少なくても
• その後の分析方法や分析深度
• 千差万別、仮説やデータの質や形式により
個々に変わる、試行錯誤
ステップ１
• 研究や分析のための
• データ準備留意点
平均が意味ある場合、ない場合
データの「測定尺度」
• 比率や間隔尺度
– 身長160,170,180 平均は170cm ◎
• 順序尺度
– 1.嫌い 2.まあまあ 3.好きどれか１つ選ぶ
– 回答 2,1,1,3,3,3,2 合計15 平均2.1 △
• 名義尺度
– 1.品数 2.一ヶ所で買える 3.駐車場 4.その他
– この場合平均は求められません→集計へ ×
エクセル使いなら必需品A1
行側（ｷﾞｮｳｿｸ）と列側（ﾚﾂｿｸ）
•
•
•
→列側（項目、変数、変量）
行側↓
（ケース）
入力したデータ
データ収集の時、気づかうこと
有効数字について
• 計算結果を小数点何桁まで取るべきか？
• 答え
• 測定値で影響されます。
– 身長160ｃｍは「センチ単位」で測定されました。
– 160.1かも160.4かも知れません。
– 有効数字小数点以下0桁でした。
• そこで平均値など計算結果の表示は、ひと桁多くし
小数点以下１桁（２桁目を四捨五入して）で表示しま
しょう
• 教訓
• 計算結果の有効数字は測定値よりも１桁多く
収集データの欠席扱いとは
欠測値について
• 計測されなかった、計測できなかった値・回答
– 欠測値という
• 表ソフトで欠測値には0ゼロを入力しない
– エクセルの場合何も入力しない
– セル値の削除はdeleteキーで
– 0は計測値として計算してしまいます
• 99や0など特定値を入れることは
– 一部の統計ソフトでは除外可能だが、エクセルと
の互換性を考えると入力しない方が無難でしょう
ステップ２
• データが用意できたら、まず
• １項目ごとにデータの姿をつかむ
• 記述統計（基礎統計、度数・クロス集計、グラ
フ表示）
• エクセルで十分可能、個人でも可能
基礎統計について
（比率や間隔尺度の場合）
• 基礎、キソと軽んじてはいけません。
• この基礎統計からデータの概要を思い浮か
べることが、解明の第一歩
• 基礎統計量算出やｸﾞﾗﾌ書きは地味ですが、
• 多くの発表はこれで決まります。
• 項目ずつ（１変数ごと）の統計分析です
最初のデータ分析
• 記述または基礎統計量
とは
–
–
–
–
–
平均値
標準偏差
最大、最小値
中央値
度数集計表
統計を始めるとやたら正規分布が
でてくるのですが
• 自然界の多くの現象は、数多く収集する（度数グラフに集計
する）と正規分布に近くなることが知られています。
• ネイマン流大数の法則。
• 現象には正規分布しないものも多くありますが、合計点など
加えると、極限では正規分布に帰着します。
• 中心極限定理。
• 「標本数を可能な限り集めなさい」は２つの意味で、正当なの
です。
• 統計には２つの立場があります。
– １）数多く集めたり、加工して正規性に持ち込む派
– ２）正規性を仮定しない分析方法をあみだす派
• 2）がよさそうですが、実は性能は１）を超えられません。分布
系と分析力はトレードオフの関係に。
エクセルで
基礎統計量を求められる
• 関数をセルに挿入で求める
• ○○値を求める関数(名前知らなくても利用できる）
–
–
–
–
–
平均
標準偏差
中央値
最大値
最小値
＝ＡＶＥＲＡＧＥ（範囲指定）
＝ＳＴＤＥＶ（範囲）
＝ＭＥＤＩＡＮ（範囲）
＝ＭＡＸ（範囲）
＝ＭＩＮ（範囲）
• 表の度数を求める関数
– 該当数（通常）＝COUNT(範囲）または
– 条件付該当数＝ＣＯＵＮＴＩＦ（範囲、条件）
名義や順序尺度の場合、基礎統計量
はあまり意味を持ちません。
集計しましょう
• 度数分布表を作りましょう（１つの項目ずつ）
– これを棒グラフ（ヒストグラム）に描きましょう
– これである１項目の姿が見えてきます
– （全ての測定尺度で可能）
• クロス表（分割表）にまとめましょう（２つの項目ごと）
– 特に２次元クロス表（分割表）は大事
– ２つの項目を同時に表にまとめます
– （特に、順序や名義尺度でも作れます）
２つの項目の
基礎集計
投げ１のヒストグラム
素データから度数集計してみたら
投げ１と投げ２の２群を書き分ける
12
素データ→度数表→
8
２群別のグラフ
投１度数
投2度数
4
0
20
25
30
35
40
45
50
投げ２
投げ１
グラフは統計分析の設計図
エクセルはグラフ化の良いツール
•
•
•
•
•
最初のうちは、グラフ化することがとても大事
図中には、実は分析結果が見えています。
１項目の現象には
棒グラフか折れ線グラフがしばしば。
大切なことは、条件によりグラフを書き分けて
いますか？
• 条件とは、女性・男性、学級Ａ、Ｂ、Ｃ別など
ステップ３（比率尺度の場合）
• １つずつ、項目ごとの把握が終ったら
– 基礎統計の算出
– 集計表＝度数表やクロス表にまとめる
– 項目ごとにグラフで表現
• エクセルで十分可能、個人でも可能
• 次は２項目ごとの視覚化と分析
– 回帰分析で関係をつかむ
「散布図」は２項目の関係図
（エクセルで分析可能）
40
投げ２
30
20
10
10
20
30
投げ１
40
相関という考え方
• 相関：２つの項目間の直線関係性を知りたい
• ２つの項目は「比例」するか「反比例」するか
• 比例は正の比例と負の比例（×反比例ではない）
– 正の比例・・・片方が２倍→もう一方も２倍
– 負の比例・・・片方２倍→もう一方-２倍
• 相関は
– 正相関＝片方が増加→もう片方も増加
– 負相関＝片方が増加→もう片方は減少
（正）相関を目で見る
直線性高い
直線性低い
（単）回帰分析
•
•
•
•
散布図を描くとＸ軸とＹ軸の関係を目視
Ｙ＝ａＸ＋ｂという直線関係を考える
ＸとＹはデータとして測定される
傾きａとｂを決定すれば、ＸとＹの関係が決まる
係数ａとｂを求めれば
• ２つの項目ＸからＹを推測できる
• 予測：測定されていないＸについて、Ｙの予測値を
Ｙ←ａＸ＋ｂで予測可能
素データ（自然現象）が点群として
得られる
この点群を１本の直線で表現した
い（人工的な数式）
方程式： XとYの関係を示す
この現象は直線で代用可能
自然現象がモデル化できたことに
相関の程度と直線での代用程度が知りたい
• 相関係数R
-1～0～1で示す値相関度を示す
• 重相関係数R２（決定係数）
＝R×R＝R２
– 点データを直線のみで代用した場合の説明程度
• 仮にR=0.7なら、R2＝0.7×0.7＝49％（直線の説明度）
• この直線１本で全ての点（データ）の約半分の情報が説明できている
• R=0.9ならなんと１本の直線で約80％の情報を示す
もしもさっきの２つの図で仮に
相関係数Rが0.85すると
R2=72％
相関係数Rが0.5とすると
R2＝25％
と判明し、左図の方がよりはっきりと直線関係にある
回帰分析（相関分析）の３ポイント
• 目標：得られた点群を１本の直線で代用したい
• ① 相関を視覚（散布図）で把握する⇒直線の方程式を求めた
• ② 相関係数はその点（データ）の直線の程度を示す
• 相関係数が＋なら正相関、－なら負相関
• 相関係数は記号ではRかrで表記
• R2やR^2は相関係数Rを２乗したもの
• R2は重相関係数（決定係数）とも呼ばれる
• ③ R2は点（データ）を直線で代用した場合の情報割合
– R＝√R2を計算し相関係数に直すとヨロシ
回帰分析（相関分析）の手順
１．関係を知りたい２つの項目（列）を選ぶ
２．この２項目で散布図を描く
３．この図を元に直線回帰を行う
すると
グラフ内には中心の直線＝回帰直線が引かれ
その方程式と相関係数の２乗R2＝重相関係数
が表示される
これら一連の分析を単回帰分析と呼ぶ
単回帰分析のポイント
•
•
•
•
•
•
直線の程度（相関度）はどのくらいか？
傾きａとｂを求める
直線の相関性を示す指標相関係数Ｒ
またＲの２乗のことを決定係数・重相関係数という
－１＜Ｒ＜＋１
経験的にＲ＞0.7で正相関あり、Ｒ＜－0.7で負相関
あり、-0.7＜Ｒ＜0.7で無・弱相関
• 決定係数なら 0＜Ｒ＜0.5で無・弱相関
• 相関係数の２乗＝決定係数・重相関係数＞0
相関係数Rと二乗したR2
• Rまたはｒは相関係数と呼ぶ
• R2＝R×R＝R２重相関係数や決定係数とも
呼ばれる
• R=0.7相関ありこの時
• R２＝0.7×0.7＝0.5 を示す
• 解釈 R2=0.5とは
– 求めた方程式ｙ＝ａｘ＋ｂで、データ全体の情報の
うちＲ２（例：0.5以上）をこの式で表わしている
– ＲやＲ２は影響の程度をみる目安
例：ボール投げ
投げ１と投げ２の回帰分析
左表の投げ１と投げ２の関連性を考える
同じ人の２回の結果だから、きっと関連
性は強いだろう
散布図を書いて目で見てみる
Excelの回帰分析を使ってみる
（散布図の近似曲線の追加）
エクセルでの求め方例：散布図からエクセルで
グラフ点を右クリック→近似曲線の追加メニュー
散布図→単回帰分析の完成
• 回帰直線ｙ＝ｘ相関係数Ｒの2乗＝0.19
• この現象は直線ｙ＝ｘで、全体の19％の情報を表現できる
40
y=x
R2 = 0.1859
投げ２
30
20
10
10
20
30
投げ１
40
データ分析の道具立て
更なる分析にはエクセル以上
• 記述統計、グラフなどはエクセルで十分
• 検定、多変量分析となると専用ソフトが望ましい
• 市販ソフトとしては
• ＳＰＳＳ高い、施設向き、論文投稿には望ましい。
世界的権威ソフト新規18万円
– ライバル会社にSASがある。安価版としてJUMPも有名
• エクセル統計 4万円、エクセルのアドイン、おおむ
ね使えるが細かな使い勝手はあまり良くない
• フリーソフト（無料）Ｒ良くできているが上級者で
なければ使いにくい！研究者向け
なぜ「Office(excel）」を？
• Windowsマシンが多く導入
• Windowsマシンには「Officeファミリ」のうちWordと
Excelが大体標準装備
– Wordは施設企画書類づくり、発表用配布資料づくりに
– Excelは素データ入力、グラフ化、基礎統計など個人向け
基本データ分析可能
– パワーポイントは発表原稿づくりに（別売）
• Officeファミリーは相互に「コピー＆ペースト」で対象
物の継承が可能
最近ではインターネットのサイトにも
良いものが色々
• 検索エンジン群馬青木 → おしゃべりな部屋
• 青木サイトの統計処理の多くには「Java技術」が使
われている
• Javaはサイトで計算処理を行うための仕組みであり
PC購入後各自で導入するもの
□
• 施設のPCではセキュリティ保護の観点からJavaを
導入していないものもあるので、青木サイトが利用
できない場合がある
• 施設PCで利用できない場合、他の統計パッケージ
やJava導入した個人PCを利用する
• 最近ではスマートフォンでも利用可能
１項目ずつグループ（群）間を比べる
• ２グループの取り扱い
• Ｔ検定や分散分析（比率尺度）
– ２群の平均値に関するもの
• クロス表とカイ２乗検定（名義や順序尺度）
– 度数に関するもの
• ある１項目について
• ２グループ（群）以上の差異を検討する
• グループ間または群間分析、層別分析
もしもPCでこんなエラーが出たら
あなたのPCのJAVA（Oracle社)という仕
組みが古いなどの原因で、警告が出た
ものです。「いいえ」を選んでうまく動作
すればいいですね。
看護に代表的な検定を分析体験
• ｔ検定（比率尺度で使用）
– ある測定データの平均値がある値かどうか
– 仮説：測定データの平均値＝46.7
– ２群の平均は等しいとみなせるか
– 仮説：群１の平均＝群２の平均
• カイ２乗検定（名義・順序尺度で使用）
• クロス表に傾向や関連性があるか
– 仮説：このクロス表の度数は同じか
統計的検定はどんなもの
• 目標：ある仮説（○＝△、両者は同じと見て
良いか）を判定すること
– 例：この実験結果＝160.0
– 例：群１の平均＝群２の平均
• 判定は採択（有意でない・Yes)、または棄却
（有意・No)の２分法
• 採択とは「この仮説を積極的に否定しない」
– （厳密には仮説を認めたくないがやむを得ない）
• 棄却とは「この仮説を積極的に否定できる」
検定の計算結果ではP値を見る
検定に見る計算と判定
•
•
•
•
•
•
•
•
•
計算：統計ソフトなどを使用する
判定：出てくる結果の有意確率か有意水準の値により判定
有意水準「P値」＞0.05 有意水準5％以上で採択
5％以下ならば棄却（有意、SIG.)←差あり
0.05～0.01 5％有意＊
星１つ
0.01～0.005 1％有意＊＊星２つ
0.005より小 0.5％有意＊＊＊星３つ
Ｐ値
0.05（5％）を下回れば「有意」（No)＝仮説を否定する結論
２つの平均値を比べる
２群の平均値差の検定（ｔ検定）
• 群平均ＳＤＮ
• Ａ 3.2 3.8 5
• Ｂ 5.2 8.2 5
• 等分散性の検定
• 有意確率2.3％（有意）
• ２群のばらつきは等しくない
• 平均値差のｔ検定
• 等分散仮定する 6.4％
• 等分散仮定せず 6.4％
• いずれも平均値差は有意でない
• この2群で平均値3.2と
5.2は同程度と見る
か？否か？
• ２群のばらつきは
– 等しくないと判定
• ばらつき等しくない仮定
の下で、「採択」
– ２つの平均値が等しいこ
とを否定せず（つまり同
程度）
二群の平均値差の検定だけでも
入力形式や条件で色々
• 標準的なサイト２群の個々の値を入力するタイプ。
ｔ検定とノンパラ（マンホットニ）検定が選択できる。マ
ンホイットニ検定とウイルコクソン順位和とは同じも
の
• ２群には対応がない場合
• http://aoki2.si.gunmau.ac.jp/Java/TwoSamples/bin/TwoSamples.html
• 青木おしゃべりな部屋、Ｊａｖａ、独立２標本の検定の
順に探す
PC画面の例
応用１平均などで独立２標本検定
• http://aoki2.si.gunma-u.ac.jp/JavaScript/ttest.html
• 素データがなく、平均、標準偏差、ケース数
のみがある場合のサイト
• 対応なしの場合、ｔ検定
• おしゃべりな部屋、Javascript、26番２群の平
均値差の検定を参照
PC画面の例
応用２「対応のある」２群の検定
• 対応のある場合：１人について前後を測定したな
ど。薬効や効果があったかはっきり検定する。
• http://aoki2.si.gunmau.ac.jp/Java/RelatedTwoSamples/bin/RelatedTw
oSamples.html
• 場所はおしゃべりな部屋、Java,対応のある２標本
の検定を探す
• 伝統的なｔ検定の他、ウィルコクソン符号付順位和
検定、符号検定にも対応する
対応のあるデータ、ないデータ
• 対応ありと考えられる場合
• 同じ人やグループを追跡して測定
•
•
•
１回２回３回・・・
Aさん 1.0 1.5 2.0・・・
Bさん 1.2 1.7 2.2・・・
• 対応ないと考えられる場合
• 毎回グループの構成者を取り替えて測定
•
岡山東京大阪福岡・・・
• 人口
• 生産額
• 学生数
二群の平均値差の検定演習問題
•
•
•
•
いずれもｔ検定（対応なし）として平均値差を検定せよ。青木サイトを使用する。
問１群平均ＳＤＮ
問２
Ａ 3.2 3.8 5
Ｂ 5.2 8.2 5
•
問３ある地区で行った40 歳
• 以上 65 歳未満の住民検診
に来所した男子 42 名，女子
• 63 名の血色素量について
• の検査成績は，男子では平
• 均値 15.2 g/dl，不偏分散
• 1.1，女子では平均値 12.7
• g/dl，不偏分散 3.2 であった。
• 男女の平均値に差はあるか，
応用３名義尺度でも使える検定
クロス表の独立性の検定
•
•
•
•
•
•
通称、カイ２乗検定
名義尺度では平均値が意味を持たない
そこで表に集計する。
一次元の表こそ度数分布表
２次元以上をクロス集計表
ではこの表での仮説とは
– 「クロス表のマス目（セル）は同じ割合かどうか」
– 「クロス表に偏りがあるのかないのか」
（２×２）クロス表とはこんなもの
• 行と列で作表する
• 上の図では、左上50、右下55この程度の違いで、この表に
は差があるか、否か（有意性ありかなし？）
• a、ｂ、ｃ、ｄに顕著な違いがあるか？
• 行側：原因→列側：結果
• 例：対応なし投薬有無と結果や運動有無×効果
•
対応あり１回目と２回目の状況
青木サイトで解く
Ｒ×Ｃクロス表のカイ２乗検定
•
•
•
•
•
基本は２×２（検討しやすい）
４つのセル値をサイトへ入力
計算結果Ｐ値で判断する
Ｐ＞0.05 採択
0.01＜Ｐ＜0.05 5％有意他１％有意
0.5％有意により＊、＊＊、＊＊＊
• http://aoki2.si.gunmau.ac.jp/JavaScript/FisherExactTest.html
再掲：判定方法 P値と検定結果
• 前ページ解答： P値＝0.31→採択（差なし）
• クロス表から有意水準またはP値を算出
• 判定方法その１有意水準の値が
– 有意水準値＝P値が
– 0.05～0.01 5％有意＊星１つ
– 0.01～0.005 1％有意＊＊星２つ
– 0.005より小 0.5％有意＊＊＊
星３つ
クロス表独立性の検定
解答はP値を示す（有意でない＝採択）
• 問１ 0.83、２ 0.76、３ 0.31、４ 0.60 ５ 0.01 ６ 0.00
•
採択
採択
採択
採択
＊＊
＊＊＊
医療分野で最近
ノンパラメトリック検定群が・・・
• マンホイットニのU検定、ウイルコクソン検定、
ライアンの多重比較などをよく聞く・論文で見
かける
• 検索エンジンで「こんにちは統計学」で検索
– 「おしゃべりな部屋」でも可能
• 必要な手法を選び計算可能 P値求める
• P<0.05で棄却、P>0.05で採択は今まで通り
研修のまとめ
•
•
•
•
•
•
•
□看護研究とデータ分析の関係を理解する
□データ入力での決まりごと
□ １項目データ分析：基礎統計量とグラフ
□プラットホームはＯｆｆｉｃｅ（Ｅｘｃｅｌ）
□ ２項目の関係：散布図、相関係数、重相関係数
□グループ（群）間比較：統計的検定
□詳細な分析は統計ソフトやWeb利用
– おしゃべりな部屋やこんにちは統計学

2014/8/23

Transcript 2014/8/23

Directory