物理モデルか、統計モデルか?

Download Report

Transcript 物理モデルか、統計モデルか?

生物環境物理学特論
Environmental Biophysics
小杉緑子
第3回:物理モデルか、統計モデルか?
生物環境物理学と統計解析

自然現象は際限なく複雑であるが、これを目的に応じて
可能な限り単純化(モデル化)し理解するというやり方が、
生物環境物理学の用いる技法である。その実現は、関
連する原理の適切な理解にかかっている。
「生物環境物理学」(森北出版、2003)より要約
自然現象は非常に複雑である。そのため、これを理解記述するのにま
ず統計的手法をもって重要因子を抽出しようとするのが、統計解析であり、
生態学の王道的解析方法である。しかし一方で、生物環境物理学では決
して取られない手法でもある。
特に土壌圏のフラックスについては現象とそれを統べる法則が十分統
合整理されていないために、統計解析を用いた研究が主流である。今回
は、統計的手法を取る解析、取らない解析の選択について、最新論文の
例を踏まえて考える。
もっとも基本的な統計解析

相関分析:環境と生物体との相互作用を説明するための、
最も簡単な手法(これも一種のモデル、いわゆる「一般線
形モデル」である)
相関分析と回帰分析の意味の違い
相関分析は、xとyの相互関係の強さをみるものである。相関係数rは、xとyがど
の程度直線的な関係にあるかを数値化したものである。
相関係数の強さと表現方法 -1≦ r ≦1
r=0 相関なしまったく相関はみられなかった。
0<| r |≦0.2 ほとんど相関なし、ほとんど相関がみられなかった。
0.2<| r |≦0.4 低い相関あり、低い正(負)の相関が認められた。
0.4<| r |≦0.7 相関あり、正(負)の相関が認められた。
0.7<| r |<1.0 高い相関あり、高い正(負)の相関が認められた。
1.0 または-1.0 完全な相関完全な正(負)の相関が認められた。
回帰分析は、xとyにどのような関係があるかをみるもので、xからyを予測するた
めのものである。直線回帰における回帰係数とは、xとyが最もよく当てはまる直
線関係をきたす場合の傾きである。また直線だけでなくいろんな関数を用いた回
帰分析がある。
直線回帰においては、相関分析と回帰分析のp値(有意確率)は同じである。
相関分析をつかった解析の例
Kosugi et al, 2007. Spatial and temporal variation in soil respiration in a Southeast Asian tropical
rainforest. Agric Forest Met 147, 35-47. 土壌呼吸と土壌水分の間の相関分析
エクセルでのp値, r値の求め方

相関係数r値:=PEARSON(配列1のデータ範囲,配列2のデータ範囲)
またはCORREL (配列1のデータ範囲,配列2のデータ範
囲)
n
r 
 x
i

i 1
 x
n
i 1


 x yi  y
i
 x
  y
2
n
i
 y

2
i 1
有意確率p値:=TDIST(t,n-2,2)
r n2
t 
2
1 r
通常有意水準は、「n.s.」「p<.05」「p<.01」「p<.001」の4種類で表す。
相関分析・回帰分析の問題点
「擬似相関(見かけの相関)」の問題
背後にひそむ制御変数を知るには、変数間の関係がどの
ようなメカニズム的根拠に基づいているかという、統計学
とは別の視点や知識が絶対に必要である。
 相関係数が高く&有意であっても、回帰式が有効とは限
らない
統計解析の前に、まず散布図上での解析者の判断が必要。

http://www.hs.hirosaki-u.ac.jp/~pteiki/research/stat/qa/qacor.htmlより転写
自然界の現象を扱う際に有効で、
よく用いられる統計解析



多変量解析
参考書:便利な計算ガイドがCD-ROM付きのものも含
め、世の中にいっぱい出ている。
解析ソフト:SPSS(PASW Statistic)とか、SASとか。
Excelでもがんばればできる。
地球統計学(Geostatistics)解析
参考書:「地球統計学」(地球統計学研究委員会/訳
編、青木謙治/監訳、森北出版)とか。
解析ソフト:GS+
ベイズ統計学とマルコフ連鎖モンテカルロ(MCMC)法
おすすめ:久保拓弥さん(北海道大学大学院地球環境
科学研究院助教 )のサイト「生態学のデータ解析」
http://hosho.ees.hokudai.ac.jp/~kubo/ce/FrontPage.html
多変量解析とは?
互いに関係のある多変量(他種類の特性値)のデータが持つ特徴
を要約し,かつ,目的に応じて総合するための手法
基準変数
(目 的 変 数 )
量的
質的
数量化分析Ⅰ類
量的
予 測 式 (関 係 式 )の 発 見
量の推定
重回帰分析
正準相関分析
質的
標本の分類
質の推定
クラスター分 析 クラスター分 析
判別分析
数量化分析Ⅱ類
あり
なし
多変量解析の目的
説明変数
多 変 量 の 統 合 整 理 (減 ら す )
主成分分析
変量の分類
因子分析
代表変量の発見
数 量 化 分 析 Ⅲ ,Ⅳ 類
多変量解析の例(主成分分析)
高村・竹門2005深泥池の水質分布に及ぼす流域からの人為的影響について、陸水学雑誌66
地球統計学Geostatisticsとは?

自然界における様々な現象の空間的,時間的な関連性
をモデル化して推定を行う統計学の一分野
データが距離と方向に対して、
どのような関係(空間相関)を持つかを評価する
Sill
距離 h 離れたデータ組毎の相関を
セミバリアンスγ(h)で表現
γ(h) =
Semivariogram
N (h)
1
∑ [z(x ) - z(x
2 N (h)
i
i
+ h )]
2
i =1
Nugget
N(h):距離 h 離れたペアの数
z(xi):地点 xi の観測値
z(xi+h):地点 xi+h の観測値
Range
Range:空間依存(観測点間が互いに関連)している距離
0
空間依存
Range
空間的に独立
* Rangeを超える距離で観測を行えば効率のよい観測
* Rangeの比較で,様々なproperty間の関係を把握
(ここでは土壌呼吸と土壌水分に着目)
h
地球統計学を使った解析の例
Sep-02 (過渡期)
Range: 24.7 m
Range: 28.1 m
(左図:土壌呼吸,右図:土壌水分)
Kosugi et al, 2007. Spatial and temporal variation in soil respiration in a Southeast Asian tropical
rainforest. Agric Forest Met 147, 35-47.乾季ー雨季への過渡期に土壌呼吸と土壌水分の
Rangeが似通っており、土壌呼吸の空間変動が土壌水分の影響を受けていることを示唆。
ベイズ統計学とは?


ベイズ統計学は推測の対象となる未知の変数(パラメー
タ)を確率変数として扱い,データが与えられた下での条
件付確率分布(事後分布)を使ってパラメータの分析を行
う統計学。
ベイズ統計学ではコンピュータによる数値計算が重要な
役割を果たす。特に近年ではマルコフ連鎖モンテカルロ
(MCMC) 法によって統計分析に必要な各種の計算を行
うようになってきている。
お勧め★:久保拓弥さんの生態学会2010自由集会資料
http://hosho.ees.hokudai.ac.jp/~kubo/ce/EcoSj2010.html
物理モデルor統計モデル?
物理モデルの目的
現象の理論的な分析や解釈や予測
統計モデルの目的
限られたデータからその現象を生起させるメカニズムや構造を分析・推
測すること
統計モデルと物理モデルの融合
スケール間の統合を考えるときに行き着く考え。例えば気孔開度分布
や土壌空隙分布などを表現するのに統計的な手法は不可欠である。
我々の周辺で-
 統計モデルが主流の分野:生態学、土壌圏生物過程を扱う分野
 物理モデルが主流の分野:水文学、土壌物理学、生物環境物理学、
気象学
 物理モデル・統計モデルのほか生化学モデルなど様々な概念が混在
して使われる分野:生理生態学、植物生理学などの植物圏過程を扱
う分野
物理モデルor統計モデル?降雨流出過程
物理モデル:降雨流出解析の主流。合理
式、タンクモデル、貯留関数法などの概念
モデルや、より狭義の物理モデルとしてキ
ネマティックウェーブ法や1D2D2D飽和不
飽和浸透モデルなどがある。
←Liang et al., 2009, A three-dimensional model
of the effect of stemflow on soil water dynamics
around a tree on a hillslope
樹幹流が樹木根系を伝うことにより、水が選択的
に土壌深部へ供給される様子を、3D飽和不飽和
浸透計算により説明した。(実測値は上賀茂試験
地での観測結果)
物理モデルor統計モデル?降雨流出過程
統計モデル:あまり使わない。ただし、よく使われている「流況解析」などは、統計解
析よりか? 「流況解析」には時系列の概念がなく、応答予測はできない。
谷先生のゼミ資料より
物理モデルor統計モデル?蒸発散過程
物理モデル:蒸発散過程は必ず拡散方程式やエネルギー収支の概念(=物理モデ
ル)を基本として解析される。
Kosugi et al, 2006. Impact of leaf physiology on gas exchange in a Japanese evergreen broadleaved forest. Agric Forest Met 139, 182-199.
多層モデルをつかって3年分の常緑広葉樹林の蒸発散を再現。
物理モデルor統計モデル?蒸発散過程
統計モデル:蒸発散過程の解析に統計的概念を用いる余地はある?
1500
-1
E (mm yr )
1400
E, Method 1'
E, Method 1
E, Method 2
E, Method 3
1300
1200
1100
1000
4200
4400
4600
4800
1600
1800
2000
2200
2400
-1
Rn-G-S (MJInfluence
m--2 yr-1)of inter-annual climate
Rainfall
(mm yron
)
Kosugi et al, under submission,
variability
evapotranspiration and canopy CO2 exchange of a tropical rainforest at Pasoh in Peninsular
Malaysia J. For. Res. 年間蒸発散量と有効放射や降雨量との関係。ここで「相関分析」をやって
しまうのがリモセン分野の常套手段だが、それでいいのか? 刻々の蒸発散量の決定要因に
ついての物理メカニズムがわかっているので、それを元に積み上げて解析するべき。
物理モデルor統計モデル?光合成過程
物理ベースモデル:拡散方
程式に、Farquhar(1980)の光
合成生化学モデルと気孔コン
ダクタンスモデルを結合した
ものが、広く用いられている。
(次週説明)
←Kosugi et al, 2003,
Parameterization of the CO2 and
H2O gas exchange of several
temperate deciduous broad-leaved
trees at the leaf scale considering
seasonal changes. Plant Cell
Environ, 26, 285-301
Farquharモデルを使って実際の
光合成の日変化を再現し、また
季節変動に対するフェノロジの影
響を明らかにした。
物理モデルor統計モデル?光合成過程
統計解析:前項のような解析の出番はなくなったはずだったが-
Ball(1987)モデルの出現とその意味するところ
2000 Kusu
g sw  m
A
Cs
h s  g sw min
h:Relative humidity (%), A:Net assimilation
rate (mmol m-2 s-1), Cs:CO2 concentration
at leaf surface (mmol mol-1),
m,gsmin:Parameters
S to m a ta l C o n d u cta n ce g s w (m o l m -2 s -1 )
―Ball (1987)
0 .3 0
6 /1 ,6 /2 ,9 /2 5 ,9 /2 6 ,1 1 /2 8 ,1 1 /2 9
m = 7 .1 4 , g s w m in = 0 .0 4 8
0 .2 5
0 .2 0
0 .1 5
0 .1 0
0 .0 5
0 .0 0
-0 .0 1
メカニズムがわからなくとも、強い
相関が見られるようなケースでは、
応答モデルが先行し、メカニズムが
あとから探られるようになる。
8 /2 2 ,8 /2 3 (S o il D ro u g h t co n d itio n )
m = 4 .0 4 , g s w m in = 0 .0 2 2
0 .0 0
0 .0 1
0 .0 2
0 .0 3
A h /C s
横軸:Ah/Cs、縦軸:気孔コンダクタンス
傾き:Ballモデルの‘m’
切片:Ballモデルの‘gswmin’
物理モデルor統計モデル?光合成過程
統計解析:未知の領域については有効。葉内コンダクタンスの重要性を世に知らし
めた。
「光合成速度と葉内コンダクタンスの間には高い正の相関がある」
(Epron et al., 1995, Plant, Cell and Environment 18,43-51)
物理モデルor統計モデル?光合成過程
N o rm a liz e d M a xim u m C a rb o xyla tio n R a te
-2
-1
V cm a x2 5 (m m o l m s )
物理モデルと統計モデルの融合:気孔開度の分布というミクロスケールの現象がマ
クロスケールのガス交換に大きな影響を与えることがわかってきた。気孔一つ一つの
開度分布を表現するには統計的な手法が必要。
等圧葉
2 0 0 2 /9 D ip te ro c a rp u s s u b la m e lla tu s
40
2 0 0 3 /3 D ip te ro c a rp u s s u b la m e lla tu s
2 0 0 2 /9 N e o b a la n o c a rp u s h e im ii
2 0 0 3 /3 N e o b a la n o c a rp u s h e im ii
hom ogeneous
←維管束
n o rm a l d is trib u tio n (  = 0 .0 1 )
30
n o rm a l d is trib u tio n (  = 0 .0 9 )
b im o d a l d is trib u tio n
異圧葉
20
←維管束鞘延長部
10
0
0 .0 0
0 .0 5
0 .1 0
0 .1 5
0 .2 0
W h o le le a f c o n d u c ta n c e (m o l m
0 .2 5
-2
0 .3 0
-1
s )
Takanashi et al. Tree Physiol. 2006, vol.26 1565-1578 気孔開度の分布様式が光合成に与える
影響について評価した。気孔開度のような生物要素はある条件の下で確率的な分布を取るこ
とから、統計モデルの導入が不可欠ともいえる。
物理モデルor統計モデル?
土壌圏生物地球化学過程
物理モデル:拡散方程式
があるが、ほぼ無視されて
いる!?
生化学モデルはもうちょっ
と尊重されているが、定性
的な記述にとどまり、定量
化にはあまり成功していな
い。
量依存や簡単な生化学
モデル(温度依存など)を組
み込んだボックス型モデル
が主流。(RothC、Centuryな
どのSOCモデルや、類似す
るボックス型モデルを組み
込んだBiomeBGC、PnETな
どが使われている。)
横沢正幸氏のweb資料「土壌炭素変動の広域評価:Rothamsted Carbon Modelの改良」を転写
物理モデルor統計モデル?
土壌圏生物地球化学過程
統計解析:解析の主流。でもかなり混沌としている。多重回帰をはじめとして、
Geostatisticsやベイズ統計などもよく使われるようになってきているが-。
Itoh et al 2009, Methane flux characteristics in forest soils under an East Asian monsoon climate,
SBB 41 388-395. 森林土壌からのメタンフラックスを温度と土壌水分の多重回帰モデルで説明
物理モデルor統計モデル?まとめ
「物理モデル」or「統計モデル」、目的に応じた適所選択が重要。
「物理モデル」、あるいは物理-生化学、物理-生物地球化学融合モデル
による研究発展の可能性は高い。
さらに、上記モデルと統計モデルの融合モデルによる研究発展の可能性も
高い。
融合モデルの可能性を探るためには、分野特有の作法で満足していては
だめ。先入観をすて、他分野の知見をよく勉強する必要がある。
(例えば-)
ここ15年来植物圏のガス交換研究が飛躍的に発展した最大の立役者は
Farquhar(1980)の生化学モデルだと思われているが、実はそうではなくて、このモデル
を拡散方程式に組み込んでフラックス解析を行ったCollatz et al (1991, AFM)の功績
が非常に大きい。 FarquharモデルはCollatz(1991)を読んだフラックス分野の研究者ら
によって広められ、あっという間に世界のスタンダードとなった。