おまけ

人口寄与危険割合は、リスク比と曝露割合を用いて

曝露割合*(リスク比-1)/(1+曝露割合*(リスク比-1))

と表すことができるので、現在の喫煙率を用いて、肺がんの人口寄与危険割合を算定してみよう。男性喫煙率は36.8%という値が拾えるので、リスク比を4とすると、

(0.368*3)/(1+0.368*3)=0.524

となる。男性肺がん患者の喫煙率は、非肺がん患者の喫煙率を36.8%で代用すると

(Pe1/(1-Pe1))/( 0.368/0.632)=4

から

Pe1=0.7

が得られる

集団寄与危険割合

たとえば、ある病気の原因の候補の介入を無作為化して、二つの集団を用意できたなら、同一の期間観察したとき、その病気になる人の割合の期待値は、原因候補が原因でなければ(変な言い方だけど)互いに等しい。もし、確かに原因候補が原因であれば(変な言い方だけど)、原因候補を与えた集団での病気になる割合の期待値が、原因候補を与えなかった集団における期待値を上回り、その差分は、その原因を与えたために病気になった人の割合の期待値になる。式で書くと

原因なし群の病気の人の割合の期待値 :P0
原因あり群の病気の人の割合の期待値 :P1=R+P0

となり、Rが原因を与えたために病気になった人の割合の期待値になる。Rが0であれば因果関係は無く、Rが正の値であれば、原因候補は原因である(すごく変な言い方だけど)。もし、Rが負の値になれば、逆に原因候補に予防効果があることになる。
原因あり群の病気の人の数の期待値(表現がくどいですが)は、原因あり群の大きさをN1として、

N1*P1=N1*(R+P0)

と書くことができる。N1*P0は、原因が与えられなくても病気になった人の数の期待値、N1*Rは、与えられた原因のせいで病気になった人の数の期待値である。
両集団全体で病気になった人数の期待値は、

N0*P0+N1*(R+P0)=(N0+N1)*P0+N1*R

となる。N0は原因なし群の大きさである。N1*Rは与えられた原因のせいで病気なった人数の期待値であるから、病気になった人のうち、その原因のせいで病気なった人の割合の期待値は、

N1*R /*1/ *2*R/(P0+(N1/(N0+N1))*R)=曝露割合*R/(P0+曝露割合*R)

この分母分子をさらにP0で割ると

曝露割合*(R/P0)/(1+曝露割合*R/P0)

となる。喫煙と肺がんの場合、喫煙によって、3−4倍肺がんにかかりやすく(日本人の場合)なるとされるが、これは、

P1/P0=(P0+R)/P0=1+R/P0

が3-4ということである。仮に4とすると、人口寄与危険割合は

喫煙率*3/(1+喫煙率*3)

となり、たとえば喫煙率が70%であれば、この値は

0.7*3/(1+0.7*3)=0.68

となる。

つまり、人口寄与危険割合は、リスク比と曝露割合を用いて

曝露割合*(リスク比-1)/(1+曝露割合*(リスク比-1))

と表すことができる

当たり前のことだが、もし喫煙が肺がんの原因であれば、肺がんの患者の集団と、そうでない集団を比較したら、もちろん肺がん患者集団では、喫煙歴がある人の割合が多くなる。喫煙歴有無のオッズ、つまり曝露割合のオッズ、の比は、まれな疾患の場合、統計のマジックで、リスク比の近似値になる。これを用いると、肺がん患者集団で、喫煙歴がある人の割合はどれくらいになるかの見当がつけられる。ぞれぞれの集団における喫煙歴のオッズは

肺がん患者集団 :喫煙歴あり率 Pe1 オッズPe1/(1-Pe1)
そうじゃない集団:喫煙歴あり率 Pe0 オッズPe0/(1-Pe0)

だから、オッズ比は

(Pe1/(1-Pe1))/( Pe0/(1-Pe0))

である。Pe0のデータは手元にないので、これを全集団の喫煙率で代用して、0.7とすると

(Pe1/(1-Pe1))/( 0.7/0.3)

となる。リスク比を4とすると、

(Pe1/(1-Pe1))/( 0.7/0.3)=4

から、

Pe1=0.93

が得られる。

なお、肺がんと喫煙で注意すべき点は、よく言われるタイムラグに加えて、喫煙率が曝露の程度を正しく表さないということだ。喫煙量と喫煙期間によって肺がんのリスクは増加するため、たとえば、喫煙率が半分になっても、半分になった喫煙者の喫煙量が増加していたら、喫煙者の肺がんリスクの増加によって、全体では肺がんになる割合は増加するかもしれない。極端な例を示すと、「喫煙率100%、ただし全員月一本」から、「喫煙率10%、それらの者ども日々100本以上」を比較したら、後者のほうが、全体での肺がんになる人の割合は高いだろう。
全人口をみた場合、喫煙者といってもさまざまな曝露量の人々が混在しおり、喫煙率で肺がんの消長を記述できるような単純なことにはならない。喫煙によって、肺がんのリスクが3-4倍になるというのは、非常にざっくりとした平均値である。

*1:N0+N1)*P0+N1*R) となる。 さて、このセンスで、疫学では、人口(訳と概念がこんがらがるが、「集団」とか、「母集団」でもOK)寄与危険割合という指標があり、これは、全人口(いわゆる日本人全体)における全罹患者のうちに、曝露が原因で罹患した人が占める割合の推定値として用いられる。 算出方法は ((全人口の罹患率)-(非曝露群の罹患率))/(全人口の罹患率) であるが、これを順番に追っていくと まず全人口のうち、曝露されている人々の数をN1、曝露されていない人々の人数をN0とすると、全人口の罹患率(の期待値)は、 ((N0+N1)*P0+N1*R)/(N0+N1)=P0+N1*R/(N0+N1) となる。非曝露群の罹患率(の期待値)はP0だから、(全人口の罹患率)-(非曝露群の罹患率)の期待は、 N1*R/(N0+N1) となる。これを全人口の罹患率(の期待値)で割ると (N1*R/(N0+N1

*2:N0+N1)*P0+N1*R)/(N0+N1)= N1*R/((N0+N1)*P0+N1*R) となって、全人口における全罹患者のうちで、曝露が原因で罹患した人が占める割合の(期待値)になる。これが0を超えるということは、曝露によって罹患率が高くなる、つまり、曝露と罹患の間には因果関係があると考える根拠になる。喫煙率などの曝露の割合との関係は、分母と分子を全人口(N0+N1)で割ってみるとわかりやすい (N1/(N0+N1

原因は結果より先にある

前回の補足になるが、因果関係の判断で最も重要なことは、原因は結果より前に生じるため、原因の消長と、結果の消長は同時に観察されず、時間的にずれるということだ。

たとえば、原発事故で懸念されている低線量被曝の影響は、10年、20年先に出てくると言われている。もし、今回の事故によってがんが増加するしても、それは数十年先の事になる。しかし、その頃には、事故による放射線のレベルはとても下がっているだろう。もし、原因は結果より先に生じていることを知らない人がいたら、「放射線は減っているのに、がんが増えている。低線量被曝が、がんの原因ならば、がんは減っていくはずだ、おかしい」、と言うかもしれない。こんなことにならないよう、原因は結果より前に起こっていることをしっかり覚えておこう。

因果関係と無作為化とホメと丸ワク

因果関係というのは、直接観測できるものではなく、物事を理解するための概念であるため、どのような因果関係が興味の対象なのかについてコンセンサスがないと、話がかみ合わない。
たとえば、人が死ぬ原因は生まれたことだとか、生きているから病気なるのだとか、悟り顔で言われたところで、病気を治したいと願っている人とってはうっとうしいだけだし、リンゴが落ちるのは万有引力が原因だと言われても、実を落とすことが、リンゴにとって子孫を増やす上で有利なのか、実が落ちるような能動的な作用がリンゴの中で生じているのか、等に興味を持っている人にとっては、これっぽっちも有益ではない。
また、因果関係は、物事を理解するための概念であるがゆえに、しばしば因果関係の判断を誤る。

因果関係の判断で陥りやすいのは、何といっても前後即因果の誤謬だろう。前後関係は因果関係ではなく、前後関係だけからは因果関係の有無は判断できないのだが、珍しい体験をすると、前後関係だけで因果関係を判断してしまいやすい。
たとえば、長い間医者にかかっているのに、ちっともよくならなかった病気が、ホメオパシーで治療したらよくなった、という体験をしたり、そのような体験を見たり聞いたりすると、ホメオパシー治療が効いて病気が改善したのだと思ってしまう。
その体験は事実かもしれないが、その体験は、ホメオパシーが効いたという証拠にはならないし、ホメオパシー治療をするまでの様子と、ホメオパシー治療してから改善するまでの様子をどれだけ詳細に観察したところで、その観察はホメオパシーが効いたことを証明する力を持たない。ホメオパシーが効いたというためには、もし、ホメオパシーで治療しなかったら、その時病気は改善しなかったということが示されなければならない。なぜなら、ホメオパシーで治療しなくても、その時病気が同じように改善したなら、ホメオパシーが効いたと判断するのは不合理だからだ。

体験談は根拠にならないとよく言われるが、その理由は、体験談とは、ただの前後関係に過ぎず、前後関係だけでは、もしそれをしなかったら同じ結果にならなかったのか?という、因果関係の判断に必須の問いに答えることができないためだ。
(これの変法として、もし、プラセボだったら同様の結果にならなかったのか? という問いが代替医療全般に投げかけられている。もし、プラセボでも同様の結果が出せるなら、その人にとって、その代替医療プラセボ医療を超える価値はない。)

 因果関係を証明するためには、原因候補を与えた場合と、与えない場合の両方で、結果を観察しなければならない。ホメオパシーで治療したら病気が改善し、かつ、ホメオパシーで治療しなくても、その時病気は同じように改善したなら、ホメオパシーと病気の改善には因果関係はない。問題は、個人のレベルではこの二つが観察できないことである。そこで、「瓜二つの」集団に対して、原因候補を与えた場合と、与えない場合の結果(治癒率など)を観察し、異なった結果が得られたならば因果関係があるとする。ここでさらに問題になるのは、「瓜二つの」集団を用意することは不可能であることだ。そこで介入(原因候補を与えるか与えないか)の無作為化によって、因果関係が無いなら結果の期待値が等しくなるようにして、因果関係の有無を統計学的な判断にゆだねるというのが科学的に最も妥当な手続きとされている(二重盲検が最も重要だとする意見をたまにみかけるが、最も重要なのは介入の無作為化である。また、無作為抽出と介入の無作為化を混同している説明もたまにみるが、全然違うので念のため)。

30年?ほど前騒がれた丸山ワクチンでは、この介入の無作為化がおろそかにされていた(以下のリンクの津谷氏の説明参照のこと)。

http://www.npojip.org/jip_semina/semina_no1/pdf/308-312.pdf
 
介入が無作為化されていないならば、統計的に有意な結果となっても、それは因果関係の証拠にはならない。因果関係が無いなら結果の期待値が等しくなる、という前提が崩れているからだ。とはいえ、30年以上前、無作為化の意義が、臨床医や製薬企業に理解されていたとは言いがたく、誰も教えてくれなかった状態には同情する。
現在、無作為化比較試験のためのインフラは十分整っているので、丸山ワクチンの効果を信じる研究者の発奮を期待する。

帰無仮説はナンセンス?

帰無仮説はナンセンス。だから統計的仮説検定は・・・
というような批判を久々に聞いたので。

たとえば、ある健康なヒトの集団をランダムに2つにわけたなら、同一の観察期間中おいて、肺がんに罹る人の割合の期待値は互いに等しい。

一方の集団に喫煙をさせた場合でも、肺がんに罹る人の割合の期待値が等しいなら、喫煙は肺がんの原因ではない。もし、喫煙集団での期待値のほうが大きいなら、その増分は喫煙のせいである。

ポイントは、喫煙によって肺がんになる人はいないなら、ランダムに分けられた2つの集団の一方に喫煙させても、肺がんに罹る人の割合の期待値は互いに等しい(帰無仮説が成立する)、というところだ。

統計的仮説検定は、2つの集団の期待値が異なるかどうかを確率的に判断しているだけなので、統計的仮説検定を用いて因果関係の有無を判断する場合は、因果関係がないなら帰無仮説が成立するように研究をデザインしなければならない。

がしかし、薬であれば、何らかの薬効成分が入っている。それで、治療効果の期待値が、プラセボ治療と同じとする帰無仮説は、科学的にナンセンスではないか? というのが最初の述べた、久々に聞いた批判の主旨である。さらに、特にこの化合物では、メカニズム的にも作用の根拠がクリアで、動物実験でも効果が実証されている。種差を考えても、ヒトで効かないはずはない、と続く。自身の研究に自信のある情熱的な研究者である。詳細を聞けば、なるほど帰無仮説はナンセンスのように思えてくる。

ご安心を。統計的仮説検定は、まさに帰無仮説がナンセンスであることを示すために用いるのです。また、帰無仮説が棄却されないことは、帰無仮説の証明にはなりませんから大丈夫ですよ。ヒトでどうなのかは、やはりヒトで試してみなければわからない、という懐疑者達を打ち負かすために、帰無仮説がナンセンスであることを証明しようじゃありませんか

日本人と癌

日本人にがんが激増しているが、その主要な原因は高齢化であることは、言うまでもない。
年齢で調整したがん死亡率は緩やかに減少しているので、年齢階級別の死亡率(全がんによる死亡率)は減少しているはずで、実際そうなっている。

http://ganjoho.jp/public/statistics/backnumber/1isaao000000068m-att/fig14.pdf

ただし、1965年においては、高齢になると死亡率が減少に転じているため、高齢者に限っては、がん死は増えているように見える。
リンク先には、

「80歳以上のがん死亡率の増加は診断精度の向上も一つの原因だと考えられる。」

とある。感染症が主な死因だった時代に若い時期を過ごし、感染症に負けず生き残った人たちだから、がんになりにくいのだと解釈するのは、ちょと無理かな。

部位別の様子を見てみると、がんの種類によらずに、一様に死亡率が減少したわけではなく、顕著な入れ替わりが認められる。
増加している部位のがんについては、生活習慣の改善で一定の予防効果が期待されるものがあるが、どれだけ健康的な生活をしていても、いつか必ず健康が衰えて死ぬ。
これを失念すると、こういう勘違いをする人が出てくるかもしれない。

http://takedanet.com/2010/04/post_e9b1.html

−−−−−−−−−−−引用開始−−−−−−−−−−−−−−
なにしろ、死亡確率の高い病気になる人が急増しているのだから、寿命が短くならないとおかしい。
−−−−−−−−−−−引用終了−−−−−−−−−−−−−−

死亡確率が高いもくそもない。人間の生涯死亡率は100%である。

たとえば、将来、死亡率の高い奇病が急増したとしよう。
その病気は、100歳を超えるあたりから罹患しやすくなり、年齢とともに罹患率が高くなっていく病気だったとする。
その病気が急増することは、寿命が短くなっているのではなく、寿命が延びていることを意味する。
若い人が罹りやすい、死亡確率の高い病気になる人が急増しているのであれば、寿命が短くならないとおかしいのである。

生活習慣を改善しても、生活習慣病以外の死因が相対的に増大して、必ず人は死ぬから、生活習慣病対策は、人間を不死にしようとたくらんでいるわけではない。
より健康で長生きを目指そう、ということなのだ。日本はすでに最長寿国であり、健康寿命も世界一であるが、もっと先を行こう、というわけである。
喫煙対策も、もちろん不死を目指しているわけではない。
もし、喫煙によって、若いときに罹患しやすい死亡率の高い病気を予防し、喫煙関連疾患が非常に高齢で発症するのであれば、若い人には喫煙は推奨されるだろう。

これは、そういう願望の吐露であろう。

http://www.pipeclub-jpn.org/cigarette/cigarette_detail_33.html

−−−−−−−−−−−引用開始−−−−−−−−−−−−−−
仮に、すべての調査対象者が死亡するまで追跡調査すると、非喫煙者でも必ずなんらかの死亡原因によって最終的には死亡しますので、非喫煙者に特異的に多い死亡原因が顕在化するはずです
−−−−−−−−−−−引用終了−−−−−−−−−−−−−−

気の毒だが、たぶん、全寿命も健康寿命非喫煙者の方が長い。

なお、死亡率に関する疫学データを読むときは、たいてい1年あたりの数値が出ていることに留意しよう。
でないと、こういう勘違いをしてしまう

http://www.bekkoame.ne.jp/~hmuroi/kenen.html

−−−−−−−−−−−引用開始−−−−−−−−−−−−−−
肺ガンによる死亡率は人口十万人あたり数十人です。ということは、百人あたりに換算すると僅か数百分の何人という計算になります。その中で非喫煙者と喫煙者の肺ガン発生率の違いはほんの僅かなものです。
−−−−−−−−−−−引用終了−−−−−−−−−−−−−−

肺ガンによる生涯死亡リスクは、

http://ganjoho.jp/public/statistics/backnumber/1isaao000000068m-att/fig09.pdf

によると、男性で6.3%である。
これは、喫煙者と非喫煙者こみの数字であるが、もちろん喫煙者は、これより大きい。
人は必ず死ぬけれど、個人的には、肺ガン死は避けたい。できれば、PPKといきたいものだ。

統計的仮説検定

統計的仮説検定は、作物や家畜の品種改良や、医学研究において、非常にマッチした道具である。有意差が見出されなかった場合、消極的に帰無仮説を受容するが、作物や家畜の品種改良では、実績のある在来品種が存在し、医学研究では、実績のある既治療(標準医療)が存在しているから、この消極的な受容は合理的だと思う(プラセボも既存治療に含んで考えている)し、間違うことを承知で判断するのも合理的だと思うからだ。もし、標準医療の存在しない深刻な疾患であれば、仮説検定の枠組みをかなり緩めて対応するだろう。公衆衛生の分野では、効果の無い対策を乱発するのを防ぐ意味で、帰無仮説の消極的受容は合理的だと思う。

この、統計的仮説検定、応用分野、というか、実益を得ようとする分野では強力な武器であるけれど、基礎的というか、知的好奇心を追及するような、より学問の本質的な部分をやる分野では、あまり使ってはいけないと、ずーっと前から思っている。血液型性格診断の信者と議論したとき、心理学では、統計的仮説検定で、学説を採択する(関係ありとする)ことになっている、みたいなことを言われた。そういうことはないだろうと思っているが、心理学分野で、統計的仮説検定が乱用されているという批判は、ずいぶん前からあるようで、アメリカ心理学会では、使用禁止が議論されたらしい。

で、興味深い論文を見つけた。

心理学的研究における統計的有意性検定の適用限界
http://ext-web.edu.sgu.ac.jp/kenkyuho/kiyo2005statistical_test.pdf

実益を得ようとする場合、有意水準5%の5%は、間違って、新しいほうを選んでしまう確率であると解釈できる。本当は、既存の品種と冷害に対する抵抗力は同じなのに、間違って新しい品種を選んでしまう、本当は、プラセボとかわらないのに、間違って新しい治療を選んでしまう、そういう確率である。そういう場面では、5%はちょうどいい値になっている。とはいえ、有意差が出たらその研究は終了、などということはないので、一研究あたり5%でやっていても、全体の第一種の過誤は、5%よりかなり低くなっている。心理学でも、一研究あたり5%でやって、追試を重ねていく、と勝手に思っていたのだが、そうじゃないみたい?

上の論文で引用されている

/
たとえば、1999年にジョンソン(D.H.Johnson)4)によって書かれた"The Insignificance of Statistical Significance Testing(統計的有意性検定の無意味さ)"というタイトルの論文が、ワイルドライフ・マネジメント研究誌の学会賞(The Wildlife Society Award for Outstanding Publication in Wildlife Ecology and Management, 2000)を獲得したという。
/

は、日本語で解説したページがあった。

http://takenaka-akio.cool.ne.jp/etc/stat_test/

まず、p値についてだけど、大事なのは、有意水準と比べて小さいか大きいかであって、p値そのものを解釈するのは無理がある。

/
正しくは,「帰無仮説が正しく,かつ想定する統計モデルが正しく,データがランダムにとられている場合に,観測データ+'もっと極端な'データが得られる確率」を示す.
/

といわれて、ああそうか!と、腑に落ちる人はたぶんいない。検定がやっているのは、たとえば、100匹中99匹がオスだったら、真の性比は1:1じゃないだろ?という判断の定量化である。100匹中99匹がオスだったらというのは、99匹以上がオスだったらということである。この何匹以上というのを確率の尺度で線引きしているわけだ。真の性比が1:1だったら、100匹中、オスがX匹以上になる確率は5%だ、じゃあ、オスがX匹以上になったら、帰無仮説を棄却しよう、というセンスである。だから、p値そのものを解釈するのはやめたほうがいい。

/
これがどんなものかはデータをとった人の気持ちが分からないと決らないということ.
/

いや、データをとった人が、サンプリングに適した検定方法を選ばなくてはならない。2つめからの例題については、適切に検定する方法はある。

/
帰無仮説はほんとに正しいのか?
/

それは、検定の問題ではない。帰無仮説が正しくないと確信するなら、最初から真の性比は1:1ではない、と言えばすむことだ。帰無仮説はデフォルトの科学的信念であるべきだと思う。でないと、有意差が無い場合に、帰無仮説の消極的な受容が合理的ではなくなる。

/
※あるパラメータがぴったりゼロで,0.01でも -0.01 でもないなんてことはあり得ないということです.
/

パラメータ(母数)は、そもそも定数。

/
p 値は任意だ
p 値は,1) 帰無仮説とデータとの違いの大きさと,2) サンプル数とに依存する.サンプル数を増やせばいくらでもp 値を小さくできる.
もっと恣意的なのは,p 値がいくつだったら「有意に違う」と結論するのかという基準. p 値が0.051 なら意味がないが,0.049 だったら意味があるなんて変.
/

応用分野ではそれでいい。新しい品種が本当に優れているか?を見極めたいのではなくて、新しい品種と入れ替えていいかどうかの判断なのだから。見極めに時間をかけすぎたら、いつまでたっても進歩できない。

/
帰無仮説を証明する
/

ことは、原理的に不可能。だから、帰無仮説はデフォルトの科学的信念であるべきだと思うわけ。

/
仮説検定についてのコメントいろいろ
ずいぶん前から,統計学者たちは統計学的仮説検定をいろいろ批判してきた.その多くは,検定そのものへの批判といようよりも,その誤った使われ方についての批判だ.でも,間違って使われやすいということ自体,統計学的仮説検定の問題だと思うぞ.
/

教科書には、あまり哲学の部分は書いてないからねえ。

難しいことはわからないケド、応用分野では、帰無仮説を受容するのか、それとも対立仮説を選ぶのか、という切実な状況がある。だから、有意になることは、対立仮説の証明ではなく、対立仮説を選ぶ根拠である、として統計的仮説検定を用いている、と良く承知している(はず)。まあ、かなりドライな割り切りがあるわけ。それから見ると、純粋な学問の部分で統計的仮説検定を使用するのは、何か違うよね、という感じなのである。要は、科学的にわかる、とはどういうことか?ということなのだけど、ヒュームからはじめるのは、今はしんどい。