127.統計は、難しい
高等学校では、2次元平面内のベクトルを習うはずだ。ベクトルとは大きさと向きを持つ量。
図のように、2つのベクトルVとWがあったとしよう。図では、ベクトルには英字の上に矢印をつけている。X 軸、y 軸の代わりに、p と q と書いているが、矢印のベクトルを、pと q 方向に分解すると
V= ( Vp , Vq ) , W = ( Wp , Wq )
と、“成分表示”できる。2つのベクトルを“足して”、新たなベクトルを作るのは、それぞれのベクトルの成分同士を足して、新たなベクトルを作ればよい。
V + W = ( Vp + Wp , Vq + Wq )
図でわかる通り、2つのベクトルからつくられる平行四辺形の対角線にあたる部分が、新たに足し算で作られたベクトルだ。
さて。
ある疾患に製薬会社 A が作る薬 A か、製薬会社 B が作る薬 B を投与し、効き目を測定した。集団1に薬 A を投与したところ、8% の患者に良い傾向が見られた。ところが、集団2に薬 B を投与したところ、11% の患者に良い傾向が見られた。
そこで、製薬会社 A は負けじと治験を繰り返し、集団3に薬 A を投与したところ、16% の患者に良い傾向が見られたので満足した。ところが、対抗して、製薬会社 B は、集団 4 に薬 B を投与した治験を繰り返したところ、今度も A の 16% を超える 20% の患者に良い傾向が見られた。
こうなると、製薬会社 B が作る薬 B を投与するのが良さそうだ。
データを見ておこう。ここで、
(良くなった割合)=(良くなった患者数)/ (薬を投与した患者数)
である。被験者の数も書いておこう。
|
A社の作る薬Aを投与 |
B社の作る薬Bを投与 |
1回目 |
集団1 :8%=40/500 |
集団2 :11%=220/2000 |
2回目 |
集団3 :16%=240/1500 |
集団4 :20%=40/200 |
A 社の作る薬 A を集団 1 に投与した人が 500 人で、そのうち 40 人に良い傾向が見られたので、40 / 500 = 8% という意味で書いている。
1 回目を比べても、 2 回目を比べても B 社の方が成績が良い。B 社の薬 B を使うべきだ。
しかし。
全体で見てみよう。
A 社の作る薬を投与された数は、1 回目、2 回目、併せて500 + 1500 =2000人。良くなった数は、40 + 240 = 280人。よって、良くなった患者の割合は、
A社: 280 / 2000 = 14 %
一方、B 社では、薬 B を投与された数は、1 回目、2 回目、併せて 2000 + 200 =2200人。良くなった数は、220 + 40 = 260人。よって、良くなった患者の割合は、
B社: 260 / 2200 = 11.82 %
あれ、A 社の薬 A の方が、よく効くじゃないか。
ちょっと、ベクトルで見ておこう。
被験者の数を p、良くなった患者数をqとしておくと、良くなった人の割合は
q / p
だ。そこで、ベクトル P = ( q , p ) を導入しよう。こうしておくと、ベクトル P が p 軸となす“傾き” q / p が良くなった人の割合なので、ベクトルが q 軸に沿うようになっている方が、良くなった人の割合が高いということ。
差が見えるように、ベクトル図は少し誇張して書いておいた。縦軸と横軸のスケールも異なって書いている。
1 回目の A 社の集団 1 では
α = ( 40 , 500 ) = ( αp ,αq )
1 回目の B 社の集団2では
β = ( 220 , 2000 ) = ( βp ,βq )
2回目の A 社の集団3では
A = ( 240 , 1500 ) = ( Ap ,Aq )
2回目の B 社の集団4では
B = ( 40 , 200 ) = ( Bp ,Bq )
被験者全体で比較するには、A 社では
α + A = ( 40 , 500 )+( 240 , 1500 )=
= ( 280 , 2000 )
= ( αp + Ap,αq +Aq )
一方、B 社では
β + B = ( 220 , 2000 )+( 40 , 200 )=
= ( 260 , 2200 )
= ( βp + Bp,βq +Bq )
図から解る通り、ベクトル α とベクトル β では、β の方が傾きが急なので、良くなった人の割合 ( = q / p ) はベクトル β で表される方が高い。同様に、ベクトル A とベクトル B では、B の方が傾きが急なので、良くなった人の割合は B で表される方が高い。
ところが、α + A とβ + B を比べると、α + A の方が傾きが急なので、A 社の方が良くなった人の割合が高いということを意味している。
まとめれば、
αq / αp < βq / βp かつ Aq / Ap < Bq / Bp
であっても、
( αq + Aq ) / ( αp + Ap ) < ( βq + Bq ) / ( βp + Bp ) は必ずしも成り立たない
という、分数の基本が現れている。
統計は、難しい。