127.統計は、難しい

 高等学校では、2次元平面内のベクトルを習うはずだ。ベクトルとは大きさと向きを持つ量。

 図のように、2つのベクトルVWがあったとしよう。図では、ベクトルには英字の上に矢印をつけている。X 軸、y 軸の代わりに、p と q と書いているが、矢印のベクトルを、pと q 方向に分解すると

 

    V= ( Vp , Vq ) , W = ( Wp , Wq )

 

と、“成分表示”できる。2つのベクトルを“足して”、新たなベクトルを作るのは、それぞれのベクトルの成分同士を足して、新たなベクトルを作ればよい。

 

     V  + W = ( Vp + Wp ,  Vq + Wq )

 

図でわかる通り、2つのベクトルからつくられる平行四辺形の対角線にあたる部分が、新たに足し算で作られたベクトルだ。

 

     f:id:uchu_kenbutsu:20201205090746j:plain

 

 さて。

 

 ある疾患に製薬会社 A が作る薬 A か、製薬会社 B が作る薬 B を投与し、効き目を測定した。集団1に薬 A を投与したところ、8% の患者に良い傾向が見られた。ところが、集団2に薬 B を投与したところ、11% の患者に良い傾向が見られた。

 そこで、製薬会社 A は負けじと治験を繰り返し、集団3に薬 A を投与したところ、16% の患者に良い傾向が見られたので満足した。ところが、対抗して、製薬会社 B は、集団 4 に薬 B を投与した治験を繰り返したところ、今度も A の 16% を超える 20% の患者に良い傾向が見られた。

 こうなると、製薬会社 B が作る薬 B を投与するのが良さそうだ。

 データを見ておこう。ここで、

 

    (良くなった割合)=(良くなった患者数)/ (薬を投与した患者数)

 

である。被験者の数も書いておこう。

 

 

A社の作る薬Aを投与

B社の作る薬Bを投与

1回目

集団1 :8%=40/500

集団2 :11%=220/2000

2回目

集団3 :16%=240/1500

集団4 :20%=40/200

 

A 社の作る薬 A を集団 1 に投与した人が 500 人で、そのうち 40 人に良い傾向が見られたので、40 / 500 = 8% という意味で書いている。

 

 1 回目を比べても、 2 回目を比べても B 社の方が成績が良い。B 社の薬 B を使うべきだ。

 

 しかし。

 

 全体で見てみよう。

 A 社の作る薬を投与された数は、1 回目、2 回目、併せて500 + 1500 =2000人。良くなった数は、40 + 240 = 280人。よって、良くなった患者の割合は、

 

    A社: 280 / 2000 = 14 %

 

一方、B 社では、薬 B を投与された数は、1 回目、2 回目、併せて 2000 + 200 =2200人。良くなった数は、220 + 40 = 260人。よって、良くなった患者の割合は、

 

    B社: 260 / 2200 = 11.82 %

 

あれ、A 社の薬 A の方が、よく効くじゃないか。

 

 ちょっと、ベクトルで見ておこう。

 

 被験者の数を p、良くなった患者数をqとしておくと、良くなった人の割合は

 

    q / p

 

だ。そこで、ベクトル P = ( q , p ) を導入しよう。こうしておくと、ベクトル が p 軸となす“傾き” q / p が良くなった人の割合なので、ベクトルが q 軸に沿うようになっている方が、良くなった人の割合が高いということ。

 

 差が見えるように、ベクトル図は少し誇張して書いておいた。縦軸と横軸のスケールも異なって書いている。

 

      f:id:uchu_kenbutsu:20201205090819j:plain

 

1 回目の A 社の集団 1 では

  

    α = ( 40 , 500 ) = ( αp ,αq )

 

1 回目の B 社の集団2では

  

    β = ( 220 , 2000 ) = ( βp ,βq )

 

2回目の A 社の集団3では

  

    A = ( 240 , 1500 )  = ( Ap ,Aq )

 

2回目の B 社の集団4では

  

    B = ( 40 , 200 ) = ( Bp ,Bq )

 

被験者全体で比較するには、A 社では

 

    α + A = ( 40 , 500 )+( 240 , 1500 )=

       = ( 280 ,  2000 ) 

       = ( αp + Ap,αq +Aq )

 

一方、B 社では

  

    β + B = ( 220 , 2000 )+( 40 , 200 )=

       = ( 260 ,  2200 ) 

       = ( βp + Bp,βq +Bq )

 

 図から解る通り、ベクトル α とベクトル β では、β の方が傾きが急なので、良くなった人の割合 ( = q / p ) はベクトル β で表される方が高い。同様に、ベクトル とベクトル では、の方が傾きが急なので、良くなった人の割合は で表される方が高い。

 ところが、α + A β + を比べると、α + の方が傾きが急なので、A 社の方が良くなった人の割合が高いということを意味している。

 

 まとめれば、

 

   αq / αp  <  βq / βp   かつ   Aq / Ap  <  Bq / Bp   

 であっても、

    ( αq + Aq ) / ( αp + Ap )  <  ( βq + Bq ) / ( βp + Bp ) は必ずしも成り立たない  

 

という、分数の基本が現れている。

 

 統計は、難しい。