Date: Thursday, June 02, 2005 2:39 PM
>>○○さん:現行の【ある環境調査】マニュアルでは「2サンプル以上」となっているのですが、以前どなたか先生に「2サンプルでは分散が計算できないので、最低3サンプルが必要」という指摘を受けて「3サンプル以上」の記述に改訂する方向で事務局(案)を詰めています。しかし予算縮減の圧力が強い昨今、調査量を増やす方向での変更は、相当強い根拠がないと提案できないのが現状です。<<
不偏分散はサンプル数nに対して(n-1)で割りますからn=2で定義可能(n=1はだめ)。これに対してt分布は分母にn-2がでてきますから、n=2では定義できません。だからといって、3サンプルでt検定にかけるのは危険でしょう。標本分散(ExcelならVarp)は1でさえ計算されます。
2にする意味は、検定にかけるよりも、再現性を確かめる意味ではないでしょうか?2サンプルで、ぜんぜん違う値のときどうしますか?どちらか諮り違えたとして、どっちが真実かわからない。3ならまだわかる。(昔のスポーツ競技の計測係の発想) 3ならよいとか、2じゃだめとは統計学的にはいえないと思います。もっと実践的に決めてよいのでは?
Date: Thu, 2 Jun 2005 21:29:46 +0900
>>○○さん:実際、2データは全く違う値を示すことも多く、どっちが真実か分からないので、面積を増やした1サンプルの方がまだマシだという議論もありました。<<
これはますます危ない。危ないことに気づかないだけです。労力が大差ないなら、細かく分けてたくさん捕るのが鉄則でしょう。
当然ですが、整合性がないデータは報告書に書きづらい。論文も同じです。証明できることだけ書き、その裏にある「あら」は見せたくない。1サンプルで検定不要なら、2サンプルで矛盾は示したくない。バラツキを減らすなら、面積増やした1サンプルということでしょう。
論文は校閲者を説得しないといけないが、報告書なら収めればよい。だから、マニュアルできちんと書かないといけない。
0より1、1より2、2より3です。2の場合は食い違ったらデータの取り直しか、そのデータを捨てることになる。3ならそれなりに救いようがある、ということでしょう。【】うかがう限り、やはり3サンプルを勧めたいですね。あるいは、2で発注者が困るに任せるか。