シミュレーションによる研究計画チェック

     連鎖解析を含めて、遺伝統計学的解析を行うときには、得られるであろうサンプルからどの程度確実な結果が得られるかのシミュレーションが必要である。例えば、罹患同胞対解析を行うときは100例単位の家系からサンプルを収集する必要がある。そのような大規模な計画を行う場合、結果として有意義な結論が得られる可能性が無い場合に研究を開始することは無謀である。

    一般に、連鎖解析を含めた遺伝統計学的解析では疾患と遺伝子座位あるいは、領域に関係があるか無いかの判断が中心である。実際に、そのような関係がある場合に、あると検定できる確率を検定力(検出力、パワー)という。このパワーを測定することがシミュレーションの最大の目的である。

    しかし、いかにパワーが高いといっても、「関係がある」という判定に誤りがあればこれは問題である。関係があるという判定が誤っている事をタイプIのエラーという。

    一般的には、タイプIエラーを5%以下に設定した統計的判定基準を設けて、その基準で、真に関係がある場合に「関係がある」という判定が出る確率をパワーとする。遺伝統計的検定のためにはできるだけパワーの強い検定法を用いる方が良い。そして、ある程度のパワーが得られないと判断される場合には実際にサンプルを集めたり測定を始めるには慎重にした方がよい。

   シミュレーションを行うためには 1. 数理的方法   2. モンテカルロ法、の二つがある。

 数理的方法による家系のシミュレーション

   数理的方法は、数式を用いて論理を進めて行く方法である。比較的単純なモデルに還元できる場合に有効である。

 モンテカルロ法による家系のシミュレーション

   モンテカルロ法は、疑似乱数を発生してコンピュータを用い、疑似家系を作って分析を行う方法である。

    メンデルの法則は、基本的に配偶子の分配はランダムと考えるので、コンピュータの発生する乱数を用いて家系を作る。その後に、自分が用いるつもりの分析プログラムにかけ、十分なlod scoreなどが得られることをたしかめる。

    これには既に作られたプログラムを用いる方法と、プログラムを自作する方法がある。既に作られたプログラムにはSLINKなどがある。しかし、自分の計画した方法とぴったり合わない場合も多く、それぞれの計画にそったシミュレーションを行う必要があることも多い。

    自分が計画している連鎖解析のシミュレーションは、極めて複雑なものを除いては以下で受け付けている。

各種シミュレーション

    1. Parametric linkageのシミュレーション
    2. Affected sib pair分析のシミュレーション
    3. 連鎖不平衡解析、ハプロタイプ解析のシミュレーション
    4. TDTのシミュレーション
    5. 構造化のある集団の相関解析のシミュレーション

依頼先

kamatani@ior.twmu.ac.jp