Mapmaker/sibs
 Mapmaker/sibsの概要

 Mapmaker/sibsは罹患同胞対解析を行なうためのソフトウェアである。Risch、Holmanの理論に基づいたものである。

    Mapmaker/sibはCでかかれたプログラムでUnixで動く。SunOS (Solarisでも動く)、DEC Alphaなどで実行可能なファイルとして提供されているが、ソースコードからlinux環境で実行できるようにインストールすることも可能である。
 
 Mapmaker/sibsのダウンロードとインストール

    http://linkage.rockefeller.edu/soft/を参照し、そこにあるリストからリンクされているので容易にダウンロードできる。ダウンロードが終ったら、解凍、インストールを行ない、準備を進める。

    sibs.sunはSunOS用(Solarisでも動く)、sibs.alphaはDEC Alpha用。他の場合はsrc/のdirectory内のsource codeを用いてcompileしなおす。例えば、linuxで使えるようにするには、gccなどのC言語コンパイラーを用いる。正しくインストールすればlinux環境でも正常に動く。添付ファイルであるINSTALL を良く読み、Makefileの内容を調整してインストールを行なう。具体的には、例えばlinux上でMapmaker/Sibsをコンパイルする場合には、Makefileをvi等で開き、中に書かれている、SYS=-D_SYS_SUNOS、の部分を、SYS=-D_SYS_OSFに修正して保存する。その後makeコマンドを実行する(makeと入力しリターン)コンパイルが完了する。
 
 Mapmaker/sibsの入力ファイル

    Mapmaker/sibsの入力ファイルはpreファイルとdatファイルである。preファイルには家系情報、疾患のあるなし、マーカー座位での遺伝子型などを記載し、datファイルには座位の性質や座位間の遺伝的距離などを記載する。datファイルのかわりにlocファイルという、より簡単な形式のファイルも用いることができる。
 
 Mapmaker/sibsの使用法

    分析の概要はsibs.sunとタイプしてプログラムを開始し、続いて、次のコマンドを入力する。

    1. load *.loc、またはload *.datとタイプし、locデータ、またはdatデータを入力する。

    2. prepare *.preとタイプし、家系データ、マーカー座位の遺伝子型データなどを入力する。
        このとき、load phenotype data?と聞いて来るのでnoと答える。これは表現型データを別ファイルにして読み込む場合に必要である。

    3. scanとタイプし、データの事前の解析を行なう。

  4. estimateとタイプするとlod scoreなどの結果が返ってくる。
        estimateに際してno diminance varianceかどうかを質問される。通常はdominance varianceありの条件で計算すると良い。Mapmaker/sibsはmaximum lod scoreの他に、そのlod scoreを与えるz0、z1、z2の値を計算する。これらのz0、z1、z2の値を変化させることにより、その仮定でlod scoreが最大になるz0、z1、z2の値を突き止める。z0、z1、z2はallele sharing proportionである。これは罹患同朋対が同祖遺伝子を0、1、2個共有する確率であり、z0+z1+z2=1となる。これらの値は相対危険と深い関係がある。Dominance variance無しと指定するとz0, z1, z2の動き得る範囲に強い制限がかかり、lod scoreが低くでる事が多い。一般にno dominance varianceは完全優性の場合に相当する。これは、z0, z1の動く範囲がHolman's triangleの内部なのか、あるいは水平な一辺なのかを選択する部分である。
        estimateコマンドによる出力はmls.out, mls.ps, share.psの三つである(postscript offにしている場合はmls.outのみ)

    5. その他
        single point
            onとすれば単点(実は二点)分析(通常は多点分析であるのでoffになっている)を行い、offとすれば多点分析を行なう。
        map function
            Map functionをHaldane, Kosambiから選択できる。
        allele frequencies
            通常はdatファイルなどで与えられた対立遺伝子頻度を用いて計算するが、allele frequencies thresholded 0.05などとすると、0.05未満の頻度はすべて0.05にセットされる。
        increment
            多点分析の場合、stepとdistanceを選択できる。increment set 5とすると、各マーカー座位間を5等分して、等分点でlod scoreなどを計算する。
            increment distance 1とすると、マーカー座位に係わらず、第一マーカー座位から1 cMの等間隔の点でlod scoreなどを計算する。
       exclude
            exclusion mappingを行なう。即ち、検索中の形質に関係していることを除外できる領域を調べる。この時、入力すべきデータとしてdominance varianceを許すかの他、offspring, sibの相対危険、またはz0, z1の値を入れる(dominance varianceありの場合。無しの場合はz2の値を入れる)。相対危険が低い座位は同じデータでも除外できる可能性は低いことは当然である。
        infomap
            各点に情報がどれくらい含まれているかを計算する。
        postscript
            これをonにするとpostscriptファイルが生成される。
        pairs used
            一家系に三人以上の罹患同胞が居る場合のpairの選択法を選ぶ。Defaultでは最初のペアのみが計算されるが、全ペアを計算する、独立な複数のペアにして計算するなどのオプションを選ぶことができる。
        off end
            マーカー座位の最初と最後の端を超えて計算を行なう(多点分析のみ)。off end 10とすると10 cM超えて行なう。

    6. sibsの実行中に解らなくなったらhelpとタイプするとヘルプメニューがでる。例えば、off endについてわからなければ、helpの後に簡単な説明がなされる。更に詳しくoff endの事が知りたい場合はhelp off endとタイプする。
 Mapmaker/sibsの出力データの解釈

    最も重要なのはestimateコマンドからの出力である。多点分析の結果は通常の数値データの出力(mls.out)としても得られるが、Postscript形式のグラフを描くファイルとしても得られる。テキストファイルの出力で第一列に来る数値は第一マーカー座位からの距離(cM)である。incrementの選択でdistanceになっていれば全領域で等間隔、stepになっていれば隣り合う座位間でのみ等間隔になっている。

    PostscriptファイルはPostscript対応のプリンターか、Ghostscriptというソフトウエアにより見る事ができる。一つはmaximum lod scoreを縦軸にし、横軸に特定のマーカーからの距離を置いて表したグラフ(mls.ps)、もう一つはz0, z1, z2の値を同様に表したものである (share.ps)。mls.psのグラフを見て、maximum lod scoreがどの位の値かを見て、それを与える染色体の領域を見る。

    exclude, infomapコマンドからの出力も座位を横軸に出力されるが、解釈は省略する。
 
 Mapmaker/sibsの理論の詳細

    罹患同胞対解析のためには、もしある遺伝子座が疾患に関係有るとすると、罹患同胞対の共有する同祖遺伝子の数は一般的な同胞対より多いという仮定を証明するという事がまず考えられる。一般に、同胞の共有する同祖遺伝子の数が0, 1, 2である確率はそれぞれ0.25, 0.5, 0.25である。共有する同祖遺伝子の数の期待値は0 x 0.25 + 1 x 0.5 + 2 x 0.25 = 1である。従って、得られたデータから同祖遺伝子の数を数え、期待値からのずれを検定する方法がまず第一に考えられる。

    ところで、ここで同祖遺伝子と書いたが、その判定は困難なこともある。もし親の持つ4つの対立遺伝子のすべてが区別可能であれば同胞の遺伝子型のみで、同祖かどうか(即ち、親の代で同じ対立遺伝子由来か)は簡単に判定できる。即ち、状態同一(IBS)と同祖同一( IBD)は一致する。

    しかし、親の4つの対立遺伝子の複数が区別不可能であると、同胞間で同じように見える(IBS)場合でも親の代においての由来を考えると同一性(IBD)の判定は容易ではない。このようにIBDの測定が完全にできない場合でも、その家系を捨てるのではなくそれぞれの事象の確率をIBDに乗じて数えることにより検定を進めることができる。

    Rischは罹患同胞対解析の理論を発展させた。Mapmaker/sibでは罹患同胞対のIBDの数が0, 1, 2である確率、z0, z1, z2をパラメータとした最尤法を用いて解析を行う。z0 + z1 + z2 = 1なので変数は2個である。異なった家系でも同じ確率でIBDの数が分配されると仮定し、得られたデータの尤度を計算する。データは最低限必要なのは罹患同胞対であるが、両親、非罹患同胞の遺伝子型も非常に有用である。両親や非罹患同胞の遺伝子型がどの程度有用か(検出力を向上させるか)はマーカー遺伝子座のヘテロ接合頻度によっても異なるが、ヘテロ接合頻度が低いときには両親の遺伝子型はほぼ必須である。しかし高いときには非罹患同胞の遺伝子型もかなり有効であり、両親のサンプルが得られない場合でも検定は行える。両親の遺伝子型が得られるときには尤度の計算に集団の遺伝子頻度は必要無いが、両親、あるいは片親の遺伝子型が不明の場合は、集団の遺伝子頻度を代入して計算する。

    j番目の家系について、もしIBDが0であったときに、その家系全体のデータが得られる確率を計算し、それをwojとする。もし、この時、片親の遺伝子型が得られないときは集団の遺伝子頻度を次々に入れ、このデータが得られる確率を計算し、0で無いときは遺伝子頻度に乗じて和を取る。次にIBDが1, 2であったときこの家系のデータが得られる確率を計算しw1j, w2jとする。これらは条件確率なので、この家系のデータが得られる尤度は
z0 woj + z1 w1j + z2 w2j となる。1..N番目の全体の家系のデータが得られる尤度がこれから計算される。それぞれの家系は独立なので、全体の家系のデータが得られる尤度は、それぞれの家系の積で表され、
 

    L(z)はzのみの関数と成る。ただし、z=(z0, z1, z2)。もし、このマーカー遺伝子座が疾患と無関係とするとzは次のaとなる。a=(0.25, 0.5, 0.25)。このマーカー遺伝子座が疾患と関連しているかどうかを判定する指標として、次の尤度比が用いられる。

Likelihood ratio = L(z)/L(a)

    この対数がlod scoreである(底を10とする)。

lod score = log ( L(z)/L(a) )

    もし、マーカー遺伝子座が疾患と無関係とするとL(z)の期待値はL(a)となりlod scoreの期待値は0である。ここでzをさまざまに変化させ、lod scoreの最大値を求める(maximum lod score)。この時zの動く範囲はどのような範囲であろうか。

    Holmansはzの動き得る範囲を詳細に検討した 。
一般に、zは相対危険と関係している。もし、この疾患がこの遺伝子座の遺伝子型のみによって決まるとする。この遺伝子座について、親子のIBDは1である。一卵性双子のIBDは2である。同胞のIBDが一般に0, 1, 2となる確率が0.25, 0.5, 0.25であることは前述した。ここでIBDが1, 2の個体の、IBDが0の個体に対する相対危険をλo, λmとすると、同胞の相対危険は(この疾患の相対危険はこの遺伝子座のみによって決まるので)、

λs = 0.25 x 1 + 0.5 x λo + 0.25 x λm

従って、罹患同胞対をたくさん集めたとすると、IBDが0, 1, 2の対の比率は

z0 : z1 : z2 = 0.25 : 0.5 λo : 0.25 λmである。z0 + z1 + z2 = 1なので、

z0 = 0.25 / λs, z1 = 0.5 λo/λs, z2 = 0.25 λm/λs となる。このようにz0からλs = 0.25/zoによりlsは求まり、λo, λmも上式より、λo = z1 λs/0.5、λm = z2 λs/0.25 = (1-zo-z1) λs/0.25となる。λs≧1は明らかなので、z0≦0.25。また、λs≧λo(ここで完全な常染色体性優性であれば、λs=λoとなることに注意。即ちno dominance variance)なのでz1≦0.5。さらに、上式より、λo = 0.5 z1/z0で、λo ≧1は明らかなので、z1≧2 zo。即ち、zo, z1の動き得る範囲はHolmans' possible triangleと言われる範囲である。この範囲でz0, z1を動かしlod scoreの最大値を与えるz0, z1を求め、その時のmaximum lod scoreの値により有意性を検定するのが最尤法による罹患同胞対解析である。