パラメトリック連鎖解析

「パラメトリック」とは

連鎖解析はメンデルの第3法則(独立の法則)の例外現象である連鎖を利用して表現型に関連する遺伝子座の染色体上に疾患原因遺伝子座の存在領域を絞り込んでいく(位置をマッピングする)遺伝統計学的手法である。この方法では染色体上に設定したマーカー遺伝子座(実際に実験を行って多型を見る場所、連鎖解析ではマイクロサテライトマーカーがよく用いられる)と表現型(質的形質の場合は罹患の有無)の世代間の動きに着目しこれらの実測されたデータ(マーカー遺伝子の遺伝子型データと表現型)の尤度(尤もらしさ)を計算しこの値が高くなる場所を検索する。ここでは連鎖解析の一手法であるパラメトリック連鎖解析について述べる。

連鎖解析における「パラメトリック」とは、解析に先立ち、遺伝子型に応じて固有の発症確率(=浸透率)を仮定する(遺伝形式を仮定する)ことを意味する。遺伝子型における浸透率を仮定するということはすなわち疾患原因遺伝子座位での遺伝子型によって発症確率が記述できるということである。浸透率が仮定できるときには表現型(罹患の有無)からその疾患の原因遺伝子座での遺伝子型を簡単に関連づけることができる。

パラメトリック連鎖解析が有効であるケース

パラメトリック連鎖解析は疾患原因となる遺伝子座位がたった一つ、もしくは罹患の有無に非常に大きく寄与する遺伝子座がたった一つであるようなときに威力を発揮するタイプの解析手法である。より具体的にはいわゆる遺伝病の原因遺伝子探索を行うときに有効であるといえる。というのも遺伝形式が最もはっきりするのがいわゆる遺伝病のときだからである。一家系に何人もの罹患者がでる家族性疾患においては原因遺伝子がただ1つであり、またそこでの罹患となる遺伝子型の浸透率が大きな値(1に近い値)をとることが多い。このような大家系での複数罹患が観察されるような疾患の原因遺伝子解析にパラメトリック連鎖解析は向いている。

たとえ原因遺伝子がたった1つであったとしても、解析に先立ち仮定した浸透率が真の値と大きく異なっているときには本当の疾患座位であったとしてもそれを見逃す確率が高くなってしまう(パワーの減少:第一種の過誤の増大)。また偽陽性を拾う可能性を高めてしまうだろう(第二種の過誤の増大)。浸透率が低い場合には疾患は大家系の形では顕れない場合も多い。このようなときには多数の小家系集団が観察されることとなる。小家系集団しか得られない疾患では、その疾患原因遺伝子がたった1つだけであると仮定すること、またその浸透率を見積もることは非常に難しいと思われる。

いわゆる「ありふれた病気」(common dicease)(その多くが多遺伝子性であろうと考えられている)でも多くの遺伝子型が影響しあって発症を規定するため一つ一つの原因遺伝子座の発症への寄与は高くならない。また複数の疾患原因遺伝子座での遺伝子型が発症に影響す為、浸透率というものも単純に仮定できない。このためそのような疾患にはパラメトリック連鎖解析は用いられない。このような場合には通常別章で述べるノンパラメトリック連鎖解析を行うこととなる。

パラメトリック連鎖解析では遺伝形式や浸透率が仮定と合わないと有効な結果が得られない反面,これらが特定できる疾患では,他の解析方法に比べて,比較的少ないサンプル数で有効な結論を導き出すことが可能である。これは遺伝子型と表現型を浸透率というパラメータを用いて直接関係づけることができる為であろう。パラメトリック連鎖解析では他の連鎖解析手法と同じく,尤度最大化法(最尤法)を用いて解析を行う。ここでは単点解析を例にして説明する。

単点解析

単点解析(二点解析ともいう)は特定のマーカー座位の遺伝子型と疾患原因遺伝子型との関係をみる方法である。マーカー遺伝子型情報は実験的に測定したマーカー遺伝子座の遺伝子型データを用い、疾患原因遺伝子座での遺伝子型データは表現型(罹患の有無)と浸透率から確率的に算出する。ここでのパラメータは疾患原因遺伝子座とマーカー遺伝子座の間の組み換え割合(θ)である。

連鎖解析では、観察されたデータ(マーカー座位の遺伝子型、表現型)の元での、各ディプロタイプ形の存在割合を推定しそれを確率的に記述して全体の尤度を算出する。尤度とはそれがおこる「尤もらしさ」である。いま浸透率は事前に決められているので尤度は組み換え割合θの関数になっている。ここで θ を 0(完全連鎖=疾患原因遺伝子がマーカ遺伝子そのもの)から,0.5(自由組み換え=疾患遺伝子はマーカー遺伝子とは連鎖が全くない)の間で動かしてみる。もしマーカー遺伝子座と疾患原因遺伝子座がきわめて近い場所にある場合はθが0のときに最も尤度が高くなるであろう。また逆にこの染色体上に原因遺伝子が存在しないときには自由組み換え(θ が0.5のとき)に尤度が最大になることになる。連鎖解析ではこのように最も尤度が大きくなるような θ を探索していく。

以下に2つの具体例を持って示す。簡単にするために,各疾患遺伝子の遺伝形式による浸透率 (penetrance) を NN のときに0,NA, AAで 1(0 で非発症,1 では完全に発症)とする(すなわち常染色体完全優性遺伝の遺伝形式)。また,疾患座位での疾患原因遺伝子を A,正常を N とする。最初に手計算によって,例に挙げた疾患家系での対立遺伝子のパターンを持つ尤度を計算してみる。後ほどコンピュータープログラムによる尤度計算法を紹介し,このとき,再びこれら同じ家系について計算して両手法で算出された値を比較してみる。

手計算による尤度計算と最尤法の適応

[例1]

現在,最もよく用いられるプログラムでは家系の一番下(子孫側)の核家族から計算を行い,順次祖先側の核家族に向かって尤度計算を行っていくという手順をとる(Elston-Stuart algorithm)。

図1 :

図1に示される家系1における観測データの尤度を計算する。 尤度計算においては,まずより子孫側の ID4 を父親,ID5 を母親とする核家族(親と子供だけからなる基本単位)内での尤度を考える。 この家系内での遺伝子パターンを考える為には,先祖側につながる親,(ID4 の罹患男性)のハプロタイプ(配偶子)について,可能なものを場合分けして考えてみる。 次に各アレルがどのように伝わっていったのかを考え(複数の可能性がある場合はさらに場合分けを行い),この世代間に2つの遺伝子座(疾患遺伝子座とマーカー遺伝子座)間で組み換えが行われた確率を θ,行われずに伝わった確率を 1-θ として,これら対立遺伝子が家系に配分された尤度を計算する。

最初に ID4 のハプロタイプに注目したのは,このメンバーが唯一上の核家族のメンバーとなるからである。 4つの組み合わせのうち,この罹患男性 (ID4) のとり得るハプロタイプは <A> (A-1/N-4) もしくは <B> (A-4/N-1) の2通りだけということが判る。

ID4 だけに注目し,彼が罹患している事実と,疾患遺伝子の浸透率から考えると,疾患遺伝子座が AA という場合も考えられる。 しかし,核家族内のメンバーまで含めて考え直した時,非罹患の子供 (ID7) がいることで ID4 が AA を持つ可能性はないことが判明する(ID4 が AA の場合は,ID7 にもかならず最低一つの A が行くことになるので ID7 が発症してないことと矛盾するため)。 このように,手計算の場合,総ての組み合わせをリストアップしたのちに,家系矛盾の起きるものを除去し,矛盾のない組み合わせだけについて計算を進めると効率がよい。

次に ID4 の持つハプロタイプが <A> のときに,ID6 の罹患女性に疾患遺伝子座,及びマーカー遺伝子座で各アレルがどのように動いたかを考えてみる。 ID6 の女性の持つ2つのマーカー対立遺伝子,1 と 4 はそれぞれ片親から1つずつ受け継いだものである。 この事実を考慮すると,各アレルはどちらの親から受け継いだものかが(この場合に限っては)一義的に決まる。 すなわち,アレル 4 が父親から,アレル 1 は母親由来である。 もし一義的に決まらない場合には可能な組み合わせの数だけ場合分けをして考えることになる。

ID6 は罹患しているので,アレル A を受け継いでいる. さらに父親からアレル 4 を受け取ったので,この受け取ったハプロタイプは,A-4 であるということになる。 父親 (ID4) のハプロタイプは (A-1/N-4) であるので,この場合父親由来の染色体は減数分裂過程で2つの遺伝子間において組み換えが行われたことになる。

この ID6 の観察データの尤度は,

により,(1/2)2θ と算出される。

同様に ID7 について考えると,この非罹患女性は, 父親から N-1(=組み換えあり),母親からはアレル 1 (N-1) を受け取ることが判る。 この ID7 の観察データの尤度は,

により,(1/2)2 θ と算出される。

これら2人の子供 (ID6, ID7) の観察データの尤度は ID6 の観察データの尤度と ID7 の観察データの尤度の積で表される(この核家族全体の観察データが得られる事象に対して,これら2人の子供たちの観察データの事象が同時に起こることであり,子供の事象は互いに独立だから)。

よって,この父親 (ID4) のハプロタイプが <A> の (A-1/N-4) である場合のこの核家族の観察データの尤度は,

(1/2)2 θ · (1/2)2 θ = (1/2)4 θ2

となる。

同様にして,この父親 (ID4) のハプロタイプが <B> の (A-4/N-1) である場合のこの核家族が存在する尤度は,

(1/2)2 (1-θ) · (1/2)2 (1-θ) = (1/2)4 (1-θ)2

となる。

以上の計算によって,ID4 を父親,ID5 を母親とする核家族の持つアレル情報,罹患情報の尤度は,ID4 の2種類のハプロタイプのそれぞれの事象に「畳み込まれた」ことになる。

次に,ID1, ID2 を両親とする核家族を考える。 ここで,罹患している ID2 について,先の ID4 のときと同様に2つの座位(疾患遺伝子座とマーカー遺伝子座)のハプロタイプを考える。 ID2 の持つハプロタイプは <C> (A-3/N-4) もしくは <D> (A-4/N-3) の2通りだけということが判る。 (A-3/A-4) を考えなくてよいのは,ID4 の場合と同様の理由による(子供に非罹患がいることより)。

ここで,ID4 で考えられていたハプロタイプ <A> と <B> との組み合わせを考える。 両親から子供へは1つずつの配偶子が移ることを考えると,組み合わせた4種類のうち, <C>-<B> と,<D>-<B> のみが実際に核家族で生じる可能性のある組み合わせであることが分かる(罹患母親由来の,疾患遺伝子と連鎖できるマーカー遺伝子座の対立遺伝子は,組み換えが起こる起こらなくても,アレル 3 かアレル 4 だけだからである)。

そこで,<C>-<B> と,<D>-<B>についてのこの核家族の観察データの尤度を求める。

<C>-<B> の時には,ID3 は父親からアレル 2 (N-2),母親からはハプロタイプ (N-4)(=組み換えあり)を受け取ることが判る。 以上のことよりこのデータの尤度は,

により,(1/2)2 (1-θ)と算出される。

同様に ID4 について考えると, 父親からアレル1 (N-1) を,母親からはハプロタイプ (A-4)(=組み換えあり)を受け取ることが判る。 この ID4 のデータの尤度は,

により,(1/2)2 θ と算出される。

さらに ID4 には,彼が親となった核家族のデータの尤度(状態 <B> である尤度)(1/2)4(1-θ)2 が畳み込まれている。 これを考慮すると,この ID1,ID2 が両親の核家族において <C>-<B> での観察データの尤度は,

(1/2)2(1-θ) · (1/2)2 θ · (1/2)4 (1-θ)2 = (1/2)8 θ (1-θ)3

となる.

同様にして,ID2 のハプロタイプが <D> (A-3/N-4) である場合の <D>-<B> の観察データの尤度は,

(1/2)2 θ · (1/2)2 (1-θ) · (1/2)4 (1-θ)2 = (1/2)8 θ(1-θ)3

となる.

状態 <C> と,状態 <D> の尤度に関するデータはないので,これらの2つの状態をとる確率は等確率であると考えられる(1/2)。 この家系全体の観察されたデータのトータルの尤度は,

(1/2) · (1/2)8 θ (1-θ)3 + (1/2)·(1/2)8 θ(1-θ)3 = (1/2)8 θ(1-θ)3

となる(2つの事象の尤度を加えるのは,この2つの事象が背反事象だから)。 最尤法では通常尤度比(自由組み換え (θ = 0.5) の尤度に対する尤度)を用いて 0 ≤ θ < 0.5 において尤度比が最大になる θ を求める。 微分関数による極大値計算によりこの場合はθ = 0.25 の時に尤度比最大となり,1.6875 となることがわかる(LOD(Logarithm of odds)値は,0.22724)。

[例2]

図2:

一般に測定データの中に未知データが含まれている時には,マーカーのアレル頻度に応じて,各対立遺伝子が存在したときの尤度を計算し,これらの対立遺伝子対の存在確率に応じてその組み合わせである時の尤度の和から全体の尤度を計算する。 図2に示されている家系2においては,ID2 のマーカー遺伝子の遺伝子型が決定されていない。 この家系で測定したマーカー遺伝子座での各対立遺伝子は集団に3つ(アレル 1 〜アレル 3)存在し,それらの頻度を0.1,0.1,0.1 と仮定しよう。

このような未決定マーカー遺伝子が存在する時には,この未決定者にアレル頻度に応じて対立遺伝子が入ると仮定する。 もし自由に ID2 にアレルが入るとすると,遺伝子型は,1/1,1/2,1/3,2/2,2/3,3/3 の6種類である(1/2,1/3,2/3 については逆,2/1,3/1,3/2 もあるコトも考慮して)。 ここから計算される各遺伝子型の確率は,0.01,0.02,0.16,0.01,0.16,0.64 である。

ID2 に入る組み合わせについて,この家系内で実際に可能なアレルの組み合わせを選別する。 ID3,ID4 がアレル 3 を持つ事と,ID1 がアレル 3 を持たない事から,アレル 3 が ID2 に必ず存在する必要がある。 また,ID5 がアレル 1 とアレル 2 を持つことからこれらの片方が ID2 から来ている事が考えられる。 すなわち,アレル 3 を持たない 1/1,1/2,2/2 とアレル 3 しか持たない 3/3 はこの核家族内の各メンバーの対立遺伝子を含めて考えたとき,あり得ないという事が判る。 可能性のある ID2 のアレル対は,1/3 ,2/3 のみである。 手計算を行うに際しては,「あり得ない組み合わせ」は最終的に尤度が 0 (=あり得ない)となるので,最初から余計な組み合わせを考えないようにして計算過程を簡略化させていく。

さて,ここで例題1の手順に従って,原因遺伝子を持つと考えられる ID1 のハプロタイプを場合分けして考える。 この場合,<A> (A-1/N-2),<B>(A-2/N-1) の2通りに場合分けできる。 それぞれの場合において,ID2 については,先ほど有効であった場合分け,<C> 1/3(実際は, N-1/N-2),<D> 2/3(実際は, N-2/N-3)からの4つの組み合わせであり,それぞれの場合において,観測データが得られる尤度を計算する。

<A>-<C> について,ID3 については,ID1 から組み換えハプロタイプ (A-2) が,母親からはアレル 3(組み換えあるなしは関係なし)がくるので,この尤度は,(1/2)2 θ と算出される。 ID4 については,ID1 から組み換えハプロタイプ (N-1) が,母親からはアレル 3 がくるので,この尤度は,(1/2)2 θ と算出される。 ID5 については,ID1 から組み換えハプロタイプ (A-2) が,母親からはアレル 1 がくるので,この尤度は,(1/2)2 θ と算出される。

これらより,ID3,ID4,ID5 の子供が生まれる確率(=この核家族についての全体の尤度)は,

(1/2)2 θ (1/2)2 θ (1/2)2 θ = (1/2)6 θ3

となる.

同様に <A>-<D> についての家系観測データの尤度は,

(1/2)2 θ (1/2)2 θ (1/2)2 (1-θ) = (1/2)6 θ2(1-θ)

となる。

<B>-<C>については家系観測データの尤度は,

(1/2)2 (1-θ) (1/2)2 (1-θ (1/2)2 (1-θ) = (1/2)6 (1-θ)3

となる。

<B>-<D> については家系観測データの尤度は,

(1/2)2 (1-θ) (1/2)2 (1-θ) (1/2)2θ = (1/2)6 θ (1-θ)2

となる。

各場合の起こる確率を計算する。 事象 <A>,<B> はハプロタイプ情報がないので,等尤度と考えて,0.5,0.5 とする。 また,<C>,<D> は,先ほどの各アレルの頻度より,0.16,0.16 である。 よって,<A>-<C>,<A>-<D>,<B>-<C>,<B>-<D> の起こる確率は,0.08,0.08,0.08,0.08 である。

 以上より,この家系での観測データの得られる全体の尤度は,各場合分けした尤度に起こり得る確率をかけた上で和をとり,

0.08 × (1/2)6 θ3
+ 0.08 × (1/2)6 θ2 (1-θ)
+ 0.08 × (1/2)6 (1-θ)3
+ 0.08 × (1/2)6 θ (1-θ)2
= 0.08 × (1/2)6 { θ3 + θ (1-θ)2 + θ2 (1-θ) + (1-θ)3 }

となる.

最尤法によって自由組み換え (θ = 0.5) の尤度に対する尤度比が最大になる θ (0 ≤ θ < 0.5) を求める。この場合 θ=0 の時に尤度比最大で,2.000となる(LOD値,0.30103)

プログラムを利用したパラメトリック連鎖解析法 (MLINK / LINKAGE package)

各種の連鎖解析ではアルゴリズムの発表と同時にプログラムも公開されている。 ここでは,パラメトリック連鎖解析に用いられるプログラムである,LINKAGE package を用いてパラメトリック連鎖解析を行う方法を紹介する。

LINKAGE package は,Dr. Ott のグループによって開発されたプログラムパッケージである。 ここでは,MS-DOS 上で動かせるソフトの導入から実際の使用までを解説する。

(1) パッケージの取得

インターネット環境マシンを用意し,パッケージの置いてあるサーバーから目的のソフトウエアをダウンロードする。 連鎖解析関係の解析プログラムはロックフェラー大学の WWW サーバー ( http://linkage.rockefeller.edu )に非常にわかりやすい形でまとめられている。 ここを起点にして,自分の使いたいプログラムを入手する。

(2) LINKAGE package のダウンロード

「LINKAGE ANALYSIS PROGRAMS: LIST」より,LINKAGE - auxiliary programsFASTLINK を入手する。 FASTLINK は LINKAGE の改良版で,高速処理が可能になっている。今回は MS-DOS 版を用いて解析を行った。

(3) LINKAGE packageのインストール

圧縮ファイルを解くと実行形式(〜.exe)のファイルが出てくる。 今回例題とした単点解析に用いるのは,mlink.exe,unknown.exe,(これらは FASTLINK に含まれている),及び makeped.exe,preplink.exe,(これらは, LINKAGE - auxiliary programs に含まれている)である。

(4) 解析方法 (概論)

解析のための大まかな流れを示す。 最初に,家系データと遺伝子型データを示したファイル (prefile) と,マーカー遺伝子座や疾患遺伝子座についての情報,浸透率等を定義したファイル (datafile.dat) を作成する。 それぞれのファイルはテキスト形式ではあるが,後に使用するプログラムが読み込むために特殊な形式で書かれている。 これらのファイルを作るためのプログラムとして,makeped.exepreplink.exe がある。 makeped.exeprefile からpedfile.dat を作成するためのプログラムである。 このプログラムに入力するための家系ファイルは prefile 形式と呼ばれる,入力に簡単な形式で記述しておく。 一方,preplink.exeは,対話形式で datafile.datを作成していく。

prefile 形式は,家系データを記述するための一形式である。 Linkage package だけでなく,ノンパラメトリック連鎖解析ソフトである,Mapmaker/Sibs や GeneHanter 等でもこの形式での入力が利用できる(いわゆる Linkage 形式)。 行 (row) に一人のデータを記述させ,列 (column) 毎に入力項目がある。 1列目に家系の番号(数字または文字),2列目は個人 ID (以降,数字のみ),3列目は父親の ID (親が家系ファイルに記述されていない場合は 0),4列目は母親の ID (父親の場合と同様),5列目は性別(男性:1,女性:2),6列目に疾患の有無(罹患:2,非罹患:1,不明:0),以降2列ずつマーカー遺伝子座のアレル番号(不明な場合は 0)となる。 以下に具体例により示していく。

[例1]

図1に示された家系について,プログラムを用いて解析してみる。 まずは prefile を作成する。 はじめに図1の家系メンバーの ID ナンバーを用いて prefile データを記述していく。 この家系の prefile は図3のように記述される。このデータをテキスト形式で prefile.dat として保存して,makeped.exe にかける。 出力ファイルは,pedfile.dat とする。

1 1 0 0 3 0 0 2 0  1  1  2  Ped: 1  Per: 1
1 2 0 0 3 0 0 1 1  2  3  4  Ped: 1  Per: 2
1 3 2 1 0 4 4 2 0  1  2  4  Ped: 1  Per: 3
1 4 2 1 6 0 0 1 0  2  1  4  Ped: 1  Per: 4
1 5 0 0 6 0 0 2 0  1  1  2  Ped: 1  Per: 5
1 6 4 5 0 7 7 2 0  2  1  4  Ped: 1  Per: 6
1 7 4 5 0 0 0 2 0  1  1  1  Ped: 1  Per: 7

図3 : 図1 の家系の pedfile

Window 上から,makeped.exeを起動すると,DOS窓が開き,makeped.exe が起動する。 ここで入力ファイル名,出力ファイル名等を入力していく。


Pedigree file -> ./prefile.dat

Output file   -> ./pedfile.dat



Does your pedigree file contain any loops?    (y/n) -> n



Do you want probands selected automatically?   (y/n) -> y

図4: makeped.exe の画面イメージ

ここで pedfile.dat が出力される。 できた pedfile.dat の中身には図3のように記述されている。

次に,preplink.exe を動かして datafile.dat を作成する。 preplink.exe によって datafile.dat を作る具体的手順はやや煩雑なので,以下に概要のみを述べることにする。 実際にソフトを動かしながらやってみてほしい。

まず,preplink を起動する。 我々は,疾患のあるなしに関する遺伝子座とマーカー遺伝子座の二つを定義したい。 preplink では (a) binary factors,(b) quantitative trait,(c) affection status,(d) allele numbers の4つのタイプの locus type を選ぶことができる。 ここで,疾患のあるなしの遺伝子座として (c) を,マーカー遺伝子座として (d) のタイプを選ぶ。

疾患のあるなしの遺伝子座については (a) number of alleles を 2 に,(b) number of liability classes を 1 に,浸透率 (penetrances) については genotype 1 1 に 0,genotype 1 2 に 1,genotype 2 2 に 1(即ち完全優性で,1 が正常アレル,2 が疾患アレルとなった)を入れ,(d) gene frequency を 0.999 0.001 (即ち,極めて稀な遺伝病遺伝子で疾患アレル頻度は 0.001)とする。

マーカー遺伝子座については,(a) number of alleles をこの場合は4に,gene frequenciesをそれぞれ 0.025 とする(実際の集団の頻度が判っている場合はそれを入れる)。 ただし,家系に遺伝子型が未知の個体が無い場合は gene frequencies は全く関係ないので入れても無駄なのだが,その場合でも一応値は入れておく。 ここで,二つの遺伝子座のそれぞれの定義が終わったことになるが,引き続き他の条件を入力する。 (b) Sexlinked (N),(c) Calculate Risk (N),(d) Mutation (N),(e) Haplotype frequencies (N),(f) Locus Order (1 2),(g) Interference (N),(h) Recombination sex difference (N),(i) Program used (MLINK),(j) Recombination values (0.100) は default value(かっこの中)でよい。

ここで,(f) Locus Order は定義した遺伝子座の初期の順番で,1 は疾患のあるなしの遺伝子座,2 はマーカー遺伝子座がこのようにならんでいることを示す。 マーカー遺伝子座が2つ以上あるときは(我々の場合には1つである),例えば1 2 3などとする。 この場合は遺伝子座の順番は初期値で,1 の疾患のあるなしの遺伝子座を 2 の左,2 と 3 の間,3 の右というふうに順番に動かしていく(例えば linkmap プログラム)。 (j) Recombination values はこれらの遺伝子座の間の組み換え割合であるが,default の 0.1 とは,疾患のあるなしの遺伝子座とマーカー遺伝子座の間の組み換え割合の初期値が 0.1 であることを示す。 これは mlink のプログラムの中で変化させるので,これは初期値である。 マーカーが2個以上ある場合は Recombination values は,例えば 0.1 0.08 などとなる(疾患のあるなしの遺伝子座 1 とマーカー遺伝子座 2 の組み換え割合の初期値が 0.1,マーカー遺伝子座 1 と 2 の間の組み換え割合の固定値が 0.08 であることを示す;Locus order が 1 2 3 の場合)。

preplink による作業はファイル名を入れて書き込めば終了である。 出力ファイル名を datafile.dat とし,これを(ワープロなどで)読んでみると図5のようになっている。

 2 0 0 5  >> NO. OF LOCI, RISK LOCUS, SEXLINKED (IF 1) PROGRAM 
  0 0.0 0.0 0 >> MUT LOCUS, MUT MALE, MUT FEM, HAP FREQ (IF 1) 
   1  2
 1   2  >> AFFECTION, NO. OF ALLELES
   0.99900  0.00100 >> GENE FREQUENCIES
  1 >> NO. OF LIABILITY CLASSES
  0  1.0000  1.0000 >> PENETRANCES
 3   4  >> ALLELE NUMBERS, NO. OF ALLELES
   0.25000  0.25000  0.25000  0.25000 >> GENE FREQUENCIES
  0 0  >> SEX DIFFERENCE, INTERFERENCE (IF 1 OR 2)
   0.00000000 >> RECOMBINATION VALUES
  1 0.05000 0.50000 >> REC VARIED, INCREMENT, FINISHING VALUE

図5:datafile.dat の内容例

次に,unknown.exe を実行させる。 unknown.exe は,pedfile.dat,datafile.dat が存在する時に正しく動く。 unknown.exe の実行により,さらに,ipedfile.dat,speedfil.dat の2ファイルが新たに作成される。 最後に,mlink.exeを実行させる。 実行が終了すると,final.dat,outfile.dat,stream.dat ファイルができる。 outfile.datに各 θ での LOD 値が算出されている( 0 ≤ θ <0.5,0.05 おき)。 これらの値をまとめると下記のようになる

---------------------
theta         LOD
---------------------
0.000       -infinity
0.050       -0.163739
0.100        0.066848
0.150        0.168468
0.200        0.214420
0.250        0.227244
0.300        0.216535
0.350        0.186928
0.400        0.140634
0.450        0.078421
0.500        0.000000
---------------------

これよりこの検討においては θ=0.250 のときに,LOD 値が最も大きくなり,0.227244 となった。 今回用いた mlink では,θ を一定値間隔で動かして LOD 値を求めていくので,これだけでは θ=0.250 において最大であるかどうかは判らない。 ilink を用いると最大 LOD 値を示す θ を算出することが可能である。

[例2]

図2の家系図を元にして,prefile.dat を作成する。 この家系での prefile.dat は下記のようになる

 1  1  0  0  1  2  1  2 
 1  2  0  0  2  1  0  0 
 1  3  1  2  2  2  2  3 
 1  4  1  2  1  1  1  3 
 1  5  1  2  1  2  2  1

次に preplink.exe を用いて,datafile.dat を作成する。アレル数は3であり,アレルの存在比は,0.1 0.1 0.8 である。 作成した,datafile.dat は下記のようになる。

 2 0 0 5  >> NO. OF LOCI, RISK LOCUS, SEXLINKED (IF 1) PROGRAM 
  0 0.0 0.0 0 >> MUT LOCUS, MUT MALE, MUT FEM, HAP FREQ (IF 1) 
   1  2
 1   2  >> AFFECTION, NO. OF ALLELES
   0.99900  0.00100 >> GENE FREQUENCIES
  1 >> NO. OF LIABILITY CLASSES
  0  1.0000  1.0000 >> PENETRANCES
 3   3  >> ALLELE NUMBERS, NO. OF ALLELES
   0.10000  0.10000  0.80000 >> GENE FREQUENCIES
  0 0  >> SEX DIFFERENCE, INTERFERENCE (IF 1 OR 2)
   0.00000000 >> RECOMBINATION VALUES
  1 0.05000 0.50000 >> REC VARIED, INCREMENT, FINISHING VALUE

makeped.exe にて prefile.dat から,pedfile.dat を作成した後,unknown.exe,mlink.exe を実行させる。 得られた,outfile.dat から各 θ での LOD 値をまとめると下記のようになる。

---------------------
theta         LOD
---------------------
0.000        0.301030
0.050        0.257679
0.100        0.214844
0.150        0.173186
0.200        0.133539
0.250        0.096910
0.300        0.064458
0.350        0.037426
0.400        0.017033
0.450        0.004321
0.500        0.000000
---------------------

これよりθ= 0.000のときに,LOD値が最大になり,0.301030となることが判る。

これら(例1,例2)のプログラムによる解析方法の結果は先ほど,手計算で行ったものと良く一致する結果であることが判る。



最終更新日:2001/12/05 (Wed.)