ノンパラメトリック連鎖解析
 ノンパラメトリック連鎖解析とは、遺伝形式を仮定せずに行う連鎖解析の総称である。しかし、最も多く行われるノンパラメトリック連鎖解析は、罹患同胞対解析なので、それについて主として解説する。

   しかし、それ以外にも、同胞対以外の家系構成員のペアを用いたり、ペアのみを比べるのではなく、その家系の患者全体で共有する遺伝子を数えるなどの方法もある。

 ノンパラメトリック連鎖解析(罹患同胞対解析)の計算手法
 罹患同胞対解析は、ノンパラメトリック連鎖解析の中で良く用いられる解析手法の一つである。ノンパラメトリック連鎖解析は、遺伝形式(常染色体優性、等)や、浸透率を仮定せずに解析が行えるため、複合的な遺伝形式をとる場合や、浸透率が予測できない時にでもパワーを落とさずに解析が可能である。罹患同胞対解析(Affected sib-pair analysis)では、罹患した兄弟を含む家系を集め、これら家系での観察データを元に尤度計算を行い疾患と連鎖したマーカー遺伝子座領域を絞り込んでいく。ここでは何個かの具体例について、手計算により尤度を求めることを行い、この解析手法の理解を深めたいと思う。

  罹患同胞対解析の原理を簡単に示す。はじめに一般的な(罹患していない)兄弟の集団について考えてみる。今、一つの遺伝子座について考えるとき、子は片親の二つのアレルの内、一つを受け取る(片親がホモ接合体だとしても、それぞれのアレルは異るとここでは考える)。従って、兄弟はこの時、同じアレルを受け取る場合と、異ったアレルを受け取る場合がある。子はそれぞれ二つのアレルを両親から1つずつ受け取るので、兄弟が同じアレルを(両親由来を考慮して)何個受け取るかを考えると、0、1、2の場合がある。この3つの場合をIBD (identity by descent) 0、1、2と言う。多くの兄弟のペアを考えるとIBD=0のペア、IBD=1のペア、IBD=2のペアの数を数えることができるはずである。その数の割合は確率法則より、一定の割合(1:2:1)となる。

  これに対して、罹患同胞対(疾患が発症している兄弟)を集めてきて、この集団について同じように調べたとき、もし観察したマーカー遺伝子が疾患と連鎖している場合はこの比(1:2:1)がずれる(IBD=2のペアの数が増え、IBD=0のペアの数が減る)と考えられる。ちなみに、疾患遺伝子と連鎖していないマーカー遺伝子では、任意な兄弟と同じ配分(=1:2:1)になると考えられる。罹患同胞対解析においてはこの仮説を利用し、罹患同胞対におけるアレルの共有する割合のズレを指標に観察データの尤度を算出する。 尤度は、次のように表される。

ここでwijはj番目の家系の罹患同胞対がIBD=iである確率である。変数はz = (z0, z1, z2)であり、自由度は2(z2 = 1 - z1 - z0、独立変数は、z0、z1の2つのみ)である。マーカー遺伝子と、疾患遺伝子が連鎖していないとき(即ち、z0=0.25、z1=0.5、z2=0.25)の尤度との比をとり、尤度最大化法(最尤法)により、尤度最大となるzを求める。以下に具体的な例題を示し、手計算により尤度計算を行って最大尤度を示すzとその時のLOD scoreを求める。

 尤度の計算法

 基本的には各家系毎に各IBD(IBD=0, 1, 2)に場合分けして考える。これらの場合(IBD=0, 1, 2)は互いに独立かつ並列である(よって最後にこれらの尤度についての和をとることになる)。

 各IBDでの同胞対の遺伝子型が出現する確率の算出法

 尤度を計算するにあたって、各IBDのときの両親からくる遺伝子の配分を視覚的に理解できる記述方法を紹介する。今2x2のマトリクスを考え、横方向に父親の2つのアレル、縦方向に母親の2つのアレルを置く。マトリクスの中には父親から1つ、母親から1つのアレルを譲り受けた時の新たに作成される遺伝子型が記述されることになる。これがこの両親の間に作られた子供の受け継ぐ遺伝子型の総てとなる。各マトリクス内は等確率で起こると考えられる。

 ここで、2人の子供が得られるときを考える。IBD=0とは、両方の両親の持つ2つのアレルをそれぞれの子供が受け継ぐことである。IBD=0の2人の子供の遺伝子型をマトリクス内に記述すると、互いに対角線上に配置されるはずである。同様にして、IBD=1の同胞について考えると、これら2人の関係は互いに隣のマス内に配置されることになる。またIBD=2のときには同じマス内にくる事になる。



  [例題1]

各IBDの場合についての確率計算

 両親の持つ遺伝子型が決まっているので、マスメの中に入る遺伝子型(子供のとる遺伝子型)が総て記述される。この中で、IBD=0のときの子供の生じる可能性(条件付き確率)を考える。IBD=0は、1/3-2/4、2/3-1/4しか生じないことが容易にわかる。

 すなわちこの両親からIBD=0では、1/3-1/3の同胞対は生じないことが判る。同様にしてIBD=1についても、この両親の遺伝子型からは生じない事が判る。IBD=2の時、とり得る同胞対の遺伝子型の可能性は、1/3-1/3、2/4-2/4、1/4-1/4、2/4-2/4の4通りである。これらは総て等頻度におこるので、もし、IBD=2の同胞対の集団を集めたときに遺伝子型が1/3-1/3となっている集団の割合は、1/4であることが判る(IBD=2において、1/3-1/3の条件付き確率が1/4である)。これより、例題1の家系の観察されたデータの尤度( L(z) )は、

   L(z) = z0 x 0 + z1 x 0 + z2 x 1/4  = 1/4 x (1 - z0 - z1)

となる。 一般の同胞対についての尤度(=連鎖がない時の尤度)、L(a) は、a = (0.25, 0.5, 0.25) を代入する事により得られる。よって、尤度比、 L(z) / L(a) は、

   L(z) / L(a) = {1/4 x (1 - z0 - z1)} / {1/4 x (1 - 0.25 - 0.5)} = 4 x (1 - z0 - z1)

尤度比の最大化法

 変数z (= (z0, z1, z2) ) はホールマンの三角形と呼ばれる領域内を動くことが知られている。

   ( 0≦z0≦0.25、0≦z1≦0.5、 z1≧ 2 x z0)

 これらの領域中で尤度比、4 x (1 - z0 - z1) が最大化されるzを探せばよい。 いま、4 x (1 - z0 - z1) = L とおくと、これを変形して、z1 = -z0 + 1 - L/4
条件を満たすzについてLが最大化されるところは、上記の式中のz1切片である、1 - 4/Lが最小化されるところである。これをグラフより求めると、z0=0、z1=0のときにLは最大化されて、4であることが判る。よって、LODスコアは、log4 = 0.602となる。また、この時のzはz = (0, 0, 1)であることが求められる。

 答え、z = (0, 0, 1)のとき、LOD = 0.602




  [例題2]

IBD=0、確率0 (ありえない)
IBD=1、確率1/4
IBD=2、確率1/2
より尤度、 L(z) は、

   L(z) = z0 x 0 + z1 x 1/4 + z2 x 1/2
     = 1/4 x (2 - 2 x z0 - z1) 

となる。


よって、尤度比、 L(z) / L(a) は、

   L(z) / L(a)
   = {1/4 x (2 - 2 x z0 - z1)} / {1/4 x (2 - 2 x 0.25 - 0.5)}
   = 2 - 2 x z0 - z1( =Lとする)

これより変形して、

   z1 = -2 x z0 + 2 - L

Lを最大化するには、z1切片、2-Lが最小化。 これよりL = 2

 答え、z = (0, 0, 1) のとき、 LOD = 0.301で最大となる




  [例題3]

IBD=0、確率1
IBD=1、確率1
IBD=2、確率1
より尤度、 L(z) は、

   L(z) = z0 x 1 + z1 x 1 + z2 x 1
   = z0 + z1 + z2 = 1 

となる。 よって尤度比も、 L(z) / L(a) = 1

 答え、常にLOD = 0でzは決まらない。

 これは、このように両親の遺伝子型の組み合わせによっては、組み換え情報が全く得られない事があることを示している。両親の遺伝子型のヘテロ接合割合が高いほど組み換え情報が多く含まれており、この例のように、ホモ接合体同士の場合、ソコからの組み換え情報は全く得られない事になる。





  [例題4]

 母親のとり得る遺伝子型を予測して場合分けをする。

 今このマーカーのアレイ1、2(遺伝子頻度、0.2, 0.8)がある場合、組み合わせとしては(1/1, 1/2, 2/1, 2/2)の4つがあるが二人の子供に1/2があり、父親が1/1であることから可能性があるのは、1/2 (2/1), と2/2であることが判る。 また、その遺伝子型を持つ親の全体からの割合は、 8/25(1/2, 2/1の場合)、16/25(2/2の場合)である(事前確率)。 各場合について、IBD=0, 1 , 2について考え、それぞれの場合での尤度を算出した後に全体の尤度を算出する。

(A)母親の遺伝子型が1/2 (2/1)の場合

IBD=0、確率0
IBD=1、確率1/4
IBD=2、確率1/2
より尤度 L(z)A は、

   L(z)A = z0 x 0 + z1 x 1/4 + z2 x 1/2 = 1/4 x (2 - 2 x z0 - z1)

となる。

(B)母親の遺伝子型が2/2の場合

IBD=0、確率1
IBD=1、確率1
IBD=2、確率1
より尤度 L(z)B は、

   L(z)B = z0 x 1 + z1 x 1 + z2 x 1
   = z0 + z1 + z2 = 1

となる。

 全体の尤度は、各場合の尤度に事前確率をかけて和をとったものになるので、

   L(z) = 8/25 x L(z)A + 16/25 x L(z)B
   = 8/25 x 1/4 x (2 - 2 x z0 - z1) + 16/25 x 1

尤度比をとると、

   L(z) / L(a) = (10 - 2 x z0 - z1)/9 ( =L )

変形して、z1 = -2 x z1 + 10 -9L
Lを最大化させるzを求めると、 L= 10/9, LOD = log(10/9) = 0.045

 答え、LOD = 0.045 , z = (0, 0, 1)




  [例題5]



 両親のとり得る遺伝子型を予測して場合分けをする。

 今このマーカーのアレイ1、2(遺伝子頻度、0.2, 0.8)を(a, b)として考えた場合、子供の遺伝子型からとり得る親の遺伝子型の組み合わせ、並びに集団内でその遺伝子型の両親が存在する割合は次ページの表のようになる。両親の組み合わせとしては7つの組み合わせがあるが、尤度計算をする上では3つのタイプ(A〜C)に分類できる。

すなわち、両親の遺伝子型が互いにヘテロである場合(A:1/2-1/2)、ヘテロ・ホモである場合(B:ex.1/1-1/2, 2/2-1/2 etc)、互いにホモである場合(C:1/1-2/2, 2/2-1/1)である。これらそれぞれの場合の尤度を計算する。

(A)ヘテロ・ヘテロの場合

IBD=0、確率1/2
IBD=1、確率0
IBD=2、確率1/2
より尤度 L(z)A は、

   L(z)A
   = z0 x 1/2 + z1 x 0 + z2 x 1/2
   = 1/2 x (1 - z1)

となる。

(B)ヘテロ・ホモの場合

IBD=0、確率0
IBD=1、確率1/4
IBD=2、確率1/2
より尤度 L(z)B は、

   L(z)B = z1 x 1/4 + z2 x 1/2
   = 1/4 x (2 - 2 x z0 - z1)

となる。

(C)ホモ・ホモの場合

IBD=0、確率1
IBD=1、確率1
IBD=2、確率1
より尤度 L(z)C は、

   L(z)C = z0 + z1 + z2 = 1

となる。

 各場合の尤度に事前確率をかけて和をとり全体の尤度をとると

   L(z) = 4a2b2 x L(z)A + (4ab3 + 4a3b) x L(z)B + 2a2b2 x L(z)C

a=0.2, b=0.8を代入して、更に尤度比をとると、

   L(z) / L(a) = (50 - 34 x z0 - 25 x z1) / 29 ( = L ) (途中計算省略)

これより、z1 = -34/25 x z0 + 2 - 29/25 x L と条件を満たすzでLを最大化させればよいことが分かる。 これより、z = (0, 0, 1) のとき、Lは最大となって1.609 (LOD = 0.206)

 答え、z = (0, 0, 1)のとき、LOD=0.206




  [例題6]

 例題1の家系にもう一人、非罹患同胞の遺伝情報が加わったものである。この時の罹患同胞対での尤度計算は、例題1の時と全く同じである。すなわち、この家系の観察データに対する尤度は、非罹患同胞がない場合と全く同じになる。

 答え、z = (0, 0, 1)のとき、LOD = 0.602

 この例のように、罹患同胞対解析においては、両親の遺伝子型が判明していような場合、非罹患同胞の遺伝子型データは解析にはなんら寄与しない事になる。





  [例題7]



 例題5の家系にもう一人、非罹患同胞の遺伝情報が加わったものである。この家系では、両親のとり得る遺伝子型の可能性が例題5の場合と違ってくる。

 両親のとり得る遺伝子型は、2人の罹患同胞、及び一人の非罹患同胞の遺伝子型より、 (1/1-1/2, 1/2-1/1, 2/2-2/2)の3通りしかとり得ないことが判る。すなわち全体の尤度は、例題5の場合分けを利用して表すと、

   L(z) = 4a2b2 x L(z)A + 4a3b x L(z)B

a=0.2, b=0.8を代入して、更に尤度比をとると、

   L(z) / L(a) = (10 - 2 x z0 - 9 x z1) / 5 ( = L ) (途中計算省略)

これより、z1 = -2/9 x z0 + 2 - 9/5 x L と条件を満たすzでLを最大化させればよいことが分かる。 z = (0, 0, 1) のときに、尤度比は最大値2をとる。

 答え、 LOD= 0.301, z = (0, 0, 1)

 このように罹患同胞対解析では、両親の遺伝子型に不明なものがあるとき、非罹患同胞の遺伝子情報は解析に有力な情報を提供することが判る。


[
形質マッピングホームページTOP]