B
遺伝子は4通りの文字A,C,G,Tの配列からなり, 世代ごとに引き継がれていくが,この配列は世代とともに変化していく可能性がある.遺伝子の配列のデータから生物の系統関係などを推定するためには配列の聞のへだたりを表す量を導入することが重要である.ここでは,以下のような単純化されたモデルを用いて,遺伝子の配列の世代による推移を考察してみよう.
遺伝子の配列の一つの文字について,これが次の世代に引き継がれるときに,他の3通りの文字に置き換わる確率を,それぞれ とする.ここで, は を満たす実数とする.ある文字がそのまま次の世代に引き継がれる確率は である.例えば文字Aが
A→A→C
と推移する確率は
である.
最初の世代における遺伝子の配列の一つの文字Aに注目する.これが 番目の世代においてAである確率を で表す.ここで最初の世代は 0 番目と数える.また,0 番目の世代においてAである文字が 番目の世代において C となる 確率を で表す.
(B-1) を と を用いて表せ.
(B-2) と をそれぞれ と を用いて表せ.
遺伝子の文字の配列が世代によって変化していく様子を考える.例えば,配列が
AAC→AAC
と推移する確率は
である.また,文字の配列が3世代目までに
AAAA→CAAA→CAAT→AACT
と推移するとき,0 番目の世代の最後の 2 文字 AA が 3番目の世代では CT に変化している. 個の文字の配列からなる遺伝子について 番目の世代の遺伝子の配列を 0 番目の世代と比較して異なっている文字数の期待値を とする.
(B-3) を を用いて表せ.
上の(B-3)で求めた式を用いることにより 2つ配列を比較して異なっている文字数を求めると,それらの聞がおよそ何世代へだたっているかを推定することができる.
(B-4) を大きくしていくと, の値は に近づくことを示せ.
2021.02.09記
マルコフ過程.
期待値の和=和の期待値
(B-1)
(B-2) (B-1) と から だから,
(B-3) 特定番目の文字が異なる確率は であるから,異なる文字数の期待値は
(B-4) より だから