コドンとアミノ酸をもっと1:1で割り当ててやれば、さらに多くの種類のアミノ酸を活用したタンパク質ができそうな気がしますが、なぜコドンは重複しているのでしょうか?
コドンが縮重している理由についてですが、私は次のように考えています。即ち、遺伝暗号が縮重していることによって、センス側のアミノ酸に変化を及ぼすことなく(遺伝子がコードするタンパク質のアミノ酸配列に変化を及ぼさず)、コドンの第3塩基位置で塩基を置換することが可能となっています。そのような状況の中にあるからこそ、センス配列でコードされているタンパク質に影響を与えることなく、アンチセンス配列のコドンの第1塩基位置での変化を生み出すことが可能となっているのです。
そうすることで、アンチセンス配列がコードするアミノ酸配列を変化させ(シャッフルさせ)、アンチセンス配列から新たな遺伝子(とそれがコードするタンパク質)を生み出す可能性(確率)を高めているのです。言い換えれば、遺伝暗号がコドンの第3塩基位置で縮重しているからこそ、同じ遺伝子のアンチセンス配列から全く新規なタンパク質が生まれる確率を上げることができ、生命が進化しやすくなっていると考えることができます。逆に考えますと、現在の普遍遺伝暗号に見られるような縮重のない遺伝暗号を使用する世界では、新規遺伝子の生成確率が小さくなり、現在の地球上で見られるような多様な生物の繁栄は起こらなかったのではと考えられるのです。
(2019年11月6日追記)
この問題も重要でありながらまだ解決されていない問題の一つです。ただ、私は遺伝暗号の起源と進化に関してGNC-SNS原始遺伝暗号仮説を提唱していますが、その仮説に添って考えますと以下のように説明することができます。
- まず最初に、コドンが重複してない4種の [GADV]-アミノ酸をコードするGNC原初遺伝暗号が確立した。
- 次に、グルタミン酸をコードするGAGコドンが捕獲された。
- しかし、GACがコードするアスパラギン酸とグルタミン酸はどちらも親水性の大きな アミノ酸であるため、グルタミン酸の使用量が増えるに伴って、親水性が過剰となる 不都合が生まれたと考えられます。これを解消するためにGlyがGGSを、AlaがGCSを、ValがGUSを使用するというようにコドンの第3塩基位置でCとGを使用する重複が起こったのだと考えられます。
- 続いて、Cで始まるコドンを使用するCNSの捕獲が行われ、SNS原始遺伝暗号が完成した。
- これ以降の適当な時期に、遺伝暗号はSNSからSNNを使用するというように、コドンの第3塩基位置で同じアミノ酸が、2つまたは4つのコドンを使用する重複が起こったのではと想像しています。
- 次に、Aで始まるコドンを使用するANNの捕獲、Uで始まるコドンを使用するUNNの捕獲へと進み、最後までアミノ酸をコードするコドンとして使用されなかった遺伝暗号が停止暗号として残った。
と考えています。
なお、第3塩基位置で重複が見られるのは、GC含量の高い遺伝子のアンチセンス鎖から全く新規な遺伝子を生み出す際に、センス鎖上の遺伝子がコードするアミノ酸配列に影響を与えることなく、アンチセンス鎖から多様なアミノ酸配列を生み出すことが可能となり全く新規なタンパク質を生み出す幅を広げることに役立ったのではと考えています。また、このように遺伝暗号の重複についてもGADV仮説と密接に関連したGNC-SNS原始遺伝暗号仮説にしたがって合理的に説明できることが分かります。このことも、私(池原)の立場から見ますとGADV仮説が妥当であることを示しているように思えます。