なぜ20種類以上、必要なアミノ酸は増えなかったのですか?

20amino-acids

質問の人
たった20種類のアミノ酸だけで、膨大な種類の多様なタンパク質が生まれることに驚くのですが、では何故20種類だったのでしょうか?
この数には何か意味があるのでしょうか?

なぜ、多くの生物が使用するアミノ酸の種類が20種で、21種や22種ではないのか(この地球上には例外的に21番目アミノ酸(セレノシステイン)や22番目アミノ酸(ピロリシン)を使っている生物もいるのですが)。アミノ酸の種類がなぜ20種なのかを厳密に説明することはできません。しかし、私はなぜ、(ほぼ)20種なのかについては、次のように考えて説明できると思っています。

その第1の理由は[GADV]-アミノ酸が、その4種のアミノ酸をランダムにつないでも、その表面に様々な触媒活性を持ち得る水溶性で球状の[GADV]-タンパク質を高い確率で形成できるという、十分に能力の高いアミノ酸であるということです。

第2の理由は、その4種の[GADV]-アミノ酸をコードするGNC原初遺伝暗号から遺伝暗号の進化が始まったのですが、5番目のアミノ酸であるグルタミン酸(Glu:[E])をGNC原初遺伝暗号につけ加え、GNS原始遺伝暗号に進化する際は、グルタミン酸をつけ加えて作られる[GADVE]-タンパク質の能力が[GADV]-タンパク質よりも高くなる時にだけ、5番目のアミノ酸として使用するという仕組みがあったからなのです(当然のことなのですが、5番目のアミノ酸を加えて作ったタンパク質の能力が[GADV]-タンパク質よりも低くなった場合には、そのアミノ酸を遺伝暗号には取り込まず[GADV]-アミノ酸を使い続けることになります)。

このようなことが繰り返され6番目のアミノ酸、7番目のアミノ酸・・・と、一歩ずつより高い能力を発揮できるアミノ酸をその前段階の遺伝暗号に取り込むことによって形成されたのが10種のアミノ酸([GADVE]-アミノ酸+Leu:[L], Pro:[P], His:[H], Gln:[Q], Arg:[R])をコードするSNS-原始遺伝暗号です。したがって、SNS-原始遺伝暗号によってコードされるタンパク質を使って生きる生物の能力は、わずか10種のアミノ酸しか使っていないにもかかわらず、極めて高い能力を発揮できる生物であったと考えることができます(実際、現在の地球上に棲息しているGC含量の高い微生物はSNS遺伝暗号によってコードされる10種のアミノ酸を75%ほども使って生きています)。

こうして、SNS-原始遺伝暗号の成立後も、さらに11番目、12番目・・・とアミノ酸を付加し、タンパク質の能力を一歩ずつ高めながら現在の20種のアミノ酸をコードする普遍遺伝暗号(標準遺伝暗号とも呼ばれますが)となっているのです。このようにして、現在の普遍遺伝暗号に至っているため、普遍遺伝暗号でコードされる20種のアミノ酸で作られるタンパク質の能力は極めて高いものになっています。そのため、人間を初めとする地球上のすべての生物が生きていく上で必要なすべてのタンパク質をこの20種のアミノ酸だけで作り上げることができるのです。その結果、例外的なものを除いて、21番目や22番目のアミノ酸を使用する必要がなくなっているのです。

また、私は遺伝暗号の形成と進化を、GNC(Gの段のアミノ酸をコードする)遺伝暗号から始まり、Cの段の遺伝暗号を捕獲(使用)しSNS原始遺伝暗号を形成した後、Aの段、Uの段の遺伝暗号の捕獲と使用という順で遺伝暗号が進化したと考えていますが、このことを支持する証拠として次のような遺伝暗号の特徴を挙げることができます。(1)Gの段には非普遍遺伝暗号が全く発見されていないこと、(2)非普遍遺伝暗号の数が、Cの段、Aの段、Uの段の順に多くなっていること、を挙げることができます。なぜなら、初期の遺伝暗号ほどより重要で基本的であるため、非普遍遺伝暗号が使用される頻度が少なく、Aの段以降のように、後期になって遺伝暗号を捕獲・使用する際には、枝分かれするように非普遍遺伝暗号が使用されたのです。そのため、Aの段やUの段で非普遍遺伝暗号が多く使用されていると考えることができるからなのです。