Spieler Spieler О сайте
  Айзек Азимов :: Генетический код >> переводы Дмитрия Лихачева (Spieler)

Переводы
Песни (mp3)
 
 


Глава 11
Взлом кода
Триплеты


На протяжении всех предыдущих глав я намеренно избегал одного из главных вопросов синтеза белков - как же все-таки на основе нуклеиновой кислоты можно сделать белок? Сейчас мы уже можем его конкретизировать: каким образом на основе той или иной матричной РНК можно синтезировать ту или иную полипептидную цепочку?

На первый взгляд, решению этой проблемы может помешать все то же обстоятельство, о котором уже упоминалось. Нуклеиновая кислота - это "предложение", составленное из четырех "слов" - нуклеотидов, а белковая молекула - из двадцати двух "слов" - аминокислот. Каким образом информации, закодированной всего четырьмя символами, может быть достаточно, чтобы передать то же самое, что принято кодировать двадцатью двумя?

Сперва такие соображения могут сбить с толку, но на самом деле проблемы тут нет. Просто шаблонность нашего мышления заставляет сразу вспоминать о методах перекодирования, при которых один символ строго соответствует другому, как в публикуемых в газетах головоломках. Так, допустим, если принцип кодирования заключается в подстановке вместо каждой буквы следующей за ней в алфавите, то слово, например, БЕЛОК в перекодированном виде будет выглядеть, как ВЖКПЛ.

Однако те коды, которыми мы пользуемся чаще всего, используют другие принципы. Например, у нас в английском алфавите всего 26 букв, и их вполне достаточно, чтобы закодировать более 450 000 слов, содержащихся в третьем новом международном словаре Вебстера. Десяти символов - цифр от нуля до девяти - тоже достаточно для того, чтобы закодировать бесконечное число цифр; более того, на самом деле для этого достаточно всего двух символов - 0 и 1, именно с их помощью кодируются все цифры в компьютерах.

Все, что нужно для этого сделать - это договориться о правилах группировки используемых символов.

Тогда, наряду с 26 буквами мы получаем 26 х 26 = 676 двухбуквенных сочетаний, 26 х 26 х 26 = 17 576 трехбуквенных, и так далее. То же самое можно сказать и о цифрах. Однозначных чисел может быть всего 9, двузначных - уже 99, трехзначных - уже 999, и так далее.

Следовательно, говоря о переводе нуклеотидов в аминокислоты, мы должны отбросить представления о переводе "знак-в-знак", а вместо этого принять нуклеотиды за элементы многозначных единиц. Да, матричная РНК может оперировать лишь четырьмя нуклеотидами, но это значит, что она может составлять из них 4 х 4 =16 динуклеотидных комбинаций и 4 х 4 х 4 = 64 тринуклеотидных комбинаций (триплетов). Все они приведены на рис. 51, где четыре нуклеотида обозначены своими инициалами - У - уридиловая кислота, Ц - цитидиловая, А - адениловая и Г - гуаниловая кислота.


Рис. 51. Сочетания нуклеотидов.
А Г Ц У
4 нуклеотида
АА АЦ ГА ГЦ ЦА ЦЦ УА УЦ
АГ АУ ГГ ГУ ЦГ ЦУ УГ УУ
16 динуклеотидов
ААА АЦА ГАА ГЦА ЦАА ЦЦА УАА УЦА
ААГ АЦГ ГАГ ГЦГ ЦАГ ЦЦГ УАГ УЦГ
ААЦ АЦЦ ГАЦ ГЦЦ ЦАЦ ЦЦЦ УАЦ УЦЦ
ААУ АЦУ ГАУ ГЦУ ЦАУ ЦЦУ УАУ УЦУ
АГА АУА ГГА ГУА ЦГА ЦУА УГА УУА
АГГ АУГ ГГГ ГУГ ЦГГ ГУГ УГГ УУГ
АГЦ АУЦ ГГЦ ГУЦ ЦГЦ ЦУЦ УГЦ УУЦ
АГУ АУУ ГГУ ГУУ ЦГУ ЦУУ УЦУ УУУ
64 тринуклеотида (триплета)
[стр. 163]

Теперь перед нами встает новый вопрос. Динуклеотидов слишком мало, чтобы кодировать все аминокислоты, а тринуклеотидов слишком много. Ну, недостаточным количеством мы обойтись не можем никак, так что остается только сразу перейти к триплетам.

Естественно предположить, что мы могли бы пользоваться и динуклеотидами, и тринуклеотидами, набрав в целом необходимые нам двадцать два составных знака (если мы говорим о двадцати двух аминокислотах, разумеется). Но этот вариант не годится из-за того, что белок не сможет различать границ между знаками - то есть, например, является ли сочетание АЦ динуклеотидом, или частью триплета, скажем, АЦГ.

А если бы мы проскочили триплеты и обратились бы сразу к квадроплетам, то мы бы просто запутались в этих 4 х 4 х 4 х 4 = 256 различных комбинациях из четырех нуклеотидов. Так что сосредоточимся лучше на триплетах, и посмотрим, годятся ли они для нашей цели.

Было произведено несколько попыток урезать число используемых триплетов для того, чтобы избежать нерациональной избыточности - траты 64 триплетов на всего 22 аминокислоты. Например, можно предположить, что нуклеотидная цепь читается с наложением, как показано на рис. 52. С помощью таких систем наложенных триплетов (обычно более сложным образом) можно свести число используемых тринуклеотидов аж к двадцати.

Рис. 52. Наложение кодов.
Г Ц У Ц А Г А У У Ц Г Г У У У А Ц А Г Г Ц Г А
ГЦУ УЦА АГА АУУ УЦГ ГГУ УУУ УАЦ ЦАГ ГГЦ ЦГА
[стр. 164]

На рис. 52 наглядно показано, что каждый второй нуклеотид в такой цепочке входит одновременно в два триплета. Например, первый урацил является последним элементом триплета ГЦУ и в то же время - первым элементом триплета УЦА.

У такой системы кодирования есть серьезные ограничения. В таком "сжатом" коде за триплетом ГЦУ обязательно должен следовать триплет, начинающийся с У, например, УЦА. А вот АГА, например, за ним следовать уже не может. Таким образом, если ГЦУ отвечает за аминокислоту-1, а АГА - за аминокислоту-2, то в случае кодирования "с наложением" аминокислота-2 никогда не сможет следовать в составе белка за аминокислотой-1.

Подобные ограничения распространяются на все коды "с наложением". Как ни составляй информацию с помощью такого кода, все равно останется множество "запрещенных" последовательностей аминокислот.

А имеющиеся у нас знания о последовательностях аминокислот в белках (см. стр. 81) свидетельствуют о том, что никаких "запрещенных" последовательностей не существует. Любые сочетания из двух, трех и более аминокислот - возможны!

То есть, код не может идти с наложением. Это должна быть однозначно читаемая последовательность, как на рис. 53. Триплеты могут следовать друг за другом в любой очередности, а следовательно - и аминокислоты тоже.

Рис. 53. Кодирование без наложения.
Г Ц У Ц А Г А У У Ц Г Г У У У А Ц А Г Г Ц Г А У
ГЦУ ЦАГ АУУ ЦГГ УУУ АЦА ГГЦ ГАУ
[Стр. 165]

И, как всегда, какими бы убедительными ни казались рассуждения, они должны быть подтверждены экспериментально, что и сделал в 1961 году сам Крик со своими коллегами. Они взяли за основу закодированную молекулу нуклеиновой кислоты, с помощью которой уже сумели к тому времени добиться синтеза определенного белка, и добавили к ней один нуклеотид. Белок перестал синтезироваться. Добавили еще один - никаких изменений. Когда же добавили третий, молекула вновь заработала. Эти экспериментальные данные можно объяснить, как представлено на рис. 54, и, соответственно, трактовать в поддержку теории триплетов.

Восстановление триплетной структуры.
ЦУГ: ЦУГ: ЦУГ: ЦУГ: ЦУГ: ЦУГ: ЦУГ: - изначальная последовательность триплетов
Добавление А ЦАУ:ГЦУ: ГЦУ: ГЦУ: ГЦУ: ГЦУ: - последовательность триплетов сбилась
Добавление еще одного А ЦАУ:АГЦ:УГЦ: УГЦ: УГЦ: УГЦ: УГЦ: УГЦ: - последовательность триплетов все еще сбита
Добавление третьего А АЦА:УАГ: ЦУГ: ЦУГ: ЦУГ: ЦУГ: ЦУГ: ЦУГ: - изначальная триплетная структура восстановлена Однако в результате у нас получается все же 64 триплета на 22 аминокислоты. Соответственно, есть два варианта - либо 32 избыточных триплета - пустые, не несут никакой информации и попросту игнорируются, либо одна и та же аминокислота кодируется двумя-тремя различными триплетами. Как мы увидим, экспериментальные данные свидетельствуют в пользу второго предположения.

Код, в котором два или более символов обозначают одно и то же, называется вырожденным. Стало быть, именно к этому классу принадлежит и генетический код.

Подведем итоги:

1. Генетический код состоит из тринуклеотидных комбинаций - триплетов, записанных по всей длине полинуклеотидной цепочки, причем каждый триплет представляет определенную аминокислоту;
2. Генетический код записывается без наложений;
3. Генетический код является вырожденным.

Кроме того, биохимики уверены, что
4. Генетический код является универсальным. То есть, один и тот же код действителен для всех живых существ, от самого маленького вируса до самой огромной секвойи.

Наилучшим тому подтверждением является способность вирусов использовать при заражении клеток собственную матричную РНК для производства белков с помощью рибосом, ферментов и вспомогательного химического аппарата самой клетки. То есть, клетка явно понимает язык различных вирусов. И в лабораторных условиях, даже если матричную РНК одного вида живых существ помещали в условия химического аппарата других видов, все равно ее язык оказывался понятым, и фермент вырабатывался как ни в чем не бывало.

<<... предыдущая стр. :: следующая стр...>>

п»ї1 :: 2 :: 3 :: 4 :: 5 :: 6 :: 7 :: 8 :: 9 :: 10 :: 11 :: 12 :: 13 :: 14 :: 15 :: 16 :: 17 :: 18 :: 19 :: 20 :: 21