Расшифровка кода жизни

Фрэнсис Крик: «Сейчас кажется крайне вероятным, что многие из 64 триплетов — возможно, все — кодируют какую-то аминокислоту и в общем случае несколько различных триплетов кодируют одну аминокислоту»

Фрэнсис Крик
Фрэнсис Крик

Двойная спираль объяснила, как копируются гены и как генетическая информация передается от клетки к клетке и от поколения к поколению. Она также показала, что мутации «букв» ДНК будут наследоваться в соответствии с дарвиновской теорией эволюции. Но структура не прояснила, как гены выполняют другую жизненно важную функцию — синтез белков, лежащих в основе биологии.

Очевидно, код жизни написан алфавитом из четырех букв ДНК — А, Ц, Г и Т, - в последовательности которых скрыта инструкция для синтеза 20 аминокислот, образующих белки. Но код не имеет смысла, если он не расшифрован. У биологии нет ни переводчика, ни ключа к шифру ДНК.

Ключ был найден благодаря проницательным теориям Фрэнсиса Крика и экспериментам под руководством американского биохимика Маршалла Ниренберга и французского биолога Жака Моно, результаты которых совпали с теорией. Чуть менее чем через десять лет после открытия вписанного в двойную спираль генетического кода он был расшифрован, и молекулярная биология получила свой основополагающий принцип.

Маршалл Ниренберг
Маршалл Ниренберг

Сопрягающая молекула: матричная РНК

Уотсон и Крик расшифровали двойную спираль, объединив и проанализировав доступные данные. Однако следующее великое открытие Крика было более умозрительным и не основывалось на экспериментальных результатах. Крик предположил, что код ДНК преобразуется в аминокислоты с помощью «сопрягающей молекулы» — переводчика-гонца, передающего приказы от генов клеточным фабрикам по производству белков.

Жак Моно
Жак Моно

К 1960 году правильность интуитивных заключений Крика была доказана. В Институте Пастера в Париже группа Моно на бактериях и их вирусах бактериофагах показала, что ДНК и в самом деле имеет сопрягающую молекулу, состоящую из химически близкого ее родственника — рибонуклеиновой кислоты (РНК).

РНК похожа на ДНК, но имеет несколько структурных отличий. Основное — то, что вместо основания тимина в ней содержится похожий нуклеотид урацил (У, или U). Помимо этого, РНК менее стабильна и, следовательно, существует в клетке меньшее количество времени. Из нее строятся различные типы молекул, выполняющих специальные функции. Сопрягающая молекула Крика известна как матричная РНК (мРНК), однонитевая молекула, в которую записывается последовательность генов. Затем мРНК используется для синтеза белков в процессе, известном как трансляция.

Как и в случае репликации, двойная спираль расходится, и одна нить считывается для синтеза ее зеркального отражения — нити мРНК. В таком процессе транскрипции Ц-генов станут Г в мРНК, Т станут А, Г станут Ц, а вот А станут У, поскольку тимин в молекуле РНК заменен на урацил. Эти генетические сигналы затем мигрируют из клеточного ядра в структуры, производящие белки, - рибосомы. Рибосомы в соответствии с порядком оснований в молекуле мРНК по одной соединяют аминокислоты в цепочки. Другой тип РНК, транспортные РНК, собирают аминокислоты и нанизывают их на растущий белок. Нестабильность мРНК означает, что сообщение самоуничтожится после прочтения — совсем как в фильме «Миссия невыполнима». Благодаря этому в клетке не синтезируются лишние ненужные белки.

«Можно с большой степенью уверенности сказать, что единственная цепочка РНК может служить матричной РНК» Фрэнсис Крик

Триплеты

Однако откуда рибосомы знают, какие нужны аминокислоты? И откуда они знают, где начинается и заканчивается белковая цепочка? Ответ лежит в последовательности оснований генов, задающей в ДНК и мРНК определенные аминокислоты. Код, впервые предложенный Криком, очень прост и основывается на комбинации трех «букв» ДНК, или триплетов.

Значения триплетов были расшифрованы благодаря работе Ниренберга, который в 1961 году смешал рибосомы бактерии Е. coli с аминокислотами и отдельными основаниями РНК. Добавив чистый урацил, он получил длинные, похожие на белок цепочки, состоящие из одной аминокислоты — фенилаланина. Первый триплет был расшифрован: сообщение мРНК «УУУ» означает «поместить молекулу фенилаланина на белковую цепочку». В следующие пять лет были определены значения всех 64 комбинаций четырех оснований. Код был расшифрован.

Поскольку существует 64 возможных триплета, или кодона, но всего 20 аминокислот, некоторые аминокислоты задаются несколькими триплетами. Например, фенилаланину соответствует не только кодон УУУ, но и кодон УУЦ. Существует по шесть способов задания аминокислот лейцина, серина и аргинина. Только две из 20 аминокислот задаются уникальным кодоном: триптофан (УГГ) и метионин (АУГ). АУГ также служит стартовым кодоном, приказывающим рибосомам начать добавление аминокислот, то есть большинство белков начинается с метионина. Также существуют три стопкодона: УАА, УАГ и УГА, сообщающих рибосоме, что белок закончен.

Система могла бы быть и проще. В самом деле, сначала Крик предложил более изящный код из 20 возможных триплетов, по одному для каждой аминокислоты. Однако нехватку стиля природа компенсирует сутью, поскольку избыточность кода имеет значительные преимущества. Благодаря тому, что наиболее важные аминокислоты задаются несколькими кодонами, они устойчивы к мутациям. Глицин, например, кодируется триплетами ГГА, ГГЦ, ГГГ и ГГУ. При изменении последнего основания результат не меняется.

Таким образом, остается меньше возможностей для катастрофических ошибок копирования, которые могли бы заполонить геном. Примерно четверть всех возможных мутаций являются «синонимичными», а действие естественного отбора приводит к тому, что еще большая часть, примерно 75 %, никак не повлияет на функцию белка. Генетический код — это язык Маши, влезшей в дом трех медведей, его вариации не слишком велики и не слишком малы, и в самый раз для эволюции.

Центральная догма

Другим важным вкладом Фрэнсиса Крика в науку была «центральная догма» биологии, состоящая в том, что генетическая информация обычно передается в одном направлении. ДНК может копироваться в ДНК или транскрибироваться в мРНК, а мРНК дает белок, но обратить вспять этот процесс невозможно.

У этого правила существуют три исключения. Некоторые вирусы способны размножаться путем прямого копирования РНК в РНК или «обратной транскрипции» РНК в ДНК. Также можно напрямую перевести ДНК в белок, но только в лаборатории. Однако информацию, содержащуюся в белках, невозможно перевести в РНК, ДНК или другие белки. Избыточность генетического кода это запрещает.

Экзоны и интроны

Не вся ДНК генов используется для создания белка. Важные части генов носят название экзонов. Между ними располагаются участки некодирующей ДНК, или интроны, не влияющие на состав белка, кодируемого этим геном. Несмотря на то что в мРНК копируется вся ДНК, интроны вырезаются из мРНК специальными ферментами, а экзоны сшиваются для получения последовательности белка. Это можно сравнить с фильмом на телевидении. Сцены, которые вы хотите посмотреть, это экзоны, но между ними встречаются рекламные паузы — интроны, не являющиеся частью истории. Если вы записали фильм, то можете промотать рекламу и посмотреть фильм в целом — аналогично тому, как рибосома считывает сшитые экзоны.




Поделиться ссылкой