Генетический код

Генетический код позволяет клеткам перевести инструкции, зашифрованные в ДНК, на «язык» белков. Хотя сам термин часто используется для описания генетического набора, последовательности ДНК, но на самом деле это именно код - свод правил, по которым информация преобразуется из одной формы в другую.

Гены и белки «записаны» разным химическим «алфавитом». В ДНК всего четыре «буквы»: основания аденин (А), цитозин (Ц), гуанин (Г) и тимин (Т). «Алфавит» белков состоит из 20 букв- аминокислот. К середине XX века биохимики уже знали, что нуклеиновые кислоты и белки состоят из цепочек базовых элементов. В 1902 году, например, Франц Хофмейстер и Эмиль Фишер независимо друг от друга доказали, что белки состоят из аминокислот.

Франц Хофмейстер
Франц Хофмейстер

Джеймс Уотсон и Фрэнсис Крик подтвердили, что обе цепочки ДНК представляют собой последовательность нуклеотидов, в каждом из которых содержится одно из четырех оснований. Крик предположил, что последовательность этих «букв» кодирует аминокислоты, а преобразование возможно благодаря генетическому коду, набору правил перевода с «языка» генов на «язык» белков.

Джеймс Уотсон
Джеймс Уотсон
Фрэнсис Крик
Фрэнсис Крик

Взламывая код

Попытки расшифровать генетический код начались сразу после открытия двойной спирали Уотсоном и Криком в 1953 году. Изначально ученые понятия не имели, как кодируется информация при наличии всего четырех «букв» ДНК. Если каждое «слово» состоит из двух букв, это дает лишь 16 (4x4) возможных комбинаций — для 20 аминокислот недостаточно. Тогда родилось предположение о трехбуквенных «словах», которые предполагают 64 (4x4x4) сочетания — триплеты. В 1961 году группа британских ученых подтвердила эту теорию.

«Это одно из наиболее поразительных обобщений биохимии... Что двадцать аминокислот и четыре основания, пускай с небольшими оговорками, но едины для всей живой природы» Фрэнсис Крик

Итак, было известно, что белки закодированы в «рамке считывания» неперекрывающимися триплетами, — оставалось понять значение каждого из них, то есть определить, какие именно триплеты кодируют каждую из аминокислот. В 1954 году физик Георгий Гамов основал «Клуб РНК-галстуков», неформальное объединение 20 гениальных ученых, заинтересованных в расшифровке генетического кода. Каждый из них носил галстук с вышитой спиралью РНК и буквенным обозначением одной из аминокислот (у Гамова был галстук с надписью ALA— аланин.). Хотя в клуб входили и Уотсон с Криком, и еще несколько лауреатов Нобелевской премии, расшифровать код им так и не удалось.

Георгий Гамов
Георгий Гамов

Первое «слово» прочитали биохимики Маршалл Ниренберг и Генрих Маттеи, открывшие соответствие триплета УУУ аминокислоте фенилаланину. К 1966 году лаборатория Ниренберга и его коллеги Хар Гобинда Коран и Северо Очоа расшифровали все 64 триплета.

Маршалл Ниренберг
Маршалл Ниренберг
Генрих Маттеи
Генрих Маттеи

Транскрипция

Почему белки считываются с РНК, а не напрямую с ДНК? Ответ кроется в процессе, контролирующем работу генов, — транскрипции. В 1961 году Франсуа Жакоб и Жак Моно пришли к такому выводу в результате изучения лактозного оперона (комплекса из трех генов, отвечающего за переваривание лактозы) кишечной палочки Е. coli. Французские молекулярные биологи доказали, что гены управляются последовательностью ДНК, стоящей перед опероном, — своеобразным переключателем, который срабатывает в зависимости от концентрации в клетке определенных сахаров, например лактозы. Поскольку гены расположены в ДНК, а белки производятся в цитоплазме клетки, Жакоб и Моно предположили, что инструкции по производству белков переносятся молекулой-посредником — рибонуклеиновой кислотой (РНК). РНК обычно состоит из одной цепочки нуклеотидов и содержит урацил (У) вместо тимина (Т), но в смысле переноса генетической информации РНК и ДНК идентичны.

Транскрипция — считывание генов и копирование их в молекулу РНК — напоминает репликацию ДНК. Двойная спираль разрывается одним из внутриклеточных механизмов — например, ферментом РНК-полимеразой, — после чего последовательность оснований копируется только с одной цепочки на информационную (матричную) РНК (мРНК). В клетках эукариот молекулы мРНК затем выходят из ядра и несут генетическую информацию рибосомам.

Трансляция

Изучая химические связи в нуклеиновых кислотах, Крик понял, что ДНК/РНК, вероятнее всего, не являются основой для производства белков, и предположил, что за присоединение аминокислот отвечает небольшая молекула-адаптер. В 1958 году американцы Махон Хогланд и Пол Замечник доказали, что помеченные радиоактивными метками аминокислоты присоединяются к РНК, прежде чем сформировать белки, из чего следовало, что во время синтеза белка РНК переносит аминокислоты. В 1965-м биохимик Роберт Холли открыл структуру таинственной молекулы — она оказалась похожа на лист клевера. Его «транспортная РНК» (тРНК) переносила аминокислоту аланин, подтвердив тем самым «адаптерную» гипотезу Крика.

Сама трансляция осуществляется специальной органеллой — рибосомой. Через рибосому протягивается цепочка мРНК, как бумага через принтер, к каждому триплету (кодону) присоединяется тРНК с помощью подходящего антикодона, расположенного на конце «клеверной» структуры тРНК. Рибосома присоединяет переносимую тРНК аминокислоту к растущей цепочке, которая со временем приобретает трехмерную структуру белка.

Избыточность

Благодаря триплетной структуре генетический код обладает одним важным свойством — избыточностью (вырожденностью). Как в нашем языке встречаются синонимы, слова с одинаковым значением, так и в «языке» генов несколько триплетов могут кодировать одну и ту же аминокислоту. В конце концов, возможных кодонов 64, а аминокислот всего 20, так что большинство кодируются несколькими кодонами (даже с учетом того, что три кодона действуют исключительно как стоп-факторы, так что для трансляции остается всего 61). Именно понимание избыточности генома подтолкнуло Фрэнсиса Крика к формулировке «центральной догмы молекулярной биологии»: информация теряется в процессе передачи. Как если бы в «языке» генов встречались, скажем, слова «кот» и «пес», в «языке» белков имелось бы только слово «зверь». Благодаря этому свойству при замене одного из оснований аминокислота может и не измениться. Например, все кодоны, начинающиеся с ГГ (ГГА, ГГГ, ГГТ, ГГЦ), транслируются в глицин. Мутация, не меняющая аминокислотного «значения» триплета, называется «молчащей» мутацией, но даже такие мутации не всегда безвредны.

Хотя в митохондриях и у некоторых бактерий встречаются небольшие отличия, подавляющее большинство живых организмов используют одинаковый генетический код. Это не случайность, а результат естественного отбора. В 1998 году эволюционные биологи Стивен Фриленд и Лоренс Херст провели компьютерную симуляцию, в которой генерировались случайные коды со случайным набором правил, а потом оценивалось воздействие мутаций на каждый из них. Из миллиона случайных кодов только один минимизировал последствия мутаций эффективней существующего.

Центральная догма

Генетическая информация передается только в определенных направлениях. Это и есть «центральная догма молекулярной биологии», первый вариант которой был сформулирован Фрэнсисом Криком в 1956 году: «Информация передается от нуклеиновых кислот белку, но не обратно». Информация в данном контексте - последовательность аминокислот. Джеймс Уотсон, соавтор открытия двойной спирали, внес некоторую путаницу, неверно упростив всю концепцию до «ДНК производит РНК, РНК производит белок». Крик уточнил центральную догму в 1970-м, определив три вида передачи информации: общий, универсальный, происходящий во всех клетках - например, от ДНК к ДНК (репликация), от ДНК к РНК (транскрипция), от РНК к белку (трансляция). Особый - от РНК к ДНК (обратная транскрипция), используемый вирусами, у которых нет ДНК. И уникальный - от белка к ДНК, РНК или другому белку. «Обратная трансляция» из белка в ДНК или РНК должна быть абсолютно невозможна, потому что информация теряется вследствие избыточности генетического кода. Но один пример ограниченной передачи информации между белками существует: прионы.

Язык генов

Генетический код состоит из 64 «трехбуквенных слов» - кодонов. В нем используются четыре буквы-основания: А, Т, Г, Ц (в РНКТ заменяется на У). Каждое слово кодирует либо одну из двадцати аминокислот, либо является старт- или стоп-кодоном.




Поделиться ссылкой