Известно, что генетический код — это условная запись наследственной информации в молекулах ДНК и РНК с помощью кодирующих единиц: триплетов или кодонов.
Как сказано выше, приоритеты в расшифровке генетического кода принадлежат М. Ниренбергу и Дж. Маттеи (1961), С. Очоа (1962)
и Х. Корана (1965).
Из их работ, касающихся свойств генетического кода, следует, что эволюционное значение имеют 64 классических триплета, кодирующих 20 основных аминокислот, из которых (как из отдельных «кирпичиков») формируются структурные белки или «строительные материалы» основного структурного сооружения многоклеточного организма — клетки, а также ее функциональные элементы на основе
белков (ферменты) и другие (дополнительные) структурные элементы как связанные, так и не связанные с белками (см. главу 2).
Все 64 кодона сформированы либо из одного и того же, либо из двух одинаковых (или разных), либо из трех одинаковых (или разных) азотистых оснований.
С учетом имеющихся данных постараемся расширить наши представления о структуре и свойствах кодирующих единиц и в первую очередь попытаемся определить теоретически возможное количество кодонов, которые можно составить из всех сочетаний четырех азотистых оснований, входящих в состав молекул ДНК и РНК. Результат получается такой: число кодирующих единиц, составленное из одного и того же основания, равно 4, из двух оснований — 16, трех оснований — 64, четырех оснований — 256.
Очевидно, если третье значение включает в себя 64 классических кодона, то четвертая величина больше всего соответствуют общему объему теоретически возможных комбинаций, составленных из разных сочетаний четырех азотистых оснований. Если предположить, что кодон будет включать больше четырех оснований, например пентаплет (четыре разных + одно повторяющееся основание) или секстаплет (четыре разных + два повторяющихся основания) и т.п., то возможных комбинаций будет гораздо больше.
Иными словами, возникает вопрос, не кодируют ли последовательности нуклеотидов, не входящие в число классических кодирующих единиц, другие структурные и функциональные компоненты клетки, включая:
• молекулы аминокислот, не относящиеся к классу основных аминокислот;
• молекулы моносахаридов и полисахаридов;
• молекулы фосфолипидов, сфинголипидов, жирных кислот, холестерина и других химических соединений.
Подобная гипотеза позволяет предполагать: в ближайшей перспективе вслед за каноническим генетическим кодом ученые, вероятно, расшифруют один или несколько дополнительных генетических кодов, основанных на наличии кодонов, сформированных из других повторяющихся последовательностей нуклеотидов, входящих в состав молекулы ДНК.
В пользу правомочности вышесказанного свидетельствует целый ряд данных, полученных благодаря программе «Геном человека».
• Отличия генетического кода ядерной ДНК от кода мтДНК. Например, метионин в ядерной ДНК кодирует кодон АУГ, а в мтДНК — кодон АУА; аргинин в ядерной ДНК кодируют кодоны АГА и АГГ, тогда как в мтДНК они служат стоп-кодонами (см. главу 2).
• Некодирующие последовательности ДНКа или интроны, могут функционировать как кодирующие последовательности — экзоны. Первый пример — такое кодирование возможно за счет различных комбинаций интронов и экзонов при альтернативном сплайсинге, в ходе которого с одного гена транскрибируется несколько типов мРНК, как в случае аллельных серий (см. главу 5). Второй пример — кодирование рРНК, тРНК и гистоновых белков. Третий пример — обнаружены 16 мутаций генов, обусловленных инсерциями интронов: Alu-повторов — 2 мутации, LINE-повторов — 12 мутаций и SINE-повторов — 2 мутации.
• Выполнение интронами функций сигнальных молекул (см. главу 8).
• В интронах иногда находят гены. Так, в интроне гена фактора YIII, контролирующего свертываемость крови, расположен другой ген (ситуация названа «ген в гене»).
• В интронах порой находятся регуляторные участки некоторых генов. Они могут располагаться как в интронах внутри гена, так и в интронах, значительно удаленных от гена (например, гены альфа- и бета-цепей гемоглобина HbA).
Кроме того, в последние годы выделен класс болезней экспансии три-, тетра- и полинуклеотидных повторов, относящихся как к кодирующим, так и к некодирующим нуклеотидным последовательностям ДНК (см. главу 27).