ОСНОВНЫЕ ПОНЯТИЯ СТРУКТУРНОЙ ГЕНОМИКИ

Ген и модель его общей структуры

Под понятием «ген» подразумевается структурно-функциональная единица наследственного материала (генома).

Ген — это участок молекулы ДНК, кодирующий молекулу полипептида (белка), молекулы мРНК, рРНК, тРНК.

В последние годы произошло очередное уточнение понятия. Теперь считается, что ген — ассоциированный с регуляторными последовательностями фрагмент молекулы ДНК, соответствующий единице транскрипции на хромосоме.

Согласно модели общей структуры гена, он — «конкретная единица молекулы ДНК (ее кодирующая и некодирующая части) с расположенными по флангам регуляторными последовательностями».

Ген имеет (рис. 10) слева 5′-конец (начало гена), а справа З’-конец (окончание гена); между ними находятся экзоны, интроны и другие структуры.

Исключением из этой модели являются гены альфа- и бетаинтерферонов, гистонов и гены мтДНК, у которых нет интронов.

Место расположения гена в хромосоме (его позиция в ней) называется генным (генетическим) локусом.

Состояние локуса играет принципиальную роль: в компактном виде он интактен, и РНК-полимераза лишена доступа к промотору. В результате декомпактизации локус приобретает форму петли, связанной с ядерным матриксом (внутренний белковый скелет ядра).

Рис. 10. Модель общей структуры гена человека

На рис. 11 приведена структура бета-глобинового гена человека. Это самый короткий ген у человека: в нем 1100 н.п., образующих 3 экзона (90, 222 и 126 н.п.) и 2 интрона (116 и 646 н.п.).

Как следует из рис. 10 и 11, в ген входят следующие тонкие структурные элементы.

•  Промотор, или место присоединения РНК-полимеразы. Он включает ТАТА-бокс (остатки тимина и аденина), ГЦ-бокс (остатки гуанина и цитозина) и ЦААТ-бокс (остатки цитозина, аденина и тимина). Боксы расположены перед точкой инициации транскрипции (кэп-сайт). Следует отметить: ни один из элементов промотора не является обязательным для транскрипции, поэтому в разных генах разные комбинации этих элементов. Например, в 20\% всех генов человека (включая гены «домашнего хозяйства») нет ТАТА-боксов, а некоторые гены имеют множественные копии одного и того же элемента или лишены их полностью (ЦААТбоксы, ГЦ-боксы и др.).

•  Кэп-сайт — основной инициаторный комплекс (ОИК). Он необходим для генов, транскрибируемых РНК-полимеразой II (гены II типа). Для присоединения РНК-полимеразы II к ОИК требуется ряд белков — общих факторов транскрипции (они есть во всех клетках).

•  Экзоны и разделяющие их интроны.

•  СрО — островки (динуклеотиды) или участки, разделяющие экзоны и интроны (на рис. 11 это: аа31, аа104, аа105, аа146); они расположены не внутри, а в начале гена (около 5′-конца), что позволяет предположить их участие в регуляции.

•  5′- и З’-нетранслируемые области.

•  Небольшие регуляторные сайты, участвующие в инициации (кодон АТТ) или терминации трансляции (кодон ТАА).

•  Небольшие регуляторные участки, необходимые для инициации, усиления (энхансеры), ослабления (сайленсеры) и терминации транскрипции.

•  Участок сигнала полиаденилирования.

Почти все мРНК имеют «поли-А-хвост«, присоединяющийся к З’-концу перед выходом молекулы мРНК из ядра. Считается, что «поли-А-хвост» защищает мРНК от быстрой деструкции, ибо деаденилирование часто ей предшествует.

Предполагается также, что такой «хвост» влияет на транспорт, трансляцию и распад мРНК, значительно сокращая период ее полужизни.

В последние годы обнаружен белок, связывающийся с «хвостом», но механизм его действия пока неясен.

Размеры других генов человека весьма вариабельны. Как отмечалось, самый короткий из них — бета-глобиновый ген, ну а самый протяженный — ген дистрофина (2,2 млн н.п. и более 2000 экзонов).

Зная размеры гена, можно выяснить размер кодируемого им белка (и наоборот), поскольку одна аминокислота закодирована тремя нуклеотидами. Например, белок, кодируемый геном с размером 3000 н.п., содержит 1000 аминокислотных остатков.

Свойства гена как единицы функционирования

Главное свойство гена — его экспрессия или работа, в ходе которой последовательность нуклеотидов в молекуле ДНК переводит-

Рис. 11. Структура бета-глобинового гена человека (по: Гилберт С., 1995)

ся в последовательность аминокислот в молекуле полипептида (см. главу 3).

Следующее свойство гена — аллельное состояние. Организационная структура гена — диаллельная модель (рис. 12), т.е. большинство генов существуют в виде двух альтернативных вариантов — аллелей, локализованных в одинаковых (идентичных) локусах на гомологичных хромосомах.

В диплоидной клетке каждая пара гомологичных хромосом содержит одну хромосому отцовского происхождения (имеет отцовские аллели) и другую хромосому материнского происхождения (материнские аллели).

Гены, расположенные в одинаковых локусах на гомологичных хромосомах, называются аллельными генами, т.е. у каждой пары родительских генов одна материнская и одна отцовская копии (аллели) одного и того же гена.

Если гены одной родительской пары находятся в разных (неидентичных) локусах как гомологичных, так и негомологичных родительских пар хромосом, то это неаллельные гены.

В классической генетике выделен ряд понятий, связанных с аллельными генами.

Во-первых, «гомозиготность» и «гетерозиготность». Термины введены в 1903 г. одним из основоположников генетики — англичанином Вильямом Бэтсоном.

В случае гомозиготности каждый из двух аллелей одного и того же гена обладает одинаковой по содержанию информацией. В случае гетерозиготности каждый из двух аллелей одного гена обладает разной по

Рис. 12. Диаллельная модель организационной структуры гена Гомологичные хромосомы: отцовская (верхняя) и материнская (нижняя); р — короткое плечо; q — длинное плечо; С — центромера; А, Б и В — идентичные генные локусы длинных плеч двух хромосом и содержащиеся в них аллельные копии одного гена (соответствуют местам пересечения пунктирных линий с хромосомами)

содержанию информацией. Организмы с такими аллельными парами называются гомозиготными и гетерозиготными соответственно.

Во-вторых, аллельные и неаллельные гены образуют в одной и той же клетке две группы родительских генов (отцовскую и материнскую по происхождению).

В каждой группе любой ген отличается от альтернативного ему гена по содержанию информации, закодированной в его нуклеотидной последовательности.

В-третьих, если речь идет о совокупности (сцеплении) аллелей одного и того же гена (например, аллелей полиморфного маркера), то такое состояние называется гаплотипом (см. ниже), а локусы, где расположены подобные аллели, называются полиморфными локусами (см. ниже). Их в геноме у человека выделено около 6 тыс.

Обнаружение в одной популяции неравновесия в сцеплении полиморфных аллелей одного локуса позволяет определить точку повреждения гена (точковую мутацию) и время (возраст) ее появления.

Другие свойства гена.

 Дискретность. У биологического вида развитие разных признаков контролируется разными генами, локализованными в разных локусах на разных хромосомах. Например, ген хореи Гентингтона расположен на коротком плече хромосомы 4, сегмент 1, подсегмент 6 (записывается как 4р16), ген атаксии Фридрейха — на длинном плече хромосомы 9, сегменты 1 и 2, подсегменты 3 и 1.1 (записывается как 9q13-q21.1).

 Дозированность. Ген обусловливает развитие признака до определенного количественного предела (дозы); параллельно дозе гена усиливается выраженность (экспрессивность) признака. Превышение дозы в рамках одного биологического вида не наблюдается. Например, у человека размеры ушной раковины или длина спинки носа имеют определенные пределы, характерные для Homo sapiens, и никогда не достигнут размеров ушной раковины или длины хобота у слона.

 Специфичность. Ген обеспечивает развитие только определенного признака или их группы. Например, ген, контролирующий окраску глаз, не способен сформировать такой признак, как курчавость волос.

В случае развития группы признаков под влиянием одного гена речь идет о плейотропном действии или эффекте (см. главу 5). Например, ген атаксии-телеангиэктазии (11q22.3) ответственен за

следующие признаки: нарушение координации и походки, появление сосудистых звездочек (телеангиэктазий) на склерах, коже, слизистых оболочках органов дыхания и пищеварения, а также иммунодефицит и др.

•  Стабильность. При отсутствии мутаций (нарушений структуры и функции) ген передается в ряду поколений в стабильном виде (см. главу 5).

Гаплотип

Гаплотип — совокупность или сочетание (сцепление) аллелей одного и того же гена.

Аллели, входящие в гаплотип, происходят из одного базового аллеля, т.е. для них характерен «эффект основателя».

Новые аллели мутантного гена, сформированные на отцовской или материнской хромосоме, в последующих поколениях постепенно «размываются» за счет рекомбинационной изменчивости и меняют содержание информации о признаке.

Аллели одного гаплотипа, как и множественные аллели одного гена (см. ниже), кодируют количественные признаки. Однако для вторых аллелей не характерен «эффект основателя».

Классификация генов

Гены человека делятся на ряд классов: белок-кодирующие; гены, кодирующие РНК; гены РНК-полимераз; митохондриальные гены.

Класс белок-кодирующих генов: это общеклеточные гены (гены «домашнего хозяйства»); тканеспецифические гены (гены терминальной дифференцировки или специфически функционирующие гены); гены, кодирующие транскрипционные факторы: PAX I-9, HOX I-9, SOX I-10 (см. главу 8); ген SRY (ген, определяющий мужской пол). В последние годы в этот класс включены гены, контролирующие:

•  структуру белков, участвующих в процессах синтеза аминокислот, азотистых оснований и сахаров;

•  синтез белков, обеспечивающих матричные процессы (репликацию, транскрипцию и трансляцию).

Следует выделить уникальные особенности строения некоторых белок-кодирующих генов — они включают две области: структурную часть и фланкирующие регуляторные участки с 5′- и 3′-сторон. Например, глобиновые гены человека образуют два мультигенных семейства (кластера), структурно напоминающих оперон у прока-

риот, но без общих регуляторных участков (промотора, оператора и терминатора), ибо каждый кластер имеет свои регуляторные участки. В частности, первый кластер альфа-глобиновых генов локализован в коротком плече хромосомы 16 в определенной последовательности: сначала идут последовательности генов, кодирующих цепи эмбриональных гемоглобинов, затем — цепи трех псевдогенов, а ближе к 3 ‘-концу — цепи генов альфа 1 и 2.

Второй кластер бета-глобиновых генов расположен в коротком плече хромосомы 11 в следующей последовательности: сначала ген эмбриональной цепи, затем 2 гена фетальных цепей HbF, которые отличаются по одному кодону, потом один псевдоген бета-цепи, сигма-ген, кодирующий сигма-цепь гемоглобина взрослого человека HbA2, и бета-ген.

Эти гены функционируют на разных этапах онтогенеза в той же последовательности.

Класс РНК-кодирующих генов: гены, отвечающие за синтез мРНК,

рРНК, тРНК и мяРНК.

Гены тРНК повторяются умеренно, числом достигая 1300. Особенность их строения: расчлененный и находящийся внутри гена промотор, один блок которого расположен на расстоянии 8-30 н.п. слева от инициаторного кодона, а второй блок — справа, на расстоянии 51 н.п.

Сам промотор содержит А- и В-боксы с каноническими последовательностями. Если расстояние между боксами уменьшается, то уровень транскрипции снижается либо траскрипция полностью прекращается. В свою очередь, замена одного нуклеотида в В-боксе искажает структуру тРНК.

Крайне интересны данные о ранее неизвестных молекулах мяРНК. По-видимому, они участвуют в образовании гибридных молекул сложных рибопротеиновых частиц, называемых сплайсосомами. Процесс формирования сплайсосом идет путем спаривания с основаниями консенсусных последовательностей ДНК или меток сочленений экзонов с интронами: GU-начало метки и AG-конец метки. Такое спаривание происходит в местах сплайсинга на первичном РНК-транскрипте, что определяет интроны, подлежащие удалению.

Мутации в мяРНК могут привести к неправильному сплайсингу, влекущему за собой невозможность удаления интронов из РНКтранскрипта. Например, при бета-талассемии не происходит образо-

вания нормальных количеств бета-гемоглобина из-за замены гуанина на аденин в 5′-конце, что вызывает блок процессинга мРНК.

Иными словами, молекулы мяРНК катализируют химические процессы.

В последние годы предложена новая классификация, где в зависимости от типа транскрибируемых РНК-полимераз выделяют 3 класса генов:

•  гены рРНК, транскрибируемые РНК-полимеразой I (это гены 18S; 5,8S и 28S);

•  гены, транскрибируемые РНК-полимеразой II (это гены, кодирующие белки);

•  гены, транскрибируемые РНК-полимеразой III (это гены 5SpРНК,

тРНК и мяРНК).

Класс митохондриальных генов: 37 генов, не содержащих интронов: гены рибосомных ^S-рРНК и ^S-рРНК; 22 гена тРНК; гены трех субъединиц цитохром-с-оксидазы; гены шестой и восьмой субъединиц АТФ-азы; ген цитохрома b; гены семи субъединиц NADH- дегидрогеназы.

Генетический полиморфизм

Генетический (геномный) полиморфизм (ГП) — вариации наследственного материала в пределах одного биологического вида (или основа разнообразия людей).

В классической генетике понятие ГП соответствует нескольким наследственным вариантам, из которых наиболее редкий вариант встречается с частотой, превышающей частоту обратного мутирования (см. главу 5).

Если говорить о ГП как о генетических маркерах признаков организма, то их можно считать полиморфными только тогда, когда наиболее редкий их вариант встречается чаще, чем в 1\% случаев.

Речь идет о частоте встречаемости четвертого варианта диаллельной модели, когда изменены обе аллельные копии одного и того же гена.

Как известно, при первом варианте и материнская, и отцовская копии сохраняют стабильную наследственную информацию о признаке; второй вариант — материнская копия несколько изменена, а отцовская — нет; третий вариант — отцовская копия несколько изменена, а материнская — нет; четвертый вариант — обе копии несколько изменены.

Наличие разных вариантов существования диаллельной модели традиционно (хотя и не совсем верно) считается множественным аллелизмом (см. выше). Но так как аллелей всего только два, а вариантов не менее четырех (точнее, их всегда гораздо больше), то правильнее следовало бы назвать такое состояние многовариантностью существования двух аллелей одного и того же гена.

Вместе с тем, известны серии множественных аллелей. Мутации в них по отношению друг к другу могут быть доминантными, рецессивными, а также вероятны неполное доминирование, сверхдоминирование, кодоминирование, условное доминирование, плейотропный эффект (см. главу 4).

Локусы, в которых расположены такие аллели, называются полиморфными (см. выше). Например, у человека в полиморфных локусах находятся полиморфные семейства молекул HLA-антигенов !иП классов (см. главу 15).

Другой пример полиморфности локусов — разная частота распространенности IV группы крови (по классификации АВО): среди населения ряда регионов мира она встречается у 3-4\%, тогда как в других регионах — у 10-12\%.

В молекулярном плане ГП — это наличие небольших (совместимых с жизнью) нарушений структуры нуклеотидов в молекуле ДНК (нарушений порядка последовательности) и, следовательно, в молекуле белка (см. главу 3).

В структурной геномике главной формой молекулярного полиморфизма является однонуклеотидный полиморфизм (ОНП) или варианты последовательностей ДНК у разных лиц с вовлечением одной пары нуклеотидов. ОНП характерен для 93\% генов человека.

Выделяют качественный и количественный ГП. Первый представляет собой замену одного нуклеотида (или SNP), его частота 1:300 н.п. Второй — повторы нуклеотидов с различной степенью выраженности.

ГП — это также вариабельность числа тандемных повторов (одинаковые повторы следуют друг за другом) или STR в виде одного, двух, трех повторов и более.

Если протяженность тандемных повторов еще больше (от 10 до 100 нуклеотидов), то имеет место генетический полиморфизм по размеру повторов, или VNTR.

Кроме того, в геноме человека выделены области протяженной гомологии, возникшей в результате дупликации относительно круп-

ных фрагментов ДНК. Их эволюционное значение трудно переоценить. Например, рассмотрим дупликацию фрагментов ДНК, включающих ген CYP21 — ген цитохрома Р450 — и гены комплемента. В ходе эволюции одна из копий гена — ген CYP2^ — порой «накапливает» мутации и лишается активности, превращаясь в псевдоген. В результате между псевдогеном CYP2^ и сохранившим свою активность геном CYP2? может произойти генная конверсия (в гомологичных хромосомах) с перемещением участка гена CYP2? на ген CYP2^; или возникнет делеция гена CYP2?, обусловив развитие адреногенитального синдрома с гиперплазией коры надпочечников, вызванной недостаточностью 21-гидроксилазы.

Другой пример — дупликация гена миелинового белка РМР22; она вероятна в результате гомологичной рекомбинации между крупными повторами (REP), фланкирующими содержащую ген область ДНК (1,5 млн н.п.). Такая дупликация — наиболее частая причина невральной амиотрофии Шарко-Мари-Тус.

Вместе с тем делеция гена, кодирующего этот белок, ведет к менее тяжелой по проявлениям болезни — наследственной нейропатии.

Еще одна важная особенность ГП — различия между аллелями по числу копий повтора.

Исключение из этого правила — тринуклеотидный повтор цитозин-аденин-гуанин — ЦАГ (кодон глутаминовой кислоты), способный включаться в структурные гены в случае болезней экспансии числа нуклеотидных повторов (см. главу 28).

В целом установлено: разнообразные аллельные формы ГП могут образовываться за счет точковых мутаций, рекомбинаций и неравного кроссинговера.

В настоящее время создаются карты SNP, насыщенные SNP- маркерами. С их помощью проводится идентификация генов, ответственных за широко распространенные мультифакториальные и онкологические заболевания, болезни с отсроченной манифестацией признаков.

Особая роль принадлежит полиморфизму митохондриальной ДНК

(мтДНК).

В зиготе и во всех произошедших из нее соматических клетках при формировании многоклеточного организма транскрибируются и затем транслируются обе цепи мтДНК материнского происхождения, образующие единый транскрипт, расщепляющийся по сайтам, расположенным по обе стороны от каждого гена тРНК. Большая

часть генов тРНК (14 из 22) транскрибируется по часовой стрелке. После вырезания тРНК из мтДНК освобождаются молекулы рРНК

и мРНК.

В случае возникновения мутаций в мтДНК в клетке наблюдается гетероплазмия или присутствие разных типов мтДНК (нормальная и мутантная); при гомоплазмии все типы мтДНК одинаковые.

Мутации в мтДНК делятся на точковые и структурные (делеции). Они ведут к изменению белков, входящих в комплексы дыхательной цепи митохондрий, и, следовательно, обусловливают снижение энергетического обеспечения клеток или дефицит синтеза АТР, что ведет к болезням тех органов и тканей, в которых происходят энергоемкие процессы.

Оцените статью
yamedik
Добавить комментарий