...

Морис Уилкинс, получивший Нобелевскую премию 1962 г. вместе с Уотсоном и Криком, не участвовал в построении модели, но работы по изучению структуры ДНК, в том числе и работа Розалинд Франклин, были начаты во многом благодаря ему. Сама же Франклин не дожила до вручения премии — она умерла от рака в 1958 г. в возрасте 37 лет.

Теперь два абзаца биохимии, чтобы подвести итог достижениям отцов (и матерей) молекулярной биологии. Постарайтесь это пережить, а кому не хочется — просто посмотрите на рис. 4 (справа) и переходите к следующей главе. Молекула пятиатомного углевода дезоксирибозы в составе ДНК замкнута в цикл, к ней присоединены азотистое основание и фосфат. Атомы углерода в дезоксирибозе пронумерованы, от одного до пяти; цифры помечены штрихами (в отличие от углеродов азотистого основания, которые пронумерованы без штрихов). К 5’ — углероду присоединен “собственный” фосфат нуклеотида, к 3’ — углероду — фосфат другого нуклеотида, соседа по цепочке. По ним названы и концы нуклеотидной цепи — 5’ — и 3’ — конец. “Начало” цепи, ее “левый” конец (мы читаем слева направо, и последовательность нуклеотидов в ДНК нам удобнее записывать таким же образом) — это 5’ — конец. Любая цепочка ДНК (или РНК) растет от 5’ — к 3’ — концу — новый нуклеотидный остаток всегда присоединяется к 3’ — атому.



Азотистые основания — это то, благодаря чему четыре нуклеотида различаются между собой (остатки дезоксирибозы и фосфаты у всех нуклеотидов одинаковые). Два больших, аденин и гуанин (см. рис. 4), называются пуринами, а два маленьких, с одним шестичленным циклом — тимин и цитозин — пиримидинами. Это и есть те самые “буквы” А, Т, G, С, которыми записывается генетическая информация. Что существенно — этими нуклеотидами две цепочки двойной спирали держатся друг за друга. Напротив аденина всегда стоит тимин, а напротив гуанина — цитозин. Таким образом, последовательность нуклеотидов в одной цепочке однозначно определяет последовательность нуклеотидов в другой цепочке, что позволяет ДНК копироваться.

Теперь мы знаем, что такое ген!

Следующие десятилетия тоже прошли не зря. Структура молекулы — это прекрасно, однако надо было понять, каким образом ДНК копируется (реплицируется), как записанная в ней информация превращается в признаки.

Наиболее важное и удивительное свойство двойной спирали — это, конечно, заложенная в ее структуре способность к самокопированию. Если разделить две нити, то на каждой можно начать строить ее копию, в итоге получить вместо исходной двойной спирали две одинаковые и по-сестрински разделить их между сестринскими клетками. Или построить на определенном участке ДНК молекулу матричной РНК (мРНК) — инструкцию для синтеза белка. Ура, наконец-то мы узнали, что такое ген — фрагмент ДНК, в котором записана последовательность аминокислот определенного белка, плюс регуляторные участки, через которые происходит включение и выключение гена. (Правда, есть и такие гены, которые кодируют не матричную РНК и через нее белок, а просто РНК, имеющую самостоятельные функции.)

Разобрались с репликацией ДНК, расшифровали генетический код, то есть разгадали, каким образом можно записывать последовательности из 20 аминокислот четырьмя нуклеотидами. Оказалось, природа использует элегантный шифр — каждой аминокислоте соответствуют три нуклеотида; таких комбинаций существует, как нетрудно подсчитать, 64, поэтому одной аминокислоте могут соответствовать несколько триплетов — код вырожденный, как говорят математики.

Стало понятно, что ДНК в ядре клетки — это библиотека, в которой книги не выдают на дом, но позволяют снимать копии и забирать с собой. Или, в современных образах, — магазин электронных книг, который может продать бесконечное количество экземпляров той или иной книги в удобном для чтения формате. Копии книг — это матричные РНК, рибосомы (клеточные машинки для синтеза белка) читают их по триплетам и в соответствии с этими триплетами строят белок. Таким образом, поток информации идет в направлении от ДНК к РНК и затем от РНК к белку. Это и есть центральная догма молекулярной биологии, которую сформулировал Фрэнсис Крик в 1958 г.

Возможно, “догма” не самое подходящее слово. Как писал историк молекулярной биологии Хорас Джадсон в книге “Восьмой день творения” (The Eighth Day of Creation) о своем разговоре с Фрэнсисом Криком: “«Я имел в виду, что догмой называют идею, для которой нет обоснованных подтверждений. Понимаете?!» Крик издал восторженный рев. «Да я просто не знал, что значит «догма»! И мог бы с тем же успехом назвать ее Центральной Гипотезой или как-то в этом роде. Это я и хотел сказать. Догма — только слово-крючок»”. В любом случае сегодня центральная догма “ДНК → РНК → белок” ни у кого не вызывает ни малейших сомнений: обоснованных подтверждений более чем достаточно. Хотя теперь известно, что информация может передаваться от РНК к ДНК (например, в жизненном цикле некоторых вирусов с РНК-геномом), общей картины это не меняет. Магистральный поток информации направлен от ДНК к белкам — строителям и строительным материалам всего живого.

Как читать ДНК

Фредерик Сенгер и его метод секвенирования

Конечно, все захотели читать ДНК — черпать информацию о жизни прямо из источника. Но как читать буквы, если эти буквы — молекулы?

Необходим был удобный метод определения нуклеотидной последовательности, и такие методы стали появляться. Правда, большая часть их сегодня имеет лишь историческую значимость: для нынешних биологов “плюс-минус” секвенирование или “секвенирование по Максаму — Гилберту методом химической деградации” — что-то вроде микроскопа Левенгука.

Слово “секвенирование”, собственно, и означает “определение последовательности” (от англ. sequence); говорят о секвенировании ДНК, РНК, белков. Предложенное в 1970 г. секвенирование по Максаму — Гилберту, если коротко, подразумевало расщепление ДНК в растворах, организованное таким образом, чтобы получались молекулы всех возможных длин. Но это не самый рациональный подход. ДНК — именно та молекула, которая умеет копироваться сама на себе. Если взять у клетки ферменты, которые работают с ДНК, и научиться их использовать в наших целях, можно добиться многого. Почему бы, например, вместо того чтобы нарезать ДНК столькими способами, сколько в ней букв, не нарастить на ней дочерние цепи всех возможных длин? На этой идее основано секвенирование по Сенгеру — метод, также изобретенный в 70-е гг. прошлого века и благополучно доживший до наших дней.

Английский биохимик Фредерик Сенгер (1918–2013) — один из четырех человек, получивших две Нобелевские премии, и единственный, у которого обе — по химии (1958 и 1980 гг.): за определение структуры белка инсулина и за метод секвенирования ДНК. В 1975 г. Сенгер в совместной статье с Аланом Коулсоном представил метод “плюс-минус” секвенирования [Sanger F. Nobel lecture: Determination of nucleotide sequences in DNA. 1980; https://www.nobelprize.org/.]. С помощью этого метода группа Сенгера почти полностью прочла геном бактериофага φX174 (5386 нуклеотидов) — по тем временам большой успех [Sanger F. et al. Nucleotide sequence of bacteriophage φX174 DNA // Nature. 1977; 265 (5596), 687–695; doi: 10.1038/265687a0.]. Однако все эти достижения затмило секвенирование по Сенгеру методом терминаторов, он же метод обрыва цепи, или дидезоксиметод [Sanger F. et al. DNA sequencing with chain-terminating inhibitors // PNAS USA. 1977; Vol. 74 (12), p. 5463–5467; doi: 10.1073/pnas.74.12.5463.]. Но сначала нужно объяснить, как молекулы ДНК сортируют по размеру с помощью электрофореза.

Мы помним, что ДНК — это кислота. Кислотные свойства определяются остатками фосфорной кислоты в ее составе — фосфатами. Из школьного курса известно, что анионы кислоты заряжены отрицательно: H3PO4 → H+ + H2PO4— . Поэтому, если через раствор, содержащий ДНК, пропустить ток, молекулы ДНК направятся к положительно заряженному электроду. А если раствор заменить гелем — несъедобным желе, молекулярной сеткой, заполненной жидкостью? Тогда молекулы ДНК не поплывут к плюсу туманным облачком, а каждая станет продвигаться со своей скоростью — чем длиннее молекула, тем труднее ей будет просачиваться через ячейки геля. Если же сделать в геле углубления (лунки) у отрицательного электрода, поместить в них ДНК и включить ток, от минуса к плюсу протянутся дорожки, и в них будут полоски, в каждой — молекулы ДНК определенного размера. Это называется “электрофорез ДНК”, или просто форез.

Теперь можем рассказать, как работает метод Сенгера. Реакционную смесь делят на четыре части. В каждую из четырех добавляют праймер (затравку для синтеза) — короткую молекулу ДНК, комплементарную началу участка, который нужно секвенировать. Праймер связывается с этим участком, образуя с ним двойную спираль. (Исследуемую ДНК перед этим, конечно, надо “расплести”, сделать однонитевой.) Фермент ДНК-полимераза, используя анализируемую ДНК в качестве матрицы, начинает наращивать праймер, соединяя в цепочку нуклеотиды. К обычным нуклеотидам в реакционной смеси добавлены необычные. Во-первых, некоторые нуклеотиды содержат радиоактивную метку (потом объясню зачем). Во-вторых, в каждой из четырех смесей небольшое количество одного из четырех нуклеотидов модифицировано — лишено OH-группы. К такому нуклеотиду (дидезоксинуклеотиду) нельзя присоединить следующий. А количество подобрано таким образом, чтобы среди новых цепочек были оборванные на каждом аденине — в одной пробирке, тимине — в другой, гуанине — в третьей, на каждом цитозине — в четвертой. И если потом внести реакционные смеси в лунки и провести электрофорез, получатся “лесенки”. Сложно, но станет яснее, если посмотреть на рис. 5 и 6.