Казалось бы, с появлением на каком-то из этапов молекулярной эволюции полимеров — ДНК и РНК — проблема электростатической устойчивости ассоциатов из оснований была решена.
Тем не менее, как это вытекает из упомянутого выше правила равного набора 6-амино и 6-карбонил оснований для РНК, а также для одноцепочечных молекул ДНК, поддержание хотя бы суммарных равенств в наборах оснований, имеющих противоположные электрохимические характеристики, по-видимому, важно для функционирования молекул нуклеиновых кислот.
Исходя из результатов физических исследований свойств ДНК, для ее функционирования, вероятно, имеет важное значение более или менее правильное относительное чередование пар А—Т и Г—Ц. Эти пары отличаются по энергии взаимодействия: пара А—Т является «слабой» (две водородные связи), а пара Г—Ц — «сильной» (три водородные связи). Естественно предполагать, что избыточное содержание пар А—Т в каких-то участках молекулы ДНК могло бы вызывать генетически незапрограммированное расплетение двойной спирали, тогда как избыточное содержание пар Г—Ц, напротив,— затруднять расплетение молекулы ДНК, тем самым нарушая ее правильное функционирование при транскрипции.
Особенно интересны данные о том, что для организации молекул ДНК характерно равномерное распределение пар А—Т и Г—Ц в пределах сегментов молекулы, соответствующих отдельным генам. Вада и Суяма (авторы указанных работ) пишут о тенденции к выравненной стабильности («гомостабилизации») ДНК в пределах отдельных генов. Как следствие «гомостабилизации» ДНК обнаруживается отрицательная корреляция между суммарным содержанием оснований Г и Ц, приходящихся на две первые «буквы» кодонов и тех же оснований, приходящихся на третью «букву» кодонов.
Напомним, что третье основание в кодонах обычно не является значащим из-за вырожденности генетического кода, т. е. из-за наличия нескольких кодонов-синонимов, отличающихся по третьему основанию. Благодаря этому, за счет флуктуаций третьей буквы кодонов достигается более выравненное распределение по гену нуклеотидных пар Г—Ц.
Следует заметить, что упомянутое выше (и, несомненно, еще нуждающееся в конкретизации) представление об электростатически равновесной последовательности оснований практически как раз подразумевает существование какого-то рода упорядоченности в относительном распределении пар А—Т и Г—Ц в двойной спирали ДНК, несмотря на вариабельность нуклеотидных последовательностей по генетическому смыслу. Поэтому тенденция к «гомостабилизации» ДНК практически может отражать установление электростатически равновесной последовательности оснований в пределах гена.
Имеются данные, показывающие, что в активно экспрессируемых генах бактерий (например, в генах, кодирующих рибосомальные белки, фермент РНК-полимеразу и др.) фактически существуют ограничения, касающиеся чередования оснований Ц и У в информационных РНК, или соответственно оснований Г(Ц) и А(Т) в ДНК. Так, французские ученые Грожан и Фирс обнаружили, что в активно экспрессируемых генах бактерий при выборе» третьего основания в кодонах, имеющих первыми пары оснований УУ, АУ, УА, АА, предпочтение отдается Ц, а не У, тогда как в кодонах, имеющих первыми пары оснований ЦЦ, ГЦ, ЦГ, ГГ, предпочтение, напротив, отдается У. Согласно этой закономерности, например фенилаланин намного чаще кодируется кодоном УУЦ, чем кодоном УУУ, тогда как для пролина чаще встречается кодон ЦЦУ, чем ЦЦЦ.
Для объяснения этих данных Грожан и Фирс предположили, что в активно экспрессируемых генах проявляется тенденция к установлению некоторой средней (оптимальной) энергии взаимодействия кодона в информационной РНК и антикодона в транспортной РНК (несущей аминокислоту). Действительно, поскольку взаимодействие оснований А и У является слабым, а Г и Ц — сильным, то, например, у кодона УУУ (фен) энергия взаимодействия с антикодоном скорее всего была бы ниже оптимального уровня, тогда как у кодона ЦЦЦ (про) — выше. Авторы упомянутой работы критиковали это представление об оптимальной энергии взаимодействия кодона и антикодона, указывая, что для некоторых генов вообще характерно очень низкое или, наоборот, очень высокое содержание оснований Г + Ц. Но по существу, как нетрудно заметить, данные Грожана и Фирса согласуются с упомянутой выше тенденцией к равномерному распределению пар А—Т и Г—Ц в пределах генов.
Надо сказать, что на самом деле правила, регулирующие «подбор» третьего основания, в кодонах, пока просто неясны. Так, советский исследователь, Е. Г. Шпаер не так давно опубликовал результаты работы, в которой он определял, как часто используются разные кодоны-синонимы в сильно экспрессируемых генах в зависимости от контекста, т. е. от соседних оснований, в частности с 5′-стороны (в начале) и с 3′-стороны (в конце) кодона. Оказалось, что при определенных соседних основаниях «выбор» кодонов в сильно экспрессируемых генах противоположен тому, о котором сообщали Грожан и Фирс.
Например, фенилаланин чаще кодируется кодоном УУУ, чем УУЦ, только в том особом случае, когда с 3′-стороны от кодона находится основание Г. Или, например, у глицина кодон ГГУ вообще используется предпочтительнее, чем ГГЦ; но в тех случаях, когда с 3′-стороны от кодона находится основание Г или с 5′-стороны — основание А, чаще используется ГГЦ, чем ГГУ.
Или еще один пример: в сильно экспрессируемых генах аминокислота лизин чаще кодируется кодоном ААГ, если его соседи с 3′-стороны А, У или Ц, но если здесь находится Г, то лизин, как правило, кодируется кодоном ААА.
Данные, полученные Шпаером, ясно указывают на то, что выбор кодонов-синонимов в активных генах бактерий определенно зависит от контекста, т. е. от окружающих оснований. По-видимому, для построения оптимальных конфигураций оснований в генах необходимы все варианты кодонов-синонимов; таким образом, вырожденность генетического кода — далеко не случайный результат эволюции.
Отметим тот факт, что Щожан и Фирс, определяя частоту использования разных кодонов без учета влияния соседних оснований, смогли заметить статистически достоверное расхождение по частоте использования только в тех парах кодонов, которые имели в качестве третьего основания пиримидины У и Ц. Этот факт подчеркивает значимость «электростатического» подхода при объяснении природы активной экспрессии генов, так как именно пиримидиновые основания наиболее сильно разнятся электростатически и эффект этих оснований, по-видимому, не так сильно зависит от соседей, как в случае пуринов.
Если бы электростатическое равновесие не имело значения для функционирования ДНК и РНК, то, вероятно, генетический код не был вырожден и для кодирования 20 общих аминокислот было бы достаточно 20 кодонов.
Между тем эволюционно сложившееся разнообразие кодонов-синонимов позволяет модифицировать нуклеотидные последовательности (главным образом, за счет третьих «букв» кодонов) без какого-либо изменения их генетического смысла. Таким образом, исходя из самого факта вырожденности генетического кода, можно заключить, что допустимое разнообразие нуклеотидных последовательностей в ДНК, при которых сохраняется активное функциональное состояние этой молекулы, по крайней мере не слишком велико. И поэтому a priori имеются предпосылки для предположения о том, что кроссинговер служит механизмом восстановления функционально активного состояния молекулы ДНК.
Для электростатически сбалансированной молекулы ДНК, по-видимому, должна быть характерна лабильность, т. е. способность быстро переходить из состояния жесткой двойной спирали к состоянию с «открытыми» нуклеотидными последовательностями, что характерно для функционирующей молекулы. Имеются генетические данные, позволяющие считать, что кроссинговер, особенно у эукариот, содержащих «избыточную» ДНК с невыясненной функцией, в основном приурочен к областям локализации генов. Повышенная вероятность генетических обменов в районах локализации генов может обеспечиваться определенными последовательностями нуклеотидов, играющими роль сигналов для рекомбинационных ферментов. У Е. coli известна такая последовательность нуклеотидов — так называемый участок Chi (5′-ГЦТГГТГТ), стимулирующий гомологичную рекомбинацию в прилегающем, как правило, функционально активном районе ДНК. Эти данные, хотя и косвенно, подтверждают предположение о том, что кроссинговер представляет собой механизм восстановления функционально активного состояния молекулы ДНК.
Необходимо учитывать, что молекулы ДНК с течением времени накапливают разнообразные мутации (обычно замены пар оснований), причем большинство мутаций оказываются нейтральными. Такие мутации либо не производят никакого видимого действия на организм (как, например, незначащие нуклеотидные замены, приходящиеся на третье основание кодона), либо их эффект не является столь значительным, чтобы повлиять на ход естественного отбора.
В результате накопления мутаций в наборе молекул ДНК, составляющих генофонд вида, возникают многочисленные случайные отклонения от некоторой типичной, но реально не существующей последовательности нуклеотидов. Полиморфизм молекул ДНК в пределах вида, по-видимому, служит необходимой предпосылкой кроссинговера, так как те же самые мутации, т. е. изменения последовательности нуклеотидов, которые нарушают состояние электростатического равновесия, могли бы послужить материалом для воссоздания такого равновесия при очередном генетическом обмене.
Известно, что кроссинговер имеет «практическое» значение в генетике, так как по результатам генетического обмена можно судить о расположении генов в хромосомах. Генетики для простоты принимают за правило, что вероятность разрыва хромосомы при обменах (или вероятность «перекреста» — в паре хромосом) в каждой ее точке одинакова. На самом деле это правило не соблюдается или соблюдается очень примерно в том случае, когда оценивается вероятность разрыва в пределах достаточно протяженных сегментов хромосомы.
Чтобы экспериментально измерить частоту перекрестов в каком-нибудь участке хромосомы, желательно использовать в качестве маркеров по крайней мере две мутации по обе стороны от этого участка. Но оказывается, результаты такого измерения могут зависеть от того, какие именно мутации были использованы в качестве маркеров. Такого рода «эффект маркера» особенно сильно выражен, если исследуется частота перекрестов в пределах коротких сегментов хромосом, порядка нескольких сотен или десятков нуклеотидных пар.
Эффект маркера хорошо «укладывается» в представление о том, что в процессе кроссинговера каким-то образом проявляется влияние каждой отдельной мутации на состояние электростатического равновесия в молекулах ДНК, и в результате происходит такой обмен сегментами двух взаимодействующих молекул ДНК, который позволяет восстановить состояние электростатического равновесия в двух дочерних молекулах — продуктах кроссинговера.
Следует заметить, что по данным физических исследований молекула ДНК ведет себя как уникальное, целостное образование, так что определенная последовательность нуклеотидов в одном участке молекулы может влиять на ее стабильность в другом участке. Этот момент очень важен для того, чтобы интуитивно понять природу процесса кроссинговера, в котором взаимодействуют две молекулы ДНК, вступающие в соединение друг с другом в разных участках по их длине.
В основе кроссинговера, по-видимому, лежит самопроизвольная реакция: электростатические напряжения двух взаимодействующих молекул ДНК как бы суммируются и вызывают смещения отдельных сегментов молекул относительно друг друга. Особенностью кроссинговера как самопроизвольной реакции является то, что продукты этой реакции неоднозначны в том смысле, что довольно разнообразные реципрокные комбинации сегментов из двух исходных молекул ДНК приобретают состояние электростатической устойчивости, причем потенциально возможные равновесные комбинации тем разнообразнее, чем протяженнее молекулы ДНК, участвующие в гомологичной рекомбинации. Это разнообразие продуктов рекомбинации и оценивается генетиками в грубом приближении как случайный, равновероятный перекрест в сегментах молекулы ДЦК одинаковой длины.
Еще раз подчеркнем, что состояние электростатического равновесия в молекулах ДНК восстанавливается благодаря их полиморфизму, т. е. многочисленным отличиям рекомбинирующих молекул ДНК по нуклеотидной последовательности. Для успешного завершения кроссинговера важна именно гомология, т. е. определенное сходство, но не идентичность взаимодействующих молекул ДНК. Согласно такому пониманию кроссинговера, отклонения от правильного реципрокного (или «симметричного») обмена, а именно неравный кроссинговер одинаково более вероятен как при очень сильном нарушении гомологии рекомбинирующих молекул, так и при их полном сходстве.
Итак, согласно данному выше объяснению, кроссинговер — механизм восстановления электростатически сбалансированного состояния молекулы ДНК и тем самым — функционально активного состояния, постоянно нарушающегося из-за накопления мутаций. Разумеется, это объяснение кроссинговера еще требует уточнения в физических терминах. В особенности это касается понятия электростатической устойчивости в применении к ДНК, тем более, что азотистые основания сами по себе вообще-то электронейтральны в довольно широких интервалах pH. Но с точки зрения физических свойств молекулы ДНК многое еще остается неизвестным. Между тем все то, что сказано выше, отвечает ожидаемому с биологической точки зрения представлению о кроссинговере как о механизме репарации ДНК.
Согласно этому представлению, кроссинговер составляет неотъемлемую характеристику жизни. Ведь молекула ДНК фактически сохраняет черты кристаллической структуры, в которой жесткость обеспечивается водородными связями и ван-дер-ваальсовым сцеплением оснований, а не межнуклеотидными ковалентными связями. Отсюда само явление жизни можно было бы определить как способ существования уникальных кристаллоподобных молекул, основанный на самокопировании этих молекул, а также на их периодическом «обновлении» при помощи гомологичного обмена.