При изучении внутреннего строения кристаллических белков с помощью рентгеноструктурного анализа выявляется ясно выраженная упорядоченность в расположении атомов, причем характер этого расположения более или менее стабилен и одинаков для всех молекул кристалла.
Таким образом, с помощью кристаллографии можно получить определенную картину строения данного белка, которое жестко фиксировано и в основном неизменно. С чисто химической точки зрения такая картина не вызывает возражений. Однако в живой клетке белки не находятся в твердом состоянии, а растворены во внутриклеточной жидкости; кроме того, установлено, что в ответ на изменение концентрации водородных ионов и содержания солей, а также при обратимой адсорбции на внутриклеточных поверхностях они постоянно подвергаются небольшим перестройкам. При рассмотрении таких структурных изменений удобно пользоваться предложенными Линдерстром-Лангом категориями, которым он дал названия первичной, вторичной и третичной структуры белка.
Термин первичная структура относится к фиксированной последовательности расположения аминокислотных остатков в полипептидной цепи (или цепях), образующей остов молекулы. К этой категории относятся также ковалентные связи, которые образуют в определенных участках полипептидных цепей поперечные мостики, например дисульфидные связи между полуцистиновыми остатками или фосфатные диэфирные связи некоторых фосфопротеидов.
Представление о вторичной структуре связано главным образом с относительно недавно открытым спиральным свертыванием пептидных цепей белков, фиксированным водородными связями между амидными (CONH) звеньями цепи. В ряде случаев спиральное свертывание в полипептидной цепи можно воспроизвести в виде атомных моделей, которые удовлетворяют геометрическим условиям, вытекающим из данных о величине углов между связями и о расстояниях между атомами; для веществ с низким молекулярным весом, таких, как ди — и трипептиды, эти данные можно получить методом рентгеноструктурного анализа. Отдельные модели различаются числом аминокислотных остатков в витке спирали, величиной шага спирали по продольной оси и числом незаполненных участков между их центрами.
Из всех видов спиралей, предложенных в качестве компонентов структуры белка, наиболее правдоподобной представляется так называемая α-спираль. В этой структуре максимальное число внутриспиральных водородных связей находится между связями CONH, и вследствие этого структура весьма стабильна. По-видимому, наиболее существенная особенность этой структуры состоит в том, что атомы, образующие пептидную связь, лежат в одной плоскости. На основании кристаллографических исследований модельных пептидов полагают, что вероятность такой плоскостной конфигурации весьма велика. Показано, каким образом растянутая β-кератиновая» форма полипептидной цепи свертывается, приобретая конфигурацию α-спирали. Каждая амидная группа связана, в порядке чередования, с третьей амидной группой водородной связью. На каждый полный виток спирали приходится 3,7 аминокислотного остатка, причем длина каждого остатка (вдоль центральной оси) равна 1,47 А. Шаг винта составляет, таким образом, 5,44 А.
Физико-химические исследования белков и модельных полипептидов показали, что, несмотря на устойчивость, которую придают молекуле белка внутренние водородные связи, все же в растворе спиральная структура недостаточно устойчива и развертывается, образуя беспорядочно ориентированные нити. Для того чтобы спиральная структура была устойчива, необходимо наличие дисульфидных мостиков и (или) третичной структуры. По-видимому, только те части белков, которые соединены такими связями, могут сохранять спиральную конфигурацию.
К третичным связям относятся, например, связи, возникающие за счет ван-дер-ваальсовых сил, взаимного отталкивания между молекулами растворителя, в результате которого образуются скопления лиофобных боковых цепей, а также особые водородные связи, которые, возможно, существуют между гидроксильными группами тирозина или аминогруппами е-лизина, с одной стороны, и электроотрицательными группами, расположенными в других местах вдоль цепи, — с другой. Обратимые и необратимые изменения, которые возможны во вторичной и третичной структурах, определяются в основном первичной ковалентной структурой белка, которая постоянна и не меняется под влиянием обычных изменений, происходящих в окружающей среде. Таким образом, чтобы понять физико-химическое поведение белков в растворе, нужно детально изучить их химическую структуру.
Для оценки современного состояния наших знаний следует рассмотреть эту проблему с тех позиций, на которых находилась химия белка примерно 15 лет назад. В то время мы располагали большим количеством довольно точных данных о поведении белков в растворе, однако макромолекулярные структуры оставались окруженными ореолом таинственности. Это объяснялось в основном почти полным отсутствием данных относительно аминокислотного состава белков и последовательности расположения в них аминокислотных остатков.
Основы для современного подхода к строению белка были заложены Сэнджером и его сотрудниками. Исследовав молекулу инсулина, они показали (по крайней мере на примере анализа структуры одного белка), что непреодолимых трудностей в этой области не существует. Надежды на успех, порожденные достижениями Сэнджера, и использование разработанных им методов структурного анализа привели к тому, что за последние годы были предприняты попытки расшифровать структуру ряда других белков. Благодаря накопленному в результате этих исследований опыту в настоящее время можно с большими шансами на успех изучать строение почти любых белков, обладающих не слишком большим молекулярным весом. Уже удалось, например, полностью выяснить последовательность расположения аминокислот в молекуле инсулинов и адренокортикотропных гормонов животных нескольких видов, в молекуле глюкагона быка, а также в молекулах гормонов гипофиза свиньи и быка, стимулирующих образование меланоцитов. Сравнительно скоро будет закончено изучение последовательности расположения аминокислот в молекулах некоторых ферментов, в том числе рибонуклеазы, папаина и лизоцима. Во многих лабораториях исследуется ряд других биологически активных белков.
Сколько-нибудь полное изложение методов определения последовательности аминокислот в полипептидной цепи выходит за рамки этой книги, однако мы считаем желательным дать о них некоторое представление. В дальнейшем кратком изложении мы исходим из допущения, что для анализа в нашем распоряжении имеются образцы белков, гомогенность строения которых доказана. Вопрос о гетерогенности отдельных белков и о значении этой гетерогенности в связи с проблемами синтеза белка и наследственности рассмотрен в соответствующих главах. В качестве модели для обсуждения методов исследования мы выбрали хорошо изученный белок — фермент рибонуклеазу.
Этот фермент найден во всех изученных до сих пор живых клетках. Он катализирует реакцию трансфосфорилирования, которая приводит к гидролизу некоторых фосфодиэфирных связей пиримидиновых нуклеотидных остатков, входящих в состав рибонуклеиновой кислоты. Расщепление ряда синтетических субстратов также катализируется этим ферментом, что может служить основой для определения активности фермента. Хотя специфическая роль рибонуклеазы в обмене веществ клетки еще не известна, однако, по всей вероятности, она играет важную роль в процессе биосинтеза белка. Большое количество рибонуклеазы образуется и секретируется поджелудочной железой. Выделяемая этой железой рибонуклеаза катализирует интенсивный гидролиз рибонуклеиновой кислоты в кишечнике.
Структура рибонуклеазы поджелудочной железы быка изучалась в течение нескольких лет в двух лабораториях с применением различных методов, причем результаты исследований оказались одинаковыми.
Первая ступень изучения структуры любого белка заключается в получении точных аналитических данных об аминокислотном составе его молекулы. Такие данные для рибонуклеазы были получены Хирсом, Муром и Стейном, которые с помощью весьма точного хроматографического анализа показали, что этот белок содержит 124 аминокислотных остатка.
Для того чтобы определить, образуют ли эти 124 аминокислоты одну или несколько полипептидных цепей, связанных между собой поперечными связями, были проведены различные физико-химические исследования.
В молекуле рибонуклеазы можно было предположить наличие пяти полипептидных цепей, соединенных поперечными связями, так как эта молекула содержит четыре цистиновых остатка. Поэтому этот белок окисляли надмуравьиной кислотой, которая превращает атомы серы дисульфидных связей в кислые сульфоновые группы. Данные ультрацентрифугирования и определения вязкости позволили сделать расчеты, показавшие, что окисленный белок, по существу, имеет такой же молекулярный вес, как и нативный. Если бы в белке содержалось более одной цепи, то средний молекулярный вес, при определении его этими физическими методами, оказался бы заметно ниже.
Содержание в белке лишь одной полипептидной цепи было показано также путем определения «концевых групп». В молекуле белка свободные α-аминогруппы содержатся только в концевых аминокислотах полипептидных цепей. Эти аминогруппы могут реагировать с такими реактивами, как, например, динитрофторбензол, образуя динитрофенольные (ДНФ) производные белка, в которых N-концевые аминокислоты (т. е. концевые NH2-группы) превращены в ДНФ-производные.
Такой измененный белок расщепляется кислотой или протеолитическими ферментами, причем ДНФ-N-концевой аминокислотный остаток или пептид можно выделить и изучить его химический состав. Этим способом были получены данные, показывающие, что в изучаемом белке имеется лишь одна свободная аминогруппа, расположенная в цепи лиз-глу-тре-ала.
Для частичной характеристики С-концевого остатка (т. е. СООН-концевой аминокислоты) пользовались ферментом карбоксипептидазой как одним из средств для специфического расщепления пептидной связи на этом конце цепи. Этот фермент удалял из рибонуклеазы валин и лишь следы других аминокислот. Присутствие в белке лишь одного N-концевого и одного С-концевого остатков подтверждает результаты физических исследований, говорящих в пользу наличия одной цепи.
Гидролиз окисленной цепи проводили при помощи ряда протеолитических ферментов, так как последние способны катализировать разрыв значительно более ограниченного числа пептидных связей, чем минеральные кислоты. В настоящее время ясно, что на этой стадии анализа можно вообще обойтись без неспецифического гидролиза кислотами, используя его лишь при последующем изучении последовательности расположения аминокислот в небольших пептидных цепочках, образующихся в результате предварительного действия ферментов.
Схематически изображены два главных метода, применяемых для детального анализа строения полипептидных цепей. Этими методами было исследовано строение молекулы рибонуклеазы, и ими можно пользоваться для изучения любых других белков. В обоих случаях молекула нативного белка развертывается вследствие расщепления дисульфидных мостиков либо путем окисления полуцистиновых остатков до остатков цистеиновой кислоты, либо путем восстановительного расщепления, сопровождающегося химической маскировкой образующихся сульфгидрильных групп некоторыми химическими соединениями, например йодуксусной кислотой. (Последний метод расщепления пептидной связи имеет существенное преимущество перед окислительным методом, так как его можно применять к белкам, содержащим триптофан — аминокислотный остаток, весьма неустойчивый в условиях окисления дисульфидных мостиков надмуравьиной кислотой.)
По методу А один образец гидролизуется трипсином, который разрывает пептидные связи, локализованные либо рядом с остатком лизина, либо рядом с остатком аргинина, а другой образец обрабатывается химотрипсином (или некоторыми другими протеазами с иным специфическим действием); как было указано выше, при этом образуются совершенно различные, но частично перекрывающиеся пептидные фрагменты, в которых можно установить последовательность аминокислот.
По методу Б трипсин разрывает только пептидные связи, локализованные рядом с аргинином, так как ε-аминогруппы остатков лизина маскируются динитрофенильными группами или же карбобензоксигруппами. Таким образом, число фрагментов, которое мы получаем, применяя этот метод, лишь на единицу превышает число остатков аргинина в белке. Все эта фрагменты содержат С-концевой аргинин, за исключением одного, располагавшегося с С-конца цепи (который фиксировал ее положение).
Метод Б связан с определением последовательности аминокислот в коротких пептидных фрагментах, выделенных из гидролизатов, полученных без применения специфических агентов, т. е. путем кислотного гидролиза белков или путем гидролиза совершенно неспецифичными протеазами, такими, как субтилизин (бактериальная протеаза), которые отщепляют короткие, легко поддающиеся исследованию пептиды. Эти фрагменты, содержащие аргинин, используются затем в качестве связующих звеньев между крупными полипептидными фрагментами, первоначально полученными при распаде карбобензоксилированного белка.
Группа исследователей из Рокфеллеровского института, применявшая метод А, обрабатывала препараты окисленной рибонуклеазы пепсином, трипсином и химотрипсином. Из полученных гидролизатов отдельные фрагменты пептидов выделяли путем хроматографии на колонках. Исследование перекрывающихся фрагментов дало возможность этим исследователям воссоздать большие участки пептидной цепи. Примером такой реконструкции могут служить экспериментальные данные Хирса, Мура и Стейна, осуществивших частичную реконструкцию цепи рибонуклеазы. Исследование проводили на колонках с ионообменной смолой Дауэкс 50, через которую при соответствующих условиях элюирования пропускали гидролизат окисленной рибонуклеазы, полученный с помощью трипсина. Пептидные фракции, извлеченные из колонки, подвергали затем гидролизу, и полученные гидролизаты пропускали по отдельности через соответствующие колонки из смолы Дауэкс 50 для определения аминокислотного состава.
Если сопоставить данные с результатами определения последовательности N-концевых аминокислот и с данными, показывающими, что число некоторых аминокислотных остатков в рибонуклеазе весьма ограничено (например, число остатков фенилаланина равно 3, глицина — 3, метионина и гистидина — по 4 и т. п.), то это позволит частично воссоздать последовательность расположения аминокислот в ферменте, что дает возможность воспроизвести их примерное расположение вдоль цепи; атомы амидного азота, за исключением тех, которые относятся к отдельным остаткам аспарагиновой и глутаминовой кислот, распределены произвольно среди заключенных в скобки дикарбоновых аминокислот).
Другой подход к расшифровке строения рибонуклеазы дает результаты, сходные с теми, которые получены методом А. Поскольку рибонуклеаза содержит четыре остатка аргинина, следует ожидать, что, пользуясь этим методом, можно прийти к заключению о наличии в молекуле пяти пептидов различного размера. И в самом деле, оказалось, что под действием трипсина образуются именно такие пептиды. Они были выделены, подвергнуты анализу и частично охарактеризованы с точки зрения их концевых аминокислот.
Последующая характеристика коротких цепей, содержащих аргинин и выделенных из гидролизатов, полученных в результате ферментативного гидролиза пепсином или кислотного гидролиза, дала возможность расположить эти фрагменты в определенном порядке А-Б-В-Г-Д. Сравнение молекул, частично реконструированных этими двумя методами, показывает, что, сопоставляя данные, полученные различными методами, можно в конце концов получить более детальную картину строения белка, чем при использовании лишь какого-либо одного метода.
Для получения полной картины ковалентной структуры белка необходимо, помимо досконального выяснения последовательности расположения аминокислот в каждом пептидном фрагменте, изучить дисульфидные мостики. Положение этих мостиков в цепи можно определить при помощи методов, разработанных Сэнджером и его сотрудниками при исследовании инсулина.
Нативный белок, в котором эти мостики не повреждены, расщепляют разными протеазами (например, трипсином с добавлением химотрипсина или субтилизина). Из продуктов расщепления можно выделить пептиды, содержащие цистин, которые вырваны из нативной молекулы, имеющей поперечные связи. Основные методы определения положения дисульфидных; мостиков, которыми пользовались обе группы исследователей как в Рокфеллеровском институте, так и в Национальном институте сердца. Применяя в основном эти же методы, Шпакман, Мур и Стейн смогли, например, выделить пептид, содержащий цистин, который при окислении надмуравьиной кислотой распадался на два пептида, содержащих цистеиновую кислоту.
Судя по аминокислотному составу этих пептидов, остатки цистеиновой кислоты могли образоваться только из полуцистиновых остатков 1 и 6 соответственно, а это указывает, что в нативном белке между этими остатками имеются дисульфидные мостики. Остатки полуцистина нумеруются последовательно, начиная с N-конца цепи. Таким же способом были получены данные о дисульфидных связях между полуцистиновыми остатками 4 и 5 и с некоторыми оговорками (ввиду возможных химических изменений при выделении) между остатками 3 и 7, а также 2 и 8.
Результаты комбинированных исследований по расщеплению рибонуклеазы, наряду с выделением и попытками выяснить локализацию цистиновых мостиков, позволяют построить предварительную формулу этого фермента.
Приведены в сжатой форме основные данные, полученные Ли и его сотрудниками при изучении строения адренокортикотропного гормона (АКТГ), выделяемого передней долей гипофиза. Все эти различные фрагменты согласуются лишь с одним порядком расположения аминокислотных остатков.
Как мы увидим в дальнейшем, знание полной ковалентной структуры белковой молекулы, к сожалению, не может служить ключом, который открыл бы нам путь к пониманию физико-химического и каталитического поведения белка. Истинного понимания целей, которые ставила себе природа, создавая молекулу белка, можно достигнуть лишь путем дальнейшего изучения ее пространственной структуры.