Первичная структура белков представляет собой линейную последовательность аминокислотных остатков, соединённых между собой пептидными связями. Эта последовательность полностью определяет индивидуальные свойства, пространственную организацию и биологическую функцию белковой молекулы. Любое изменение в последовательности аминокислот, даже одно замещение, способно изменить конформацию, стабильность или активность белка.
Пептидная связь образуется между α-карбоксильной группой одной аминокислоты и α-аминогруппой другой с отщеплением молекулы воды. В результате возникает прочная амидная связь — –CO–NH–, обладающая частично двойным характером вследствие делокализации электронов между атомами кислорода, углерода и азота. Это приводит к ограничению вращения вокруг пептидной связи и придаёт цепи планарность.
Каждый аминокислотный остаток в цепи имеет однотипную структурную основу — пептидный остов (–N–Cα–C–), к которому присоединены различные радикалы боковых цепей (R-группы). Полипептидная цепь имеет направленность: на одном конце находится свободная аминогруппа (N-конец), на другом — свободная карбоксильная группа (C-конец). В записях и схемах последовательность аминокислот всегда приводится от N- к C-концу.
Жёсткость пептидной связи делает всю цепь совокупностью плоских звеньев, соединённых относительно свободными связями вокруг атомов Cα. Эти связи характеризуются углами вращения φ (вокруг связи N–Cα) и ψ (вокруг связи Cα–C). Значения этих углов определяют возможные пространственные конфигурации полипептида и, следовательно, задают предпосылки для формирования вторичной структуры.
Из-за стерических ограничений и взаимного отталкивания боковых групп далеко не все комбинации φ и ψ углов энергетически допустимы. Диаграмма Рамачандрана отражает эти допустимые области и служит основой для анализа возможных конформаций пептидной цепи.
Первичная структура белков кодируется последовательностью нуклеотидов в соответствующем гене. Каждый триплет нуклеотидов (кодон) задаёт конкретную аминокислоту, включаемую в растущую цепь при трансляции. Таким образом, генетическая информация ДНК реализуется через последовательность аминокислот, что обеспечивает точность и специфичность синтеза белков.
Любое изменение в нуклеотидной последовательности (мутация) может привести к изменению первичной структуры белка. Замена даже одной аминокислоты способна привести к нарушению пространственной организации и потере биологической активности, как, например, в случае серповидноклеточной анемии, вызванной заменой глутаминовой кислоты на валин в β-цепи гемоглобина.
Определение последовательности аминокислот в белках осуществляется с помощью химических и ферментативных методов.
1. Гидролиз белка. Полное кислотное или ферментативное расщепление пептидных связей позволяет определить качественный и количественный состав аминокислот. Однако этот метод не даёт информации о порядке их следования.
2. Частичный гидролиз и фрагментация. Используются специфические протеазы (трипсин, химотрипсин, пепсин) или химические реагенты (циангенбромид), расщепляющие связи после определённых аминокислот. Полученные пептиды анализируются, а их последовательность устанавливается по частичному перекрытию фрагментов.
3. Деградация Эдмана. Пошаговое удаление N-концевых остатков с помощью фенилизотиоцианата позволяет определить последовательность аминокислот от начала цепи. Метод особенно эффективен для пептидов длиной до 50 остатков.
4. Мас-спектрометрия. Современные масс-спектрометрические методы, включая MALDI-TOF и ESI-MS, позволяют с высокой точностью идентифицировать аминокислотную последовательность и посттрансляционные модификации белков.
Хотя первичная структура — это линейная последовательность аминокислот, в ней уже заложена информация о будущей трёхмерной структуре белка. Определённые участки последовательности формируют структурные домены, то есть компактные и относительно независимые фрагменты, выполняющие специфические функции. Часто эти домены консервативны у различных белков и организмов, что подчёркивает их эволюционную устойчивость.
Боковые цепи аминокислот влияют на локальные взаимодействия в цепи: образование водородных связей, ионных взаимодействий, гидрофобных контактов и дисульфидных мостиков. Эти взаимодействия, заложенные в первичной структуре, определяют пути сворачивания полипептидной цепи и образование более высоких уровней структурной организации.
Большинство природных белков построено из L-аминокислот. Введение D-форм, встречающихся редко (например, в пептидах бактериальных клеточных стенок или некоторых антибиотиках), изменяет стереохимию и устойчивость пептидной цепи.
После синтеза полипептида возможны посттрансляционные модификации, не изменяющие его первичную структуру в смысле генетического кода, но влияющие на свойства и активность белка. К таким модификациям относятся фосфорилирование, метилирование, ацетилирование, гидроксилирование и образование дисульфидных связей.
Первичная структура определяет не только пространственную конфигурацию белка, но и его стабильность, растворимость, способность к ассоциации и взаимодействию с другими молекулами. Любые функциональные свойства белков — от каталитической активности ферментов до связывания гормонов или ионов — прямо или косвенно обусловлены точной последовательностью аминокислотных остатков.
Вся сложная иерархия структурной организации белков — от вторичной и третичной до четвертичной — формируется на основе информации, заключённой в первичной структуре. Именно поэтому анализ и понимание аминокислотной последовательности является фундаментом биоорганической химии и молекулярной биологии.