Асн аминокислота расшифровка: Полезная информация об аминокислотах. Советы доктора

Содержание

Полезная информация об аминокислотах. Советы доктора

В нашем Центре осуществляется анализ на 15 важнейших аминокислот.

Аланин

Alanine

ALA

Валин

Valine

VAL

Метионин

Methionine

MET

Альфа-амино-масляная к-та

Alfa-Aminobutyric Acid

AAB

Гидроксипролин

Hydroxyproline

HYPRO

Серин

Serine

SER

Аргинин

Arginine

ARG

Гистидин

Histidine

HIS

Таурин

Taurine

TAU

Аспарагин

Asparagine

ASN

Глицин

Glycine

GLY

Тирозин

Tyrosine

TYR

Аспарагиновая к-та

Aspartic Acid

ASP

Глутамовая к-та

Glutamic Acid

GLU

Треонин

Threonine

THR

Альфа-аминомасляная кислота повышает синтез белка, что способствует его восполнению при интенсивных занятиях спортом. Промежуточный метаболит окислительного распада треонина и метионина. Низкие уровни этой аминокислоты, фиксируемые в результатах анализа крови на аминокислоты, свидетельствуют о недостаточном приеме треонина или метионина, также это может быть связано с недостаточным поступлением в организм витамина В6.

Аланин играет главную роль в цикле преобразования аминокислот в глюкозу. Обладает иммуномодулирующим действием. Считается, что аланин можно эффективно использовать для увеличения концентрации глюкозы в крови перед стартом или после тренировки, когда это особенно необходимо атлету. Анализ крови на эту аминокислоту важен для спортсменов.

Аргинин является условно заменимой аминокислотой, т.е. он может быть синтезирован организмом из других аминокислот. Аргинин стимулирует процессы высвобождения в кровоток инсулина, глюкагона и гормона роста, обладает выраженным анаболическим эффектом, помогая залечивать раны и участвуя в образовании коллагена.

Известна способность аргинина повышать иммунореактивность организма. Это свойство обусловлено влиянием на Т-лимфоциты иммунной системы. Помимо всего аргинин является предшественником креатина.

Аспарагин - амид аспарагиновой кислоты, заменимая аминокислота. В живых клетках присутствует в свободном виде и в составе белков (богаты аспарагином белки семян). Наряду с глутамином аспарагин - растворимое Nh3-содержащее резервное соединение для биосинтеза белков у многих растений. Путем образования аспарагина из аспарагиновой кислоты в организме связывается токсический аммиак.

Аспарагиновая кислота - заменимая аминокислота. Входит в состав белков (кроме протаминов), играет важную роль в реакциях цикла мочевины и переаминирования, участвует в биосинтезе пуринов и пиримидинов, предшественник в биосинтезе незаменимых аминокислот метионина, треонина и лизина у растений и микроорганизмов. Декарбоксилированием аспарагиновой кислоты могут получаться альфа- и бета-аланины.

Аспарагиновая кислота служит предшественником и первой ступенью распада аспарагина в обмене веществ.

Глутаминовая кислота не только может быть синтезирована в организме из других аминокислот, но и сама является главным предшественником для синтеза ряда важнейших аминокислот и обеспечивает обменные процессы. Путем химических преобразований из глутаминовой кислоты образуются глутамин, пролин, аргинин и глутатион. Является потенциальным источником энергии в организме. Глутаминовая кислота способствует концентрации внимания и может приниматься через некоторые промежутки времени по 1-3 г.

Глицин способствует синтезу других аминокислот и входит в состав структуры гемоглобина и цитохромов. В энергетическом плане является ключевым звеном в синтезе глюкагона – одного из основных факторов, влияющих на использование запасов гликогена мышц и печени.

Гистидин участвует в производстве красных и белых кровяных телец и применяется при анемии, лечении аллергических заболеваний, язв желудка и кишечника.

Гистидин - исходное вещество при биосинтезе гистамина и биологически активных пептидов мышц (карнозина и анзерина).

Гидроксипролин образуется из пролина в результате посттрансляционного гидроксилирования пептидной цепи. Свободный гидроксипролин, освобождающийся во время деградации коллагена, не может повторно использоваться для синтеза этого белка. Поэтому большая часть эндогенного гидроксипролина, находящегося в биологических жидкостях, является продуктом распада различных форм коллагена.

Метионин является незаменимой аминокислотой – предшественником цистина и креатина. Метионин участвует в восстановлении тканей печени и почек и способствует выведению токсинов из организма. Эта аминокислота стимулирует повышение уровня антиоксидантов и участвует в жировом обмене, снижая содержание холестерина. Анализ крови на уровень этой аминокислоты может потребоваться пациентам с проблемами сердечно-сосудистой системы.

Серин – одна из важнейших аминокислот, необходимых для производства клеточной энергии. Как и многие другие аминокислоты, стимулирует систему иммунитета организма. Некоторые исследователи считают, что серин необходимо принимать между приемами пищи, так как эта аминокислота способна увеличить уровень глюкозы в крови. Это особенно важно перед соревнованиями или после физической нагрузки в качестве компонента углеводной загрузки. На рынке спортивного питания появился весьма эффективный препарат фосфатидилсерин. Это вещество относится к классу так называемых фосфоацилглицеролов. Основное действие фосфатидилсерина связано с передачей нервных импульсов в головной мозг и, в частности, в гипоталамус. С возрастом продукция этого фактора снижается. Поэтому фосфатидилсерин часто используют для улучшения умственной работоспособности. Препарат фосфатидилсерин снижает уровень кортизола и поднимает таким образом анаболические процессы на новый уровень. Анализ крови на содержание этой аминокислоты важен для широкого круга пациентов.

Таурин (ß-аминоэтансульфоновая кислота) - природная аминосульфоновая кислота.

У позвоночных животных и человека встречается в головном и спинном мозге, периферических нервах, мышцах, печени, почках, крови, молоке. Амиды, образованные таурином и желчными кислотами (например, таурохолевая кислота), входят в состав желчи млекопитающих и обеспечивают эмульгирование и всасывание жиров. Таурин выводится из организма с мочой в свободном состоянии, а также в виде производных с гуанидином или карбаминовой кислотой. При попадании в кишечник таурин под действием микрофлоры распадается до неорганических сульфидов.

Треонин - незаменимая аминокислота, входит в состав всех природных белков, за исключением протаминов. Суточная потребность в ней у взрослого человека составляет 0,5 г, у детей до 7 лет - около 3 г. Треонин участвует в обезвреживании токсинов, предотвращает накопление жира в печени и является важным компонентом коллагена.

Анализ на аминокислоты и оценка их результатов - область интересов не только врачей и аналитиков, но и исследователей, см.
например, здесьАнализ на заменимые и незаменимые аминокислоты в рационе питания школьников Беларуси Speciation-анализ на аминокислоты и микроэлементы

Протеиногенная аминокислота - Proteinogenic amino acid

Аминокислота, которая биосинтетически включается в белки во время трансляции

Протеиногенные аминокислоты составляют небольшую часть всех аминокислот.

Протеиногенные аминокислоты - это аминокислоты , которые биосинтетически включаются в белки во время трансляции . Слово «протеиногенный» означает «создающий белок». На протяжении всей известной жизни существует 22 генетически кодируемых (протеиногенных) аминокислоты, 20 - в стандартном генетическом коде и еще 2, которые могут быть включены с помощью специальных механизмов трансляции.

Напротив, непротеиногенные аминокислоты - это аминокислоты, которые либо не включены в белки (такие как ГАМК , L- ДОФА или трийодтиронин ), неправильно включены вместо генетически кодируемой аминокислоты или не продуцируются напрямую и изолированно стандартными клеточными машины (например, гидроксипролин ).

Последнее часто является результатом посттрансляционной модификации белков. Некоторые непротеиногенные аминокислоты включены в нерибосомные пептиды, которые синтезируются нерибосомными пептидными синтетазами.

Как эукариоты, так и прокариоты могут включать селеноцистеин в свои белки через нуклеотидную последовательность, известную как элемент SECIS , который направляет клетку на перевод соседнего кодона UGA как селеноцистеина (UGA обычно является стоп-кодоном ). У некоторых метаногенных прокариот кодон UAG (обычно стоп-кодон) также может транслироваться в пирролизин .

У эукариот есть только 21 протеиногенная аминокислота, 20 из них стандартного генетического кода, плюс селеноцистеин . Люди могут синтезировать 12 из них друг от друга или из других молекул промежуточного метаболизма. Остальные девять необходимо употреблять (обычно в виде их белковых производных), поэтому они называются незаменимыми аминокислотами .

Незаменимыми аминокислотами являются гистидин , изолейцин , лейцин , лизин , метионин , фенилаланин , треонин , триптофан и валин (т.е. H, I, L, K, M, F, T, W, V).

Было обнаружено, что протеиногенные аминокислоты относятся к набору аминокислот, которые могут распознаваться системами аутоаминоацилирования рибозимов . Таким образом, непротеиногенные аминокислоты были бы исключены из-за случайного эволюционного успеха нуклеотидных форм жизни. Были предложены и другие причины, объясняющие, почему некоторые специфические непротеиногенные аминокислоты обычно не включаются в белки; например, орнитин и гомосерин циклизуются против основы пептида и фрагментируют белок с относительно коротким периодом полураспада , в то время как другие являются токсичными, поскольку они могут быть ошибочно включены в белки, такие как аналог аргинина канаванин .

Структуры

Ниже показаны структуры и сокращения 21 аминокислоты, которые непосредственно кодируются для синтеза белка генетическим кодом эукариот.

Приведенные ниже структуры являются стандартными химическими структурами, а не типичными формами цвиттериона, которые существуют в водных растворах.

Сгруппированная таблица структуры 21 аминокислоты, номенклатуры и значений pKa их боковых групп

IUPAC / IUBMB теперь также рекомендует стандартные сокращения для следующих двух аминокислот:

Химические свойства

Ниже приводится таблица, в которой перечислены однобуквенные символы, трехбуквенные символы и химические свойства боковых цепей стандартных аминокислот. Указанные массы основаны на средневзвешенных значениях элементарных изотопов при их естественном содержании . Образование пептидной связи приводит к удалению молекулы воды . Следовательно, масса белка равна массе аминокислот, из которых он состоит, минус 18,01524 Да на пептидную связь.

Общие химические свойства

Аминокислота короткий Аббревиатура Средн. масса ( Да ) Пи pK 1
(α-COOH)
рК 2
(α- + NH 3 )
Аланин А Ала 89,09404 6.01 2.35 9,87
Цистеин C Cys 121,15404 5,05 1,92 10,70
Аспарагиновая кислота D Жерех 133,10384 2,85 1,99 9,90
Глютаминовая кислота E Glu 147.13074 3,15 2.10 9,47
Фенилаланин F Phe 165,19184 5,49 2,20 9,31
Глицин г Gly 75. 06714 6.06 2.35 9,78
Гистидин ЧАС Его 155,15634 7,60 1,80 9,33
Изолейцин я Иль 131,17464 6,05 2.32 9,76
Лизин K Lys 146.18934 9,60 2,16 9.06
Лейцин L Лея 131,17464 6.01 2.33 9,74
Метионин M Встретил 149.20784 5,74 2,13 9,28
Аспарагин N Asn 132.11904 5,41 2,14 8,72
Пирролизин О Пыл 255,31 ? ? ?
Пролин п Pro 115,13194 6. 30 1,95 10,64
Глутамин Q Gln 146.14594 5,65 2,17 9,13
Аргинин р Arg 174.20274 10,76 1,82 8,99
Серин S Сер 105,09344 5,68 2,19 9.21
Треонин Т Thr 119.12034 5,60 2,09 9.10
Селеноцистеин U Сек 168,053 5,47 1,91 10
Валин V Вал 117.14784 6.00 2.39 9,74
Триптофан W Trp 204.22844 5,89 2,46 9,41
Тирозин Y Тюр 181. 19124 5,64 2,20 9.21

Свойства боковой цепи

§: Значения для Asp, Cys, Glu, His, Lys и Tyr были определены с использованием аминокислотного остатка, помещенного по центру в пентапептид аланина. Значение Arg взято из Pace et al. (2009). Значение Sec взято из Byun & Kang (2011).

ND: Значение pKa пирролизина не сообщалось.

Примечание. Значение pKa аминокислотного остатка в небольшом пептиде обычно немного отличается, когда он находится внутри белка. Расчет pKa белка иногда используется для расчета изменения значения pKa аминокислотного остатка в этой ситуации.

Экспрессия генов и биохимия

Аминокислота короткий Аббревиатура Кодон (ы) Вхождение Эфирное ‡ в организме человека
в архейских белках
(%) и
в белках бактерий
(%) и
в белках эукариотов
(%) и
Встречаемость
в человеческих белках
(%) и
Аланин А Ала GCU, GCC, GCA, GCG 8,2 10. 06 7,63 7.01 Нет
Цистеин C Cys УГУ, УГК 0,98 0,94 1,76 2.3 Условно
Аспарагиновая кислота D Жерех GAU, GAC 6.21 5,59 5,4 4,73 Нет
Глютаминовая кислота E Glu GAA, GAG 7,69 6,15 6,42 7.09 Условно
Фенилаланин F Phe UUU, UUC 3,86 3,89 3,87 3,65 да
Глицин г Gly GGU, GGC, GGA, GGG 7,58 7,76 6.33 6.58 Условно
Гистидин ЧАС Его CAU, CAC 1,77 2,06 2,44 2,63 да
Изолейцин я Иль AUU, AUC, AUA 7,03 5,89 5. 1 4,33 да
Лизин K Lys AAA, AAG 5,27 4,68 5,64 5,72 да
Лейцин L Лея UUA, UUG, CUU, CUC, CUA, CUG 9,31 10.09 9.29 9,97 да
Метионин M Встретил AUG 2.35 2.38 2,25 2,13 да
Аспарагин N Asn AAU, AAC 3,68 3,58 4,28 3,58 Нет
Пирролизин О Пыл UAG * 0 0 0 0 Нет
Пролин п Pro CCU, CCC, CCA, CCG 4,26 4,61 5,41 6,31 Нет
Глутамин Q Gln CAA, CAG 2. 38 3,58 4,21 4,77 Нет
Аргинин р Arg CGU, CGC, CGA, CGG, AGA, AGG 5,51 5,88 5,71 5,64 Условно
Серин S Сер UCU, UCC, UCA, UCG, AGU, AGC 6,17 5,85 8,34 8,33 Нет
Треонин Т Thr ACU, ACC, ACA, ACG 5,44 5,52 5,56 5,36 да
Селеноцистеин U Сек УГА ** 0 0 0 > 0 Нет
Валин V Вал GUU, GUC, GUA, GUG 7,8 7,27 6.2 5,96 да
Триптофан W Trp UGG 1. 03 1,27 1,24 1,22 да
Тирозин Y Тюр UAU, UAC 3,35 2,94 2,87 2,66 Условно
Стоп-кодон † - Срок UAA, UAG, UGA †† ? ? ? Нет данных Нет данных

* UAG обычно является янтарным стоп-кодоном , но в организмов, содержащих биологический механизм, кодируемый кластером генов pylTSBCD, аминокислота пирролизин будет включена.
** UGA обычно является стоп-кодоном опала (или умбры), но кодирует селеноцистеин, если присутствует элемент SECIS .
† стоп - кодон не является аминокислотой, но для полноты.
†† UAG и UGA не всегда действуют как стоп-кодоны (см. Выше).
‡ Незаменимая аминокислота не может быть синтезирована в организме человека и поэтому должна поступать с пищей. Условно незаменимые аминокислоты обычно не требуются в рационе, но должны поступать экзогенно в определенные группы населения, которые не синтезируют их в достаточных количествах.
& Наличие аминокислот основано на 135 протеомах архей, 3775 бактериях, 614 протеомах эукариот и протеоме человека (21 006 белков) соответственно.

Масс-спектрометрии

В масс-спектрометрии пептидов и белков полезно знать массы остатков. Масса пептида или белка представляет собой сумму масс остатков плюс масса воды ( моноизотопная масса = 18,01056 Да; средняя масса = 18,0153 Да). Остаточные массы рассчитываются по табличным химическим формулам и атомным весам. В масс-спектрометрии ионы могут также включать один или несколько протонов ( моноизотопная масса = 1,00728 Да; средняя масса * = 1,0074 Да). * Протоны не могут иметь среднюю массу, это сбивает с толку, что дейтероны являются действующим изотопом, но они должны быть другого вида (см. Hydron (химия) )

Аминокислота короткий Аббревиатура Формула Пн. масса § ( Да ) Средн. масса ( Да )
Аланин А Ала C 3 H 5 НЕТ 71.03711 71,0779
Цистеин C Cys C 3 H 5 БДУ 103.00919 103,1429
Аспарагиновая кислота D Жерех C 4 H 5 НЕТ 3 115.02694 115,0874
Глютаминовая кислота E Glu C 5 H 7 НЕТ 3 129,04259 129,1140
Фенилаланин F Phe C 9 H 9 НЕТ 147. 06841 147,1739
Глицин г Gly C 2 H 3 НЕТ 57,02146 57,0513
Гистидин ЧАС Его C 6 H 7 N 3 O 137,05891 137,1393
Изолейцин я Иль C 6 H 11 НЕТ 113,08406 113,1576
Лизин K Lys C 6 H 12 N 2 O 128,09496 128,1723
Лейцин L Лея C 6 H 11 НЕТ 113,08406 113,1576
Метионин M Встретил C 5 H 9 БДУ 131,04049 131,1961
Аспарагин N Asn C 4 H 6 N 2 O 2 114. 04293 114.1026
Пирролизин О Пыл C 12 H 19 N 3 O 2 237.14773 237,2982
Пролин п Pro C 5 H 7 НЕТ 97,05276 97,1152
Глутамин Q Gln C 5 H 8 N 2 O 2 128,05858 128,1292
Аргинин р Arg C 6 H 12 N 4 O 156.10111 156,1857
Серин S Сер C 3 H 5 НЕТ 2 87,03203 87,0773
Треонин Т Thr C 4 H 7 НЕТ 2 101,04768 101,1039
Селеноцистеин U Сек C 3 H 5 NOSe 150,95364 150,0489
Валин V Вал C 5 H 9 НЕТ 99,06841 99,1311
Триптофан W Trp C 11 H 10 N 2 O 186. 07931 186.2099
Тирозин Y Тюр C 9 H 9 НЕТ 2 163.06333 163,1733

§ Моноизотопная масса

Стехиометрия и метаболические затраты в клетке

В таблице ниже указано количество аминокислот в клетках E.coli и метаболическая стоимость (АТФ) для синтеза аминокислот. Отрицательные числа указывают на то, что метаболические процессы являются энергетически благоприятными и не требуют затрат чистого АТФ клетки. Обилие аминокислот включает аминокислоты в свободной форме и в форме полимеризации (белки).

Аминокислота короткий Аббревиатура Изобилие
(количество молекул (× 10 8 )
на клетку E. coli )
Стоимость АТФ в синтезе
Аэробные
условия
Анаэробные
условия
Аланин А Ала 2,9 -1 1
Цистеин C Cys 0,52 11 15
Аспарагиновая кислота D Жерех 1.4 0 2
Глютаминовая кислота E Glu 1.5 -7 -1
Фенилаланин F Phe 1.1 -6 2
Глицин г Gly 3.5 -2 2
Гистидин ЧАС Его 0,54 1 7
Изолейцин я Иль 1,7 7 11
Лизин K Lys 2. 0 5 9
Лейцин L Лея 2,6 -9 1
Метионин M Встретил 0,88 21 год 23
Аспарагин N Asn 1.4 3 5
Пирролизин О Пыл - - -
Пролин п Pro 1.3 -2 4
Глутамин Q Gln 1.5 -6 0
Аргинин р Arg 1,7 5 13
Серин S Сер 1.2 -2 2
Треонин Т Thr 1. 5 6 8
Селеноцистеин U Сек - - -
Валин V Вал 2,4 -2 2
Триптофан W Trp 0,33 -7 7
Тирозин Y Тюр 0,79 -8 2

Аминокислота Аббревиатура Замечания
Аланин А Ала Очень распространенный и очень универсальный, он более жесткий, чем глицин, но достаточно мал, чтобы устанавливать лишь небольшие стерические ограничения для конформации белка. Он ведет себя довольно нейтрально и может располагаться как в гидрофильных областях белка снаружи, так и в гидрофобных областях внутри.
Аспарагин или аспарагиновая кислота B Asx Заполнитель, когда любая из аминокислот может занимать позицию
Цистеин C Cys Атом серы легко связывается с ионами тяжелых металлов . В окислительных условиях два цистеина могут соединяться дисульфидной связью с образованием аминокислоты цистина . Когда цистины являются частью белка, например инсулина , третичная структура стабилизируется, что делает белок более устойчивым к денатурации ; поэтому дисульфидные связи являются обычным явлением в белках, которые должны функционировать в суровых условиях, включая пищеварительные ферменты (например, пепсин и химотрипсин ) и структурные белки (например, кератин ). Дисульфиды также содержатся в пептидах, слишком малых для того, чтобы самостоятельно сохранять стабильную форму (например, инсулин ).
Аспарагиновая кислота D Жерех Asp ведет себя аналогично глутаминовой кислоте и несет гидрофильную кислотную группу с сильным отрицательным зарядом. Обычно он расположен на внешней поверхности белка, что делает его водорастворимым. Он связывается с положительно заряженными молекулами и ионами и часто используется в ферментах для фиксации иона металла. Находясь внутри белка, аспартат и глутамат обычно сочетаются с аргинином и лизином.
Глютаминовая кислота E Glu Глю ведет себя так же, как аспарагиновая кислота, и имеет более длинную и немного более гибкую боковую цепь.
Фенилаланин F Phe Необходимые для человека фенилаланин, тирозин и триптофан содержат большую жесткую ароматическую группу в боковой цепи. Это самые большие аминокислоты. Как изолейцин, лейцин и валин, они гидрофобны и имеют тенденцию ориентироваться внутрь свернутой белковой молекулы. Фенилаланин может превращаться в тирозин.
Глицин г Gly Из-за наличия двух атомов водорода у α-углерода глицин не является оптически активным . Это самая маленькая аминокислота, она легко вращается и добавляет гибкости белковой цепи. Он способен поместиться в самые тесные пространства, например, в тройную спираль коллагена . Поскольку слишком большая гибкость обычно нежелательна, в качестве структурного компонента он встречается реже, чем аланин.
Гистидин ЧАС Его Он необходим для людей. Даже в слабокислых условиях происходит протонирование азота, изменяющее свойства гистидина и полипептида в целом. Он используется многими белками в качестве регуляторного механизма, изменяя конформацию и поведение полипептида в кислых областях, таких как поздняя эндосома или лизосома , обеспечивая изменение конформации ферментов. Однако для этого требуется всего несколько гистидинов, поэтому его относительно мало.
Изолейцин я Иль Иль необходим для человека. Изолейцин, лейцин и валин имеют большие алифатические гидрофобные боковые цепи. Их молекулы жесткие, и их взаимные гидрофобные взаимодействия важны для правильной укладки белков, поскольку эти цепи имеют тенденцию располагаться внутри молекулы белка.
Лейцин или изолейцин J Xle Заполнитель, когда любая из аминокислот может занимать позицию
Лизин K Lys Лиз необходим для человека и ведет себя так же, как аргинин. Он содержит длинную гибкую боковую цепь с положительно заряженным концом. Гибкость цепи делает лизин и аргинин подходящими для связывания с молекулами со многими отрицательными зарядами на их поверхности. Например, ДНК- связывающие белки имеют свои активные области, богатые аргинином и лизином. Сильный заряд делает эти две аминокислоты склонными располагаться на внешних гидрофильных поверхностях белков; когда они находятся внутри, они обычно сочетаются с соответствующей отрицательно заряженной аминокислотой, например, аспартатом или глутаматом.
Лейцин L Лея Лей необходим для человека и ведет себя так же, как изолейцин и валин.
Метионин M Встретил Met необходим для человека. Всегда первая аминокислота, которая включается в белок, иногда ее удаляют после трансляции. Как и цистеин, он содержит серу, но с метильной группой вместо водорода. Эта метильная группа может быть активирована и используется во многих реакциях, где новый атом углерода добавляется к другой молекуле.
Аспарагин N Asn Как и аспарагиновая кислота, Asn содержит амидную группу, в которой Asp имеет карбоксил .
Пирролизин О Пыл Подобен лизину , но к нему присоединено пирролиновое кольцо.
Пролин п Pro Pro содержит необычное кольцо для N-концевой аминогруппы, которое заставляет амидную последовательность CO-NH принимать фиксированную конформацию. Он может разрушать структуры сворачивания белка, такие как α-спираль или β-лист , вызывая желаемый излом в белковой цепи. Общие в коллагене , он часто подвергается пост-трансляционной модификации в гидроксипролина .
Глутамин Q Gln Подобно глутаминовой кислоте, Gln содержит амидную группу, в которой Glu имеет карбоксил . Используется в белках и как хранилище аммиака , это самая распространенная аминокислота в организме.
Аргинин р Arg Функционально похож на лизин.
Серин S Сер Серин и треонин имеют короткую группу, оканчивающуюся гидроксильной группой. Его водород легко удалить, поэтому серин и треонин часто действуют как доноры водорода в ферментах. Оба они очень гидрофильны, поэтому внешние области растворимых белков, как правило, богаты ими.
Треонин Т Thr Важен для людей, Thr ведет себя аналогично серину.
Селеноцистеин U Сек Селен аналог цистеина, в котором селен замещает серу атом.
Валин V Вал Важен для людей, Вал ведет себя так же, как изолейцин и лейцин.
Триптофан W Trp Важный для человека Trp ведет себя так же, как фенилаланин и тирозин. Это предшественник серотонина и естественно флуоресцентный .
Неизвестно Икс Хаа Заполнитель, когда аминокислота неизвестна или не важна.
Тирозин Y Тюр Тир ведет себя аналогично фенилаланину (предшественнику тирозина) и триптофану и является предшественником меланина , адреналина и гормонов щитовидной железы . Естественно флуоресцентный , его флуоресценция обычно подавляется передачей энергии триптофанам.
Глутаминовая кислота или глутамин Z Glx Заполнитель, когда любая из аминокислот может занимать позицию

Катаболизм

Катаболизм аминокислот

Аминокислоты можно классифицировать по свойствам их основных продуктов:

  • Глюкогенный, с продуктами, способными образовывать глюкозу путем глюконеогенеза.
  • Кетогенный, с продуктами, не имеющими способности образовывать глюкозу: эти продукты все еще могут использоваться для кетогенеза или синтеза липидов .
  • Аминокислоты катаболизируются в глюкогенные и кетогенные продукты.

Смотрите также

использованная литература

Общие ссылки

внешние ссылки

Открытие аминокислот в составе белков

АминокислотаАббревиатураГодИсточникКто впервые выделил[1]
ГлицинGly, G1820ЖелатинА. Браконно
ЛейцинLeu, L1820Мышечные волокнаА. Браконно
ТирозинTyr, Y1848КазеинФ. Бопп
СеринSer, S1865ШёлкЭ. Крамер
Глутаминовая кислотаGlu, E1866Растительные белкиГ. Риттхаузен
ГлутаминGln, Q
Аспарагиновая кислотаAsp, D1868Конглутин, легумин (ростки спаржи)Г. Риттхаузен
АспарагинAsn, N1806Сок спаржиЛ.-Н. Воклен и П. Ж. Робике
ФенилаланинPhe, F1881Ростки люпинаЭ. Шульце, Й. Барбьери
АланинAla, A1888Фиброин шелкаТ. Вейль
ЛизинLys, K1889КазеинЭ. Дрексель
АргининArg, R1895Вещество рогаС. Гедин
ГистидинHis, H1896Стурин, гистоныА. Кессель, С. Гедин
ЦистеинCys, C1899Вещество рогаК. Мёрнер
ВалинVal, V1901КазеинЭ. Фишер
ПролинPro, P1901КазеинЭ. Фишер
ГидроксипролинHyp, hP1902ЖелатинЭ. Фишер
ТриптофанTrp, W1902КазеинФ. Гопкинс, Д. Кол
ИзолейцинIle, I1904ФибринФ. Эрлих
МетионинMet, M1922КазеинД. Мёллер
ТреонинThr, T1925Белки овсаС. Шрайвер и др.
ГидроксилизинHyl, hK1925Белки рыбС. Шрайвер и др.

Мнемоника (биология)

Лежа дома и ботая биологию на протяжении почти целой недели, я подумал, что есть в ней некоторые тяжелозапоминающиеся места. И я сейчас даже не про цикл Кребса, а про такие казалось бы простые вещи, как транскрипция и трансляция, комплементарность азотистых оснований и 20 стандартных аминокислот. Мнемоника на эти темы либо довольно уныла, либо отсутствует вовсе, потому я решил запилить свою. Сначала идет мнемонический стих, а после описание к нему. С ДНК-ою РНК Транскрибирует слегка И транслирует потом Всем белкам о том о сём. Итого: транскрипция – это процесс копирования информации с ДНК на РНК, а трансляция – использование информации с РНК для синтеза белка. Есть Автобус и Троллейбус, Галка с Цаплей тут как тут, Но Усатых Тараканов уж наверно не найдут. Соответственно Аденин – Тимин, Гуанин – Цитозин и Уроцил заменяющий Тимин в РНК. Также Аденин и Гуанин (Автобус и Галка, первые в своих парах) являются пуриновыми основаниями, а Тимин, Цитозин и Уроцил – пиримидиновыми. Проп(Ала) (Сер)ая собака Напр(Асн)о (Глу)пая ушла. Нет в (Тир)е (Асп)ида, нет в баке. Нар(Цис)са в (Гли/н)е я нашла… Трагичный стих про девочку, потерявшую пса по кличке Нарцисс, который так и не дошел домой. В стихе перечислены все заменимые аминокислоты человека (не включено 2 аминокислоты незаменимых для детей). На каждое сокращение аминокислоты падает ударение (кстати, сокращения официальные общеиспользуемые). (Гли/н) – это сразу два сокращения: (Гли) и (Глн). Расшифровка: (Ала) – Аланин (Сер) – Серин (Тир) – Тирозин (Гли) – Глицин (Цис) - Цистеин (Глу) – Глутаминовая кислота (Глн) – Глутамин (Асп) – Аспарагиновая кислота (Асн) – Аспарагин Заметьте, что сокращения кислот от созвучных им «не-кислот» отличаются буквой «н» на конце. Бере(Гис)ь (Арг)омобиля! Две аминокислоты незаменимые для детей (Гис) – Гистидин и (Арг) – Аргинин. Не уверен, что такое «аргомобиль», но я думаю это как-то связано с аргонавтами. На с(Вал)ке твой пор(Тре)т лежит С ним рядом (Лей)ка, (Фен) и к(Лиз)ма. Я (Три)жды (Мет)ко (Про)клял жизнь, Не в с(Иле) жить с алкоголизмом. Стих про незаменимые аминокислоты, а также про пагубное влияние алкоголя на личную жизнь (кое-кому это могло бы пригодиться). Я даже пожертвовал русским языком, чтобы старое правило оставалось в силе – все сокращения грамотны и под ударением. Расшифровка: (Вал) – Валин (Тре) – Треонин (Лей) – Лейцин (Фен) – Фенилаланин (Лиз) – Лизин (Три) – Триптофан (Мет) – Метионин (Про) – Пролин (Иле) - Изолейцин

Аминокислоты — Википедия

Аминокисло́ты (аминокарбо́новые кисло́ты) — органические соединения, в молекуле которых одновременно содержатся карбоксильные и аминные группы. Аминокислоты могут рассматриваться как производные карбоновых кислот, в которых один или несколько атомов водорода заменены на аминогруппы.

Открытие аминокислот в составе белков[править]

Аминокислота Аббревиатура Год Источник Кто впервые выделил[1]
Глицин Gly, G 1820 Желатин А. Браконно
Лейцин Leu, L 1820 Мышечные волокна А. Браконно
Тирозин Tyr, Y 1848 Казеин Ф. Бопп
Серин Ser, S 1865 Шёлк Э. Крамер
Глутаминовая кислота Glu, E 1866 Растительные белки Г. Риттхаузен
Глутамин Gln, Q
Аспарагиновая кислота Asp, D 1868 Конглутин, легумин (ростки спаржи) Г. Риттхаузен
Аспарагин Asn, N 1806 Сок спаржи Л.-Н. Воклен и П. Ж. Робике
Фенилаланин Phe, F 1881 Ростки люпина Э. Шульце, Й. Барбьери
Аланин Ala, A 1888 Фиброин шелка Т. Вейль
Лизин Lys, K 1889 Казеин Э. Дрексель
Аргинин Arg, R 1895 Вещество рога С. Гедин
Гистидин His, H 1896 Стурин, гистоны А. Кессель, С. Гедин
Цистеин Cys, C 1899 Вещество рога К. Мёрнер
Валин Val, V 1901 Казеин Э. Фишер
Пролин Pro, P 1901 Казеин Э. Фишер
Гидроксипролин Hyp, hP 1902 Желатин Э. Фишер
Триптофан Trp, W 1902 Казеин Ф. Гопкинс, Д. Кол
Изолейцин Ile, I 1904 Фибрин Ф. Эрлих
Метионин Met, M 1922 Казеин Д. Мёллер
Треонин Thr, T 1925 Белки овса С. Шрайвер и др.
Гидроксилизин Hyl, hK 1925 Белки рыб С. Шрайвер и др.

Физические свойства[править]

По физическим свойствам аминокислоты резко отличаются от соответствующих кислот и оснований. Все они кристаллические вещества, лучше растворяются в воде, чем в органических растворителях, имеют достаточно высокие температуры плавления; многие из них имеют сладкий вкус. Эти свойства отчётливо указывают на солеобразный характер этих соединений. Особенности физических и химических свойств аминокислот обусловлены их строением — присутствием одновременно двух противоположных по свойствам функциональных групп: кислотной и основной.

Общие химические свойства[править]

Все аминокислоты — амфотерные соединения, они могут проявлять как кислотные свойства, обусловленные наличием в их молекулах карбоксильной группы  —COOH, так и основные свойства, обусловленные аминогруппой  —NH2. Аминокислоты взаимодействуют с кислотами и щелочами:

NH2 —CH2 —COOH + HCl HCl • NH2 —CH2 —COOH (хлороводородная соль глицина)
NH2 —CH2 —COOH + NaOH H2O + NH2 —CH2 —COONa (натриевая соль глицина)

Растворы аминокислот в воде благодаря этому обладают свойствами буферных растворов, то есть находятся в состоянии внутренних солей.

NH2 —CH2COOH N+H3 —CH2COO-

Аминокислоты обычно могут вступать во все реакции, характерные для карбоновых кислот и аминов.

Этерификация:

NH2 —CH2 —COOH + CH3OH H2O + NH2 —CH2 —COOCH3 (метиловый эфир глицина)

Важной особенностью аминокислот является их способность к поликонденсации, приводящей к образованию полиамидов, в том числе пептидов, белков, нейлона, капрона.

Реакция образования пептидов:

HOOC —CH2 —NH —H + HOOC —CH2 —NH2 HOOC —CH2 —NH —CO —CH2 —NH2 + H2O

Изоэлектрической точкой аминокислоты называют значение pH, при котором максимальная доля молекул аминокислоты обладает нулевым зарядом. При таком pH аминокислота наименее подвижна в электрическом поле, и данное свойство можно использовать для разделения аминокислот, а также белков и пептидов.

Цвиттер-ионом называют молекулу аминокислоты, в которой аминогруппа представлена в виде -NH3+, а карбоксигруппа — в виде -COO. Такая молекула обладает значительным дипольным моментом при нулевом суммарном заряде. Именно из таких молекул построены кристаллы большинства аминокислот.

Некоторые аминокислоты имеют несколько аминогрупп и карбоксильных групп. Для этих аминокислот трудно говорить о каком-то конкретном цвиттер-ионе.

Большинство аминокислот можно получить в ходе гидролиза белков или как результат химических реакций:

CH3COOH + Cl2 + (катализатор) CH2ClCOOH + HCl; CH2ClCOOH + 2NH3 NH2 —CH2COOH + NH4Cl

Все входящие в состав живых организмов α-аминокислоты, кроме глицина, содержат асимметрический атом углерода (треонин и изолейцин содержат два асимметрических атома) и обладают оптической активностью. Почти все встречающиеся в природе α-аминокислоты имеют L-конфигурацию, и лишь L-аминокислоты включаются в состав белков, синтезируемых на рибосомах.

D-Аминокислоты в живых организмах[править]

Аспарагиновые остатки в метаболически неактивных структурных белках претерпевают медленную самопроизвольную неферментативную рацемизацию: в белках дентина и эмали зубов L-аспартат переходит в D-форму со скоростью ~0,1 % в год[2], что может быть использовано для определения возраста млекопитающих. Рацемизация аспартата также отмечена при старении коллагена; предполагается, что такая рацемизация специфична для аспарагиновой кислоты и протекает за счет образования сукцинимидного кольца при внутримолекулярном ацилировании атома азота пептидной связи свободной карбоксильной группой аспарагиновой кислоты[3].

С развитием следового аминокислотного анализа D-аминокислоты были обнаружены сначала в составе клеточных стенок некоторых бактерий (1966), а затем и в тканях высших организмов. Так, D-аспартат и D-метионин предположительно являются нейромедиаторами у млекопитающих.

В состав некоторых пептидов входят D-аминокислоты, образующиеся при посттрансляционной модификации. Например, D-метионин и D-аланин входят в состав опиоидных гептапептидов кожи южноамериканских амфибий филломедуз (дерморфина, дермэнкефалина и делторфинов). Наличие D-аминокислот определяет высокую биологическую активность этих пептидов как анальгетиков.

Сходным образом образуются пептидные антибиотики бактериального происхождения, действующие против грамположительных бактерий — низин, субтилин и эпидермин.

Гораздо чаще D-аминокислоты входят в состав пептидов и их производных, образующихся путем нерибосомного синтеза в клетках грибов и бактерий. Видимо, в этом случае исходным материалом для синтеза служат также L-аминокислоты, которые изомеризуются одной из субъединиц ферментного комплекса, осуществляющего синтез пептида.

Протеиногенные аминокислоты[править]

В процессе биосинтеза белка в полипептидную цепь включаются 20 α-аминокислот, кодируемых генетическим кодом. Помимо этих аминокислот, называемых протеиногенными, или стандартными, в некоторых белках присутствуют специфические нестандартные аминокислоты, возникающие из стандартных в процессе посттрансляционных модификаций. В последнее время к протеиногенным аминокислотам иногда причисляют трансляционно включаемые селеноцистеин (Sec, U) и пирролизин (Pyl, O). Это так называемые 21-я и 22-я аминокислоты.

Вопрос, почему именно эти 20 аминокислот стали «избранными», остаётся нерешённым. Не совсем ясно, чем эти аминокислоты оказались предпочтительнее других похожих. Например, ключевым промежуточным метаболитом пути биосинтеза треонина, изолейцина и метионина является α-аминокислота гомосерин. Очевидно, что гомосерин — очень древний метаболит, но для треонина, изолейцина и метионина существуют аминоацил-тРНК-синтетазы, тРНК, а для гомосерина — нет.

Структурные формулы 20 протеиногенных аминокислот обычно приводят в виде так называемой таблицы протеиногенных аминокислот:

Для запоминания однобуквенного обозначения протеиногенных аминокислот используется мнемоническое правило[4] (последний столбец).

Классификация[править]

По радикалу[править]
  • Неполярные: аланин, валин, изолейцин, лейцин, пролин, метионин, фенилаланин, триптофан
  • Полярные незаряженные (заряды скомпенсированы) при pH=7: [], серин, треонин, цистеин, аспарагин, глутамин, тирозин
  • Полярные заряженные отрицательно при pH=7: аспартат, глутамат
  • Полярные заряженные положительно при pH=7: лизин, аргинин, гистидин
По функциональным группам[править]
  • Алифатические
    • Моноаминомонокарбоновые: глицин, аланин, валин, изолейцин, лейцин
    • Оксимоноаминокарбоновые: серин, треонин
    • Моноаминодикарбоновые: аспартат, глутамат, за счёт второй карбоксильной группы несут в растворе отрицательный заряд
    • Амиды моноаминодикарбоновых: аспарагин, глутамин
    • Диаминомонокарбоновые: лизин, аргинин, несут в растворе положительный заряд
    • Серосодержащие: цистеин, метионин
  • Ароматические: фенилаланин, тирозин, триптофан, (гистидин)
  • Гетероциклические: триптофан, гистидин, пролин
  • Иминокислоты: пролин
По классам аминоацил-тРНК-синтетаз[править]
  • Класс I: валин, изолейцин, лейцин, цистеин, метионин, глутамат, глутамин, аргинин, тирозин, триптофан
  • Класс II: глицин, аланин, пролин, серин, треонин, аспартат, аспарагин, гистидин, фенилаланин

Для аминокислоты лизин существуют аминоацил-тРНК-синтетазы обоих классов.

По путям биосинтеза[править]

Пути биосинтеза протеиногенных аминокислот разноплановы. Одна и та же аминокислота может образовываться разными путями. К тому же совершенно различные пути могут иметь очень похожие этапы. Тем не менее, имеют место и оправданы попытки классифицировать аминокислоты по путям их биосинтеза. Существует представление о следующих биосинтетических семействах аминокислот: аспартата, глутамата, серина, пирувата и пентоз. Не всегда конкретную аминокислоту можно однозначно отнести к определённому семейству; делаются поправки для конкретных организмов и учитывая преобладающий путь. По семействам аминокислоты обычно распределяют следующим образом:

  • Семейство аспартата: аспартат, аспарагин, треонин, изолейцин, метионин, лизин.
  • Семейство глутамата: глутамат, глутамин, аргинин, пролин.
  • Семейство пирувата: аланин, валин, лейцин.
  • Семейство серина: серин, цистеин, глицин.
  • Семейство пентоз: гистидин, фенилаланин, тирозин, триптофан.

Фенилаланин, тирозин, триптофан иногда выделяют в семейство шикимата.

По способности организма синтезировать из предшественников[править]
  • Незаменимые
    Для большинства животных и человека незаменимыми аминокислотами являются: валин, изолейцин, лейцин, треонин, метионин, лизин, фенилаланин, триптофан
  • Заменимые
    Для большинства животных и человека заменимыми аминокислотами являются: глицин, аланин, пролин, серин, цистеин, аспартат, аспарагин, глутамат, глутамин, тирозин.

Классификация аминокислот на заменимые и незаменимые не лишена недостатков. К примеру, тирозин является заменимой аминокислотой только при условии достаточного поступления фенилаланина. Для больных фенилкетонурией тирозин становится незаменимой аминокислотой. Аргинин синтезируется в организме человека и считается заменимой аминокислотой, но в связи с некоторыми особенностями его метаболизма при определённых физиологических состояниях организма может быть приравнен к незаменимым. Гистидин также синтезируется в организме человека, но не всегда в достаточных количествах, потому должен поступать с пищей.

По характеру катаболизма у животных[править]

Биодеградация аминокислот может идти разными путями.

По характеру продуктов катаболизма у животных протеиногенные аминокислоты делят на три группы:

Аминокислоты:

  • Глюкогенные: глицин, аланин, валин, пролин, серин, треонин, цистеин, метионин, аспартат, аспарагин, глутамат, глутамин, аргинин, гистидин.
  • Кетогенные: лейцин, лизин.
  • Глюко-кетогенные (смешанные): изолейцин, фенилаланин, тирозин, триптофан.

«Миллеровские» аминокислоты[править]

«Миллеровские» аминокислоты — обобщенное название аминокислот, получающихся в условиях, близких к эксперименту Стенли Л. Миллера 1953 года. Установлено образование в виде рацемата множества различных аминокислот, в том числе: глицин, аланин, валин, изолейцин, лейцин, пролин, серин, треонин, аспартат, глутамат

Родственные соединения[править]

В медицине ряд веществ, способных выполнять некоторые биологические функции аминокислот, также (хотя и не совсем верно) называют аминокислотами:

Важной особенностью аминокислот является их способность к поликонденсации, приводящей к образованию полиамидов, в том числе пептидов, белков, нейлона, капрона, энанта.

Аминокислоты входят в состав спортивного питания и комбикорма. Аминокислоты применяются в пищевой промышленности в качестве вкусовых добавок, например, натриевая соль глутаминовой кислоты[5].

  • Эксперименты Миллера-Юри и обсуждения:
    • Miller S. L. Production of amino acids under possible primitive earth conditions. Science, v. 117, May 15, 1953
    • Miller S. L. and H. C. Urey. Organic compound synthesis on the primitive earth. Science, v. 130, July 31, 1959
    • Miller Stanley L. and Leslie E. Orgel. The origins of life on the earth. Englewood Cliffs, NJ, Prentice-Hall, 1974.
  • Общая биология. Учебник для 9 — 10 классов средней школы. Под ред. Ю. И. Полянского. Изд. 17-е, перераб. — М.: Просвещение, 1987. — 288с.
  • Аминокислоты, пептиды, белки. Под ред. Ю. В. Митина

Список сокращений

Список сокращений и обозначений, не требующих расшифровки

 

 Единицы измерения:

А – ампер

Бк – беккерель

В – вольт

Вт – ватт

г – грамм

Гр – грей

Гц – герц

Д (кД) – дальтон (килодальтон)

Дж – джоуль

Е – эйнштейн

Ки – кюри

лк – люкс

л – литр

м – метр

М – моль/литр

Н – ньютон

Ом – Ом

Па – паскаль

См – сименс

N – нормальность

 

Сокращения:

атм – атмосфера

в. д. – восточная долгота

га – гектар

г. – год

ИК – инфракрасный

КМ – константа Михаэлиса

к.п.д. – коэффициент полезного действия

КФ – классификация фермента

мол. м. – молекулярная масса (при цифре)

МС-среда – среда Мурасиге и Скуга

ПОЛ – перекисное окисление липидов

с – секунда

ССК – светособирающий комплекс

с.-х. – сельскохозяйственный

с.ш. – северная широта

т.п.н. – тысяча пар нуклеотидов

УФ – ультрафиолет

ФАР – фотосинтетически активная радиация

ФС I, II – фотосистема I, II

ЦТК – цикл трикарбоновых кислот

ч – час

ЭТЦ – электрон-транспортная цепь

g – ускорение свободного падения

рК – показатель диссоциации

С3, С4 – пути фотосинтеза (например, С3-растения)

ppm – частей на миллион

Не сокращаются: сырой вес (масса), сухой вес (масса).

 

Методы:

ВЭЖХ – высокоэффективная жидкостная хроматография

ГЖХ – газожидкостная хроматография

ИЭФ – метод изоэлектрической фокусировки

OT (RT) – обратная транскрипция

ПЦР (РСR) – полимеразная цепная реакция

ТСХ – тонкослойная хроматография

ЭПР – электронный парамагнитный резонанс

ЯМР – ядерный магнитный резонанс

ANOVA – дисперсионный анализ

ELISA – иммуноферментный анализ

PAGE – электрофорез в полиакриламидном геле

SDS-PAGE – денатурирующий PAGE

RACE – быстрая амплификация концов кДНК

 

Химические соединения:

АБК – абсцизовая кислота

АФК – активные формы кислорода

БАП – 6-бензиламинопурин

БСА – бычий сывороточный альбумин

ГК (ГК3) – гибберелловая кислота (гиббереллин)

2,4-Д – дихлорфеноксиуксусная кислота

ДДС – додецилсульфат натрия

ДMCO – диметилсульфоксид

2,4-ДНФ – 2,4-динитрофенол

ДТТ – дитиотрейтол

ДЭАЭ-целлюлоза – диэтиламиноэтилцеллюлоза

ЖК – жирные кислоты

ИУК – индолилуксусная кислота

КоА – кофермент А

МДА – малоновый диальдегид

НУК – нафтилуксусная кислота

ПААГ – полиакриламидный гель

ПЭГ – полиэтиленгликоль

РБФ – рибулозо-1,5-бисфосфат

РБФК/О – рибулозо-1,5-бисфосфаткарбоксилаза/оксигеназа

Трис – трис(гидроксиметил)аминометан

ТХУ – трихлоруксусная кислота

ФАЛ – фенилаланинаммоний-лиаза

ФЭП – фосфоэнолпируват

ЭГТА – этиленгликоль-бис(2-аминоэтилэфир) тетрауксусная кислота

ЭДТА – этилендиаминтетрауксусная кислота

ССС – хлорхолинхлорид

Hepes – N-(2-гидроксиэтил)гидразин-N'-(2-этансульфоновая) кислота

Mes – 2-(N-морфолин)-этансульфоновая кислота

Рi – ортофосфат неорганический

РРi – пирофосфат неорганический

 

Аминокислоты:

Трехбуквенные коды (или однобуквенные коды для обозначения последовательности в белке)

Ала (A) – аланин

Арг (R) – аргинин

Асн (N) – аспарагин

Асп (D) – аспарагиновая кислота

Вал (V) – валин

Гис (Н) – гистидин

Гли (G) – глицин

Глн (Q) – глутамин

Глу (Е) – глутаминовая кислота

Иле (I) – изолейцин

Лей (L) – лейцин

Лиз (К) – лизин

Мет (М) – метионин

Про (Р) – пролин

Сер (S) – серии

Тир (Y) – тирозин

Тре (Т) – треонин

Трп (W) – триптофан

Фен (F) – фенилаланин

Цис (С) – цистеин

 

Сахара:

Ара – арабиноза

Гал – галактоза

Глю – глюкоза

Кси – ксилоза

Ман – манноза

Риб – рибоза

Сах – сахароза

Фру – фруктоза

Фук – фукоза

 

Нуклеиновые кислоты:

ДНК – дезоксирибонуклеиновая кислота

кДНК – комплементарная ДНК

мтДНК – митохондриальная ДНК

хпДНК – хлоропластная ДНК

яДНК – ядерная ДНК

РНК – рибонуклеиновая кислота

мРНК – матричная (информационная) РНК

рРНК – рибосомная РНК

тРНК – транспортная РНК

яРНК – ядерная РНК

 

Нуклеотиды:

АМФ, АДФ, АТФ – аденозин-5'-моно-, ди- и трифосфаты

ГМФ, ГДФ, ГТФ – гуанозин-5'-моно-, ди- и трифосфаты

УМФ, УДФ, УТФ – уридин-5'-моно-, ди- и трифосфаты

ЦМФ, ЦДФ, ЦТФ – цитидин-5'-моно-, ди- и трифосфаты

дАМФ и т. д. – дезоксинуклеотиды

цАМФ и т.д. – циклические нуклеотиды

НАД – никотинамидадениндинуклеотид

НАД⋅H – то же, восстановленная форма

НАДФ – никотинамидадениндинуклеотидфосфат

НАДФ⋅H – то же, восстановленная форма

ФАД – флавинадениндинуклеотид

ФАД⋅Н2 – то же, восстановленная форма

ФМН – флавинмононуклеотид

ФМН⋅Н2 – то же, восстановленная форма

Генетический код и его диалекты — Троицкий вариант — Наука

Рис. 1. Транскрипция и трансляция. На электронной микрофотографии видны ДНК и молекулы мРНК, облепленные транслирующими рибосомами (маленькие черные бусинки).

Расшифровка генетического кода — пожалуй, одна из самых замечательных страниц в истории биологии. По-видимому, это первый и чуть ли не единственный пример того, как задача решалась сразу несколькими независимыми группами, работавшими в тесном контакте и постоянно обменивавшимися неопубликованными результатами без проявлений соперничества и попыток опередить коллег за счет сокрытия получаемых данных — своего рода распределенный мозговой штурм. В результате труднейшая проблема была решена за несколько лет.

Началось всё после того, как было установлено, что основным хранилищем и переносчиком генетической информации является длинная линейная молекула ДНК. Встал вопрос о том, как информация, содержащаяся в гене (фрагменте ДНК) в виде последовательности нуклеотидов (элементарных единиц ДНК), переводится в аминокислотную последовательность соответствующего этому гену белка. Пожалуй, первым, кто сформулировал этот вопрос как задачу о кодировании, был физик Георгий Гамов. Вариант кода, предложенный им в статье 1954 г. (1), был наивен с биохимической точки зрения, но сама постановка задачи о поиске соответствия между нуклеотидными и аминокислотными последовательностями была принята сразу, и в первые годы после публикации статьи Гамова было опубликовано еще несколько умозрительных вариантов генетического кода.

Экспериментаторы атаковали проблему кода с двух сторон. На рубеже 50-х и 60-х годов Френсис Крик с коллегами в серии блестящих генетических экспериментов установили, что код непрерывен и троичен (три идущих подряд нуклеотида — кодон — кодируют одну аминокислоту), он не имеет ни перекрываний, ни специальных символов на границах кодонов. Таким образом, считывание кода происходит по тройкам, записанным подряд друг за другом. Крику же принадлежит «центральная догма» — представление о том, что генетическая информация реализуется в два этапа. Сначала ген точно копируется в молекулу так называемой матричной РНК (мРНК), а уже потом происходит трансляция — перевод нуклеотидной последовательности мРНК в белок (рис. 1).

Одновременно несколько групп проводили биохимические эксперименты по синтезу и трансляции искусственных последовательностей нуклеотидов. Для этого использовалась система, включающая все необходимые клеточные компоненты
трансляции. В такую систему добавляли искусственные молекулы РНК, а затем анализировали последовательности полученных белков.

Однако прежде, чем начались эти опыты, встал вопрос о том, сколько, собственно говоря, аминокислот должно соответствовать кодонам в таблице генетического кода.

Дело в том, что химикам известны сотни различных аминокислот; в природных белках их наблюдаются десятки. Было понятно, что не все из них кодируются непосредственно в ДНК, многие должны являться результатом последующих изменений уже синтезированного белка. В замечательной по прозрачности и четкости неопубликованной статье Крика (2), разосланной в виде письма членам основанного Гамовым РНКового клуба — группы ученых, интересовавшихся проблемами генетического кода, был установлен список из 20 аминокислот, непосредственно закодированных в ДНК. Крик отсек аминокислоты, встречающиеся только в отдельных тканях, в коротких пептидах и единичных белках, и не во всех организмах.

Поскольку различных троек кодонов 64 (четыре нуклеотида, три позиции — четыре в кубе), ясно, что генетический код должен быть вырожден: некоторым аминокислотам соответствуютнесколькотро-ек (уже позднее стало ясно, что некоторые из кодонов кодируют не аминокислоту, а «точку» — сигнал конца трансляции данного белка; они называются стоп-кодоны). Немного идеализированный набор экспериментальных данных, доступных к началу 60-х годов, приведен во врезке, и желающие могут испытать себя в деле расшифровки генетического кода.

После того, как в середине 60-х годов расшифровка генетического кода была завершена, какое-то время казалось, что он универсален для всех живых существ. Однако позднее были обнаружены исключения: в кодах некоторых организмов наблюдаются небольшие отличия от универсального.

Эти отличия чрезвычайно интересны, поскольку они позволяют понять, каким образом происходит эволюция генетического кода и, тем
короткое название нуклеотидная последовательность аминокислотная последовательность (при периоде нуклеотидной последовательности 3 -смесь аминокислотных последовательностей)

Вот выборка из результатов, полученных в различных лабораториях в начале 1960-х годов. Эти результаты слегка идеализированы: удалены данные, оказавшиеся неправильными, и добавлено небольшое количество данных, полученных чуть позже уже при проверке кода. Тем не менее, ситуация сильно напоминает ту, в которой оказались первые исследователи, пытавшиеся расшифровать генетический код.
Представлены два типа данных. Во-первых, показано, какие аминокислотные последовательности кодируются регулярными нуклеотидными последовательностями с известной структурой (однако фаза считывания неизвестна!). Во-вторых, показано примерное соотношение аминокислот в продуктах трансляции нерегулярных последовательностей с известным соотношением нуклеотидов. Данные второго типа могут быть неполны: показаны не все встречающиеся аминокислоты, а соотношения сильно огрублены.
Задача состоит в том, чтобы установить как можно больше соответствий между кодонами (тройками нуклеотидов) и аминокислотами.

Представлены два типа данных. Во-первых, показано, какие аминокислотные последовательности кодируются регулярными нуклеотидными последовательностями с известной структурой (однако фаза считывания неизвестна!). Во-вторых, показано примерное соотношение аминокислот в продуктах трансляции нерегулярных последовательностей с известным соотношением нуклеотидов. Данные второго типа могут быть неполны: показаны не все встречающиеся аминокислоты, а соотношения сильно огрублены.

Задача состоит в том, чтобы установить как можно больше соответствий между кодонами (тройками нуклеотидов) и аминокислотами.
преобла- дающий нуклеотид редкий нуклеотид преобла- дающая аминокислота редкие аминокислоты очень редкие аминокислоты
1 U C Phe Ser, Leu Pro
2 U A Phe Leu, Ile, Tyr Asn
3 U G Phe Cys, Val, Leu Gly, Trp
4 A U Lys Asn, Ile Leu, Tyr
5 A G Lys Arg, Glu Gly
6 A C Lys Asp, Gln, Thr His, Pro

Ответ на стр. 11
Михаил Гельфанд

самым, каковы могли быть самые первые этапы этой эволюции.

По-видимому, есть три основных механизма смены аминокислоты, кодируемой кодоном. Первый возникает, когда какой-то кодон вообще не используется в генах какого-то организма. Тут существенно, что в силу вырожденности кода большинство аминокислот кодируется сразу несколькими кодонами, и частоты этих кодонов могут сильно отличаться в силу различных причин. Например, ДНК данного организма может иметь очень неравномерный состав нуклеотидов, и кодоны, включающие относительно избегаемые нуклеотиды, будут относительно редки. Если в силу статистического дрейфа частот такой редкий кодон вовсе исчезает из употребления, то в дальнейшем он может начать использоваться для кодирования другой аминокислоты без того, чтобы произошли изменения в кодируемых белках. Такой механизм, по-видимому, отвечает за некоторые диалекты кода, наблюдаемые в митохондриях — клеточных органеллах, которые имеют свою собственную ДНК, кодирующую небольшое количество генов.

Второй механизм — это превращение стоп-кодона в кодон, коди-

рующий аминокислоту. Это уже не так безболезненно, ведь все гены, которые заканчиваются этим стоп-кодоном, будут транслироваться дальше, и на конце у кодируемых белков появятся случайные дополнения. Но, оказывается, многие гены «для страховки» заканчиваются не одним стоп-кодоном, а сразу двумя — дело в том, что даже и в обычной ситуации стоп-кодоны иногда по ошибке считываются как кодирующие аминокислоту, и двойные стопы повышают надежность остановки. Из-за таких двойных стопов доля удлиняемых белков может быть не так уж велика, и вид успевает приспособиться за счет случайных мутаций, в результате которых возникают стоп-кодоны в нужных местах.

Как это ни парадоксально, довольно частым вариантом может оказываться еще один, третий, -когда какое-то время кодон используется для кодирования сразу двух аминокислот. Считывание его при этом неоднозначно, что, казалось бы, крайне невыгодно для клетки: в ней образуется множество белков, содержащих не ту аминокислоту, которая нужна в данном белке. Тем не менее, такие случаи были замечены у некоторых грибов, близких родственников дрожжей.
После обнаружения диалектов генетического кода появилось множество работ, в которых предлагались различные модели происхождения современного кода из более простых вариантов. Многие из предложенных моделей были весьма остроумны и хорошо согласовались с имеющимися данными. В частности, было показано, что код обладает свойствами помехоустойчивости: случайные мутации в генах (или ошибки трансляции) не очень сильно меняют физико-химические свойства аминокислот. На основании симметрий, наблюдаемых в коде, и биохимических представлений о путях биосинтеза аминокислот была предложена очередность, с которой аминокислоты начинали использоваться в белках и включались в кодовую таблицу.

Рис. 2. SECIS-элемент, управляющий чтением стоп-кодона UGA как селеноцистеинового. Розовым показаны спаренные участки. (Источник – Wikipedia).

Настоящее потрясение пришло в 1986 г., когда сразу несколько групп обнаружили, что существует 21-я аминокислота, кодируемая генетически, а не возникающая в результате пост-трансляционных модификаций белков. Селеноцистеин — это вариант обычной аминокислоты цистеина, содержащий атом селен вместо обычного атома серы. Эта аминокислота встречается крайне редко, не более чем в паре десятков различных белков в одном организме. Все эти белки — ферменты, в которых селеноцистеин играет роль активного компонента функционального центра, и в этом качестве он существенно эффективнее, чем обычный цистеин. При этом в семействах родственных ферментов в одной и той же позиции у некоторых организмов встречается селеноцистеин, а у других — цистеин. Селеноци-стеин кодируется одним из стоп-кодонов (UGA), но чтобы этот кодон прочитался не как сигнал окончания трансляции, а как селено-цистеиновый кодон, в мРНК должен быть дополнительный структурный элемент (рис. 2). Взаимодействие этого элемента с комплексом, осуществляющим трансляцию, и приводит к включению в растущий белок селеноцистеина. До сих пор считалось, что UGA может кодировать селеноци-стеин либо стоп, но недавно в работе группы Вадима Гладышева из Университета Небраски было показано, что у инфузории Euplotes UGA кодирует селеноцисте-ин и обычный цистеин (см. заметку «Одноклеточный организм нарушил догму генетического кода» в ТрВ № 20 и поправку в ТрВ № 21).

Следует сказать, однако, что во всей шумихе, сопровождавшей работы, посвященные селеноци-стеину, была некоторая доля лукавства. Дело в том, что на самом деле во всех учебниках уже упоминалась одна дополнительная (двадцатая-с-половиной?) аминокислота. У бактерий трансляция всегда начинается с формилметионина -варианта одной из двадцати основных аминокислот, метионина. В начале гена формилметионин кодируется как обычным метиони-новым кодоном AUG, так и еще двумя кодонами, GUG и UUG, которые в середине гена кодируют калин и лейцин, соответственно. Тем самым, формилметионин имеет свой собственный набор кодонов и потому

вполне мог бы считаться самостоятельной аминокислотой. Однако, по-видимому, формилметионин никогда не рассматривали какотдель-ную аминокислоту, поскольку он встречается только в начале гена, тем более, что во многих белках он отщепляется при созревании, а у других отщепляется формильная группа и остается метионин. Таким образом, формилметионин, подобно букве «ё» или (бывшей) планете Плутон, так и оставался пасынком генетического кода.

Еще через какое-то время была обнаружена 22-я аминокислота, пирролизин. Этот вариант обычного лизина встречается у некоторых архебактерий и, как и селеноци-стеин, кодируется одним из стоп-кодонов, на этот раз UAG. Однако, в отличие от селеноцистеина, пиролизин был найден в очень ограниченной группе организмов. Про механизм, позволяющий клетке отличить пиролизиновый кодон от стопа, имеется только предположение, что он также использует специальную структуры РНК. UAG в организмах, имеющих пирролизин, редко используется как стоп, а если используется, то сразу или почти сразу после него следует один из двух других стоп-кодонов.

Разумеется, после открытия се-леноцистина и пирролизина появились основания подозревать, что на этом дело не остановится. Тем не менее, кажется, новых членов генетического кода ожидать не следует, во всяком случае среди организмов с полностью известными ДНК. Это показал систематический компьютерный анализ, предпринятый несколько лет назад Вадимом Гладышевым и его сотрудниками.

Дело вот в чем. Как уже упоминалось, селеноцистеину в родственных белках (из других организмов, например, вообще не имеющих се-леноцистеина) может соответствовать цистеин. Тем самым, выписав друг под другом большое число генов, кодирующих эти белки, мы увидим, что при общем высоком уровне сходства кажется, что некоторые белки заканчиваются преждевременно: есть колонки, содержащие как цистеиновые кодоны, так и стоп-
кодоны (которые, как мы на самом деле знаем, кодируют селеноцисте-ин). При этом, в отличие от ситуаций, когда белок действительно укорочен по сравнению с родственными белками, сходство генов сохраняется и за этими стоп-кодонами. Аналогичная ситуация наблюдается и в случае пиролизина: в наборе родственных генов есть колонки, содержащие ли-зиновые и стоп (т.е. пирролизино-вые) кодоны.

Теперь ясно, как можно искать случаи дополнений в генетическом коде. Надо рассмотреть семейства родственных генов и целенаправленно анализировать ситуации, когда соответствующие позиции в разных генах кодируют либо (преждевременный) стоп, либо (преимущественно) какую-то одну аминокислоту, причем преждевременность стоп-кодона выражается в сохранении сходства белков после него. Кроме того, можно искать дополнительные тРНК (молекулы, участвующие в трансляции), узнающие стоп-кодоны. Это и было проделано — и, к разочарованию исследователей, ничего найдено не было (3).

Этот подход имеет одно тонкое место: он предполагает, что белки, содержащие нестандартную аминокислоту, имеют более обычных родственников. Вообще говоря, это не обязательно: можно представить себе,что тот же пиролизин был бы настолько необычен, что не мог бы быть заменен ни на какую из аминокислот без полной потери функции белка.

Ну и, конечно, с появлением все новых полных последовательно- 

G.Gamow. Possible relation between DNA and protein structures. Nature. 1954. 173: 318-320.

F.H.C.Crick. On degenerate templates and the adaptor hypothesis. A note for the RNA Tie Club. 1955. http://profiles.nlm.nih.gov/SC/B/B/ G/F/_/scbbgf.pdf A.V.Lobanov et al. Is there a twenty third amino acid in the genetic code? Trends Genet. 2006. 22: 357-360.

Большими буквами показаны соответствия, однозначно устанавливаемые из комбинаторных соображений. Строчными буквами показаны соответствия, для установления которых использовано наблюдение, что кодоны, отличающиеся только в третьей позиции, часто кодируют одну и ту же аминокислоту.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Переводчик кодонов ДНК

РНК - Генетический код

Поиск инструмента

кодонов (генетический код)

Инструмент для перевода кодонов ДНК / РНК. Кодон - это группа из 3 нуклеотидов A, C, G, T, U. Кодоны извлекаются из РНК или ДНК (генетического кода).

Результаты

кодонов (генетический код) - dCode

Тег (ы): Система обозначений, Биология

Поделиться

dCode и другие

dCode является бесплатным, а его инструменты являются ценным подспорьем в играх, математике, геокешинге, головоломках и задачах, которые нужно решать каждый день!
Предложение? обратная связь? Жук ? идея ? Запись в dCode !

Перевод кодонов / преобразователь

Кодон

Кодон

Инструмент для перевода кодонов ДНК / РНК.Кодон - это группа из 3 нуклеотидов A, C, G, T, U. Кодоны извлекаются из РНК или ДНК (генетического кода).

Ответы на вопросы

Как зашифровать с помощью таблицы кодонов?

Шифрование таблицы кодонов и преобразование кодонов РНК в их аминокислотные коды в соответствии с официальными сокращениями IUPAC (Международный союз теоретической и прикладной химии) и IUBMB (Союз биохимии и молекулярной биологии).
Есть 22 аминокислоты, тогда можно закодировать только 22 буквы.

Пример: DNA peut s'écrire CTG TTA CGG

Stop кодоны кодируются знаком звездочки *

Как распознать шифротекст на основе кодонов?

Сообщение состоит из букв A, C, G, T и U, часто группами по 3.

Как называются аминокислоты?

Список аминокислот:

I 9 0059 Gln W
A Аланин Ala
C Цистеин Cys
D Аспарагиновая кислота Asp
E Glutam кислота Glu
F Фенилаланин Phe
G Глицин Gly
H Гистидин His
Изолейцин
K Лизин Лиз
L Лейцин Лей
M Метионин Met
N Аспарагин Asn
P Pro
Q Глютамин
R Аргинин Arg
S Серин Ser
T Треонин Thr
V Валин Val
Триптофан Trp
Y Тирозин Tyr

Что означают ДНК и РНК?

ДНК означает дезоксирибонуклеиновую кислоту, а РНК означает рибонуклеиновую кислоту, они являются одними из самых важных молекул биологии живых существ, поскольку они содержат наследственную генетическую информацию.

Аббревиатура мРНК означает информационную РНК.

Что такое масса нуклеотида?

Нуклеотиды имеют молярную массу

C (цитозин) 111
U (урацил) 112
T (тимин) 126
A (аденин) 135
G (гуанин) 151

Что такое плотность нуклеотидов?

Нуклеотиды имеют плотность

T 1.23
U 1,32
C 1,55
A 1,60
G 2,20

Какие существуют варианты шифра на основе кодонов?

Можно кодировать либо кодоны РНК , либо кодоны ДНК .

Задайте новый вопрос

Исходный код

dCode сохраняет за собой право собственности на исходный код онлайн-инструмента «Кодоны (генетический код)». За исключением явной лицензии с открытым исходным кодом (обозначенной CC / Creative Commons / free), любой алгоритм, апплет или фрагмент (конвертер, решатель, шифрование / дешифрование, кодирование / декодирование, шифрование / дешифрование, переводчик) или любая функция (преобразование, решение, дешифрование / encrypt, decipher / cipher, decode / encode, translate), написанные на любом информатическом языке (PHP, Java, C #, Python, Javascript, Matlab и т. д.), доступ к данным, скриптам, копипасту или API будет бесплатным , то же самое для кодонов (генетический код) скачать для автономного использования на ПК, планшете, iPhone или Android!

Нужна помощь?

Пожалуйста, заходите в наше сообщество Discord, чтобы получить помощь!

Вопросы / комментарии

Сводка

Инструменты аналогичные

Поддержка

Форум / Справка

Ключевые слова

кодон, генетический, ДНК, РНК, нуклеотид, кислота, амино, дезоксирибонуклеиновая кислота, молекула, биология, цитозин, гуанин, аденин, тимин, урацил

Ссылки


Источник: https: // www. dcode.fr/codons-genetic-code

© 2021 dCode - Идеальный «инструментарий» для решения любых игр / загадок / геокэшинга / CTF.

кодонов РНК и кодонов ДНК

Что такое кодоны?

Генетический код состоит из 64 триплетов или кодонов. По крайней мере, один кодон кодирует информацию для каждой из 20 аминокислот, используемых в синтезе белков во время трансляции. Хотя один кодон может кодировать только одну аминокислоту, несколько кодонов могут кодировать одну и ту же аминокислоту, что описывается как вырожденность кода.Большинство аминокислот кодируется более чем одним кодоном.

СТАРТ-кодоны и стоп-кодоны

AUG - наиболее распространенный кодон START, который сигнализирует о начале трансляции. Он кодирует аминокислоту метионин (Met) и направляет добавление Met к растущей полипептидной цепи во время синтеза белка. Из 64 кодонов только 61 кодирует аминокислоту, а остальные три кодона являются кодонами STOP, которые сигнализируют об окончании или прекращении трансляции. UAA, UAG и UGA - три стоп-кодона РНК, а TAG, TAA и TGA - три стоп-кодона ДНК.

Кодоны РНК

Традиционно генетический код был представлен кодонами РНК, поскольку именно информационная РНК (мРНК) направляет трансляцию. Кодоны в мРНК декодируются транспортной РНК (тРНК) во время синтеза белка.

Кодоны

РНК и аминокислоты, которые они кодируют, приведены в таблице ниже:

UUU Phe

UCU Ser

UAU Tyr

УГУ Цис

UUC Phe

UCC Ser

ОАК Тюр

UGC Cys

UUA Leu

UCA Ser

UAA STOP

УГА СТОП

UUG Leu

UCG Ser

UAG STOP

УГГ Трп

CUU Leu

CCU Pro

CAU His

CGU Arg

CUC Leu

CCC Pro

CAC His

CGC Arg

CUA Leu

CCA Pro

CAA Gln

CGA Arg

CUG Leu

CCG Pro

CAG Gln

CGG Arg

АУУ Иль

ACU Thr

AAU Asn

AGU Ser

AUC Ile

ACC Thr

AAC Asn

AGC Ser

АУА Иль

ACA Thr

AAA Lys

AGA Arg

AUG Met / START кодон

ACG Thr

AAG Lys

AGG Арг.

ГУУ Вал

GCU Ala

GAU Asp

GGU Gly

GUC Val

GCC Ala

GAC Asp

GGC Gly

ГУА Вал

GCA Ala

GAA Glu

GGA Gly

ГУГ Вал

GCG Ala

GAG Glu

GGG Gly

Ключ: Phe = фенилаланин, Ser = серин, Tyr = тирозин, Cys = цистеин, Leu = лейцин, Trp = триптофан, Pro = пролин, Gln = глутамин, аспарагин = ASN, Thr = треонин, Ile = Изолейцин, Asp = аспарагиновая кислота, Glu = глутаминовая кислота, Gly = глицин, Ala = аланин, Val = валин, Met = метионин, Arg = аргинин, His = гистидин, Lys = лизин.

В результате достижений в области геномики и вычислительной техники гены в настоящее время в основном обнаруживаются на уровне ДНК, до преобразования в мРНК и белки, и становится все более популярным использование кодонов ДНК. Кодоны ДНК идентичны кодонам РНК, за исключением тимина с одним основанием (Т), который заменяет урацил (U) в кодонах РНК.

Кодоны ДНК и аминокислоты, которые они представляют, приведены в таблице ниже:

Кодон

Аминокислота

Кодон

Аминокислота

TTT

Фенилаланин (Phe)

TCT

Серин (Ser)

ТТС

ТСС

ТТА

Лейцин (Leu)

TCA

ТТГ

TCG

CTT

CCT

Proline (Pro)

CTC

CCC

CTA

CCA

CTG

CCG

ATT

Изолейцин (Иль)

ACT

Треонин (Thr)

УВД

ACC

ATA

ACA

ATG

Метионин (Met) / START кодон

ACG

GTT

Валин (Вал)

GCT

Аланин (Ала)

GTC

GCC

GTA

GCA

GTG

GCG

ТАТ

Тирозин (Tyr)

TGT

Цистеин (Cys)

TAC

ТГК

TAA

СТОП кодон (охра)

TGA

СТОП (Опал)

ТЕГ

СТОП кодон (Янтарь)

TGG

Триптофан (Trp)

CAT

Гистидин (His)

CGT

Аргинин (Arg)

CAC

CGC

CAA

Глютамин (Gln)

CGA

CAG

CGG

AAT

Аспарагин (Asn)

AGT

Серин (Ser)

AAC

AGC

AAA

Лизин (Lys)

AGA

Аргинин (Arg)

AAG

AGG

GAT

Аспарагиновая кислота (Asp)

GGT

Глицин (Gly)

GAC

GGC

GAA

Глутаминовая кислота (Glu)

GGA

GAG

GGG

Как видно из приведенных выше таблиц, большинство аминокислот кодируется множественными кодонами. Asn, Asp, Cys, Gln, Glu, His, Lys, Phe и Tyr имеют два кодона; Ile имеет три кодона; Ala, Gly, Pro, Thr и Val имеют четыре кодона; а Arg, Leu и Ser имеют шесть кодонов. Только две аминокислоты - Met и Trp - кодируются по одному кодону каждая.

Список литературы
  1. https://www.umass.edu/microbio/chime/dna/codons.htm
  2. http://www.nobelprize.org/educational/medicine/dna/a/translation/gencode.html
  3. http: //waynesword.palomar.edu / codons.htm
  4. http://hyperphysics.phy-astr.gsu.edu/hbase/organic/gencode.html

Дополнительная литература

Anticodon - обзор | Темы ScienceDirect

9.4.2 Перевод: Как работают механизмы

Перевод - это третий этап биосинтеза белка. При трансляции мРНК, продуцируемая транскрипцией, расшифровывается рибосомой с образованием определенной аминокислотной цепи или полипептида, который позже сворачивается в активный белок.У бактерий трансляция происходит в цитоплазме клетки, где расположены большая и малая субъединицы рибосомы, и они связываются с мРНК. У эукариот трансляция происходит через мембрану эндоплазматического ретикулума (ЭР) в процессе, называемом векторным синтезом. Рибосома облегчает декодирование, индуцируя связывание тРНК с антикодонными последовательностями, комплементарными последовательности мРНК (рис. 2.35). ТРНК несут определенные аминокислоты, которые связаны вместе в полипептид, когда мРНК проходит через него, и «считываются» рибосомой способом, напоминающим тикер акций и тикерную ленту.

Во многих случаях весь комплекс рибосома / мРНК будет связываться с внешней мембраной грубого ER и высвобождать зарождающийся полипептид белка внутри для дальнейшего транспорта везикул и секреции вне клетки. Многие типы транскрибируемой РНК, такие как тРНК, рРНК и малая ядерная РНК, не подвергаются трансляции в белки.

Процесс трансляции состоит из четырех основных этапов: активация , инициация , удлинение и завершение .При активации правильная аминокислота ковалентно связана с правильной тРНК. Аминокислота присоединена своей карбоксильной группой к C3 – OH тРНК сложноэфирной связью. Когда тРНК имеет связанную с ней аминокислоту, она называется «заряженной». Этап инициации включает связывание небольшой субъединицы рибосомы с C5-концом мРНК с помощью факторов инициации (IF). Весь синтез белка начинается с кодона AUG (или GUG) на мРНК. Этот AUG кодирует модифицированный метионин, N-формилметионин.В середине белка AUG кодирует метионин. Следовательно, вопрос в том, как клетка узнает, что конкретный AUG является кодоном инициации или для N-формилметионина? Ответ лежит примерно на 6–9 нуклеотидов выше AUG, где расположен сайт связывания рибосомы (бокс Шайна-Дальгармо). Для прокариот консенсусная последовательность известна как последовательность Шайна-Дальгармо или бокс Шайна-Далгармо: AGGAGG, последовательность из шести оснований, расположенная непосредственно перед AUG. Для эукариот это известно как консенсусная последовательность Козака: (GCC) GCCACC AUG G или (GCC) GCCGCC AUG G. То есть у эукариот после инициирующего кодона есть одно основание, AUG. Сайты связывания рибосом могут различаться по силе и являются важным фактором в генной инженерии. Для инициации полимеризации у прокариот требуется инициирующий комплекс , состоящий из 30-секундной рибосомной единицы с N-формилметионином, связанного с ее областью инициации, 50-секундной рибосомной единицы, трех белков, называемых IF (PIF1, PIF2 и PIF3), и фосфата. энергия связи от GTP. У эукариот шесть IF: EIF1 (AX, AY, 1B), EIF2 (α, β, γ), EIF3 (A, B, C, D, F, G, H, I, J, K, M, S6), EIF4 (A2, A3, B, E1, E2, G1, G2, G3, H), EIF5 (A, A2, 5B) и EIF6.

Удлинение аминокислотной цепи использует тРНК в качестве декодеров. Один конец тРНК содержит антикодон , который комплементарен кодону на мРНК. Другой конец тРНК связывает определенную аминокислоту. ТРНК называется заряженной , когда она несет аминокислоту. Связывание аминокислоты с молекулой тРНК требует энергии от двух фосфатных связей и ферментов, известных как аминоацил -тРНК синтетазы . На рис. 2.32 изображена молекула тРНК.

Основным процессом производства белка является добавление одной аминокислоты в конец белка. Эта операция выполняется рибосомой. Выбор типа добавляемой аминокислоты определяется молекулой мРНК. Каждая добавленная аминокислота соответствует трехнуклеотидной подпоследовательности мРНК. Для каждого такого возможного триплета допустим только один конкретный тип аминокислоты. Последовательные аминокислоты, добавляемые в цепь, сопоставляются с последовательными триплетами нуклеотидов в мРНК.Таким образом, последовательность нуклеотидов в матричной цепи мРНК определяет последовательность аминокислот в созданной аминокислотной цепи.

мРНК несет генетическую информацию, закодированную в виде рибонуклеотидной последовательности, от хромосом к рибосомам. Рибонуклеотиды «считываются» трансляционным аппаратом в последовательности триплетов нуклеотидов, называемых кодонами. Каждый из этих триплетов кодирует определенную аминокислоту.

Молекулы рибосом переводят этот код в определенную последовательность аминокислот. Рибосома представляет собой мультисубъединичную структуру, содержащую рРНК и белки. Это «фабрика», где аминокислоты превращаются в белки. тРНК представляют собой небольшие некодирующие цепи РНК (74–93 нуклеотида), которые транспортируют аминокислоты к рибосоме. тРНК имеют сайт для присоединения аминокислот и сайт, называемый антикодоном. Антикодон - это триплет РНК, который комплементарен триплету мРНК, который кодирует их грузовую аминокислоту.

Аминоацил тРНК синтетаза (фермент) катализирует связывание между определенными тРНК и аминокислотами, которые требуются их антикодоновым последовательностям.Продуктом этой реакции является молекула аминоацил-тРНК. Эта аминоацил-тРНК перемещается внутри рибосомы, где кодоны мРНК сопоставляются посредством комплементарного спаривания оснований со специфическими антикодонами тРНК. Рибосома имеет три сайта для связывания тРНК. Это аминоацильный сайт (сокращенно A), пептидильный сайт (сокращенно P) и сайт выхода (сокращенно E). Что касается мРНК, эти три сайта ориентированы C5 – C3 E-P-A, потому что рибосомы перемещаются по типу C3 – C5. Сайт A связывает входящую тРНК с дополнительным кодоном на мРНК.Сайт P содержит тРНК с растущей полипептидной цепью. Сайт E содержит тРНК без ее аминокислоты. Когда аминоацил-тРНК первоначально связывается со своим соответствующим кодоном на мРНК, она находится в сайте A. Затем между аминокислотой тРНК в сайте A и аминокислотой заряженной тРНК в сайте P образуется пептидная связь. Растущая полипептидная цепь переносится на тРНК в A-сайте. Теперь происходит транслокация, перемещающая тРНК из Р-сайта без аминокислоты в Е-сайт; тРНК, которая была в сайте A, теперь заряженная полипептидной цепью, перемещается в сайт P.ТРНК в сайте E уходит, а другая аминоацил-тРНК входит в сайт A, чтобы повторить процесс.

После добавления в цепь новой аминокислоты энергия, обеспечиваемая гидролизом GTP, связанного с транслоказой EF-G (у прокариот) и eEF-2 (у эукариот), перемещает рибосому на один кодон вниз по направлению к C3. конец. Энергия, необходимая для трансляции белков, значительна. Скорость перевода варьируется; в прокариотических клетках он значительно выше (до 17–21 аминокислотных остатков в секунду), чем в эукариотических клетках (до 6–9 аминокислотных остатков в секунду).

Когда достигается стоп-кодон, белок высвобождается из рибосомы с помощью фактора высвобождения белка (RF). Терминация полипептида происходит, когда сайт A рибосомы сталкивается со стоп-кодоном (UAA, UAG или UGA). Никакая тРНК не может распознавать этот кодон или связываться с ним. Вместо этого стоп-кодон индуцирует связывание RF-белка, что вызывает разборку всего комплекса рибосома / мРНК. Затем 70-е рибосома диссоциирует на 30-е и 50-е субъединицы. мРНК обычно читается многими (например, 10–20) рибосомами одновременно; как только одна рибосома продвинулась достаточно далеко по сообщению о том, что сайт связывания рибосомы физически не заблокирован, другая рибосома может связываться и инициировать синтез новой полипептидной цепи.

Ряд антибиотиков действуют путем ингибирования трансляции; к ним, среди прочего, относятся анизомицин, циклогексимид, хлорамфеникол, тетрациклин, стрептомицин, эритромицин и пуромицин. Прокариотические рибосомы имеют структуру, отличную от эукариотических рибосом, и, таким образом, антибиотики могут специфически воздействовать на бактериальные инфекции без какого-либо ущерба для эукариотических клеток-хозяев.

Генетический код | OpenStax Biology 2e

Поток генетической информации в клетках от ДНК к мРНК к белку описывается центральной догмой ((Рисунок)), которая гласит, что гены определяют последовательность мРНК, которые, в свою очередь, определяют последовательность аминокислот, образующих до всех белков.Расшифровка одной молекулы в другую выполняется определенными белками и РНК. Поскольку информация, хранящаяся в ДНК, играет ключевую роль в функционировании клетки, интуитивно понятно, что клетка будет копировать мРНК этой информации для синтеза белка, сохраняя при этом саму ДНК нетронутой и защищенной. Копирование ДНК в РНК относительно несложно: к цепи мРНК добавляется один нуклеотид на каждый считанный нуклеотид в цепи ДНК. Трансляция в белок немного сложнее, потому что три нуклеотида мРНК соответствуют одной аминокислоте в последовательности полипептида.Однако трансляция в белок по-прежнему является систематической и коллинеарной, так что нуклеотиды с 1 по 3 соответствуют аминокислоте 1, нуклеотиды с 4 по 6 соответствуют аминокислоте 2 и так далее.

Генетический код вырожден и универсален

Каждая аминокислота определяется трехнуклеотидной последовательностью, называемой триплетным кодоном. Учитывая различное количество «букв» в «алфавитах» мРНК и белков, ученые предположили, что отдельные аминокислоты должны быть представлены комбинациями нуклеотидов.Дублетов нуклеотидов было бы недостаточно для определения каждой аминокислоты, потому что существует только 16 возможных комбинаций из двух нуклеотидов (4 2 ). Напротив, существует 64 возможных триплета нуклеотидов (4 3 ), что намного больше, чем количество аминокислот. Ученые предположили, что аминокислоты кодируются триплетами нуклеотидов и что генетический код является «вырожденным». Другими словами, данная аминокислота может кодироваться более чем одним триплетом нуклеотидов. Позже это было подтверждено экспериментально: Фрэнсис Крик и Сидней Бреннер использовали химический мутаген профлавин, чтобы вставить один, два или три нуклеотида в ген вируса. Когда был вставлен один или два нуклеотида, нормальные белки не производились. Когда были вставлены три нуклеотида, белок был синтезирован и функционировал. Это продемонстрировало, что аминокислоты должны быть определены группами из трех нуклеотидов. Эти триплеты нуклеотидов называются кодонами. Вставка одного или двух нуклеотидов полностью изменила рамку считывания триплета, тем самым изменив сообщение для каждой последующей аминокислоты ((рисунок)). Хотя вставка трех нуклеотидов вызвала вставку дополнительной аминокислоты во время трансляции, целостность остальной части белка сохранялась.

Ученые кропотливо вычислили генетический код путем трансляции синтетических мРНК in vitro и секвенирования указанных белков ((Рисунок)).

Рисунок 3. На этом рисунке показан генетический код для трансляции каждого триплета нуклеотидов в мРНК в аминокислоту или сигнал терминации в белке. (кредит: модификация работы NIH)

Помимо кодонов, которые управляют добавлением определенной аминокислоты к полипептидной цепи, три из 64 кодонов прекращают синтез белка и высвобождают полипептид из машины трансляции. Эти триплеты называются бессмысленными кодонами или стоп-кодонами . Другой кодон, AUG, также выполняет особую функцию. Помимо определения аминокислоты метионина, он также служит стартовым кодоном для инициации трансляции. Рамка считывания для трансляции устанавливается стартовым кодоном AUG около 5'-конца мРНК. После стартового кодона мРНК считывается группами по три, пока не встретится стоп-кодон.

Расположение таблицы кодирования раскрывает структуру кода.Имеется шестнадцать «блоков» кодонов, каждый из которых определяется первым и вторым нуклеотидами кодонов внутри блока, например, блок «AC *», который соответствует аминокислоте треонину (Thr). Некоторые блоки делятся на половину пиримидина, в которой кодон заканчивается на U или C, и половину пурина, в которой кодон заканчивается на A или G. Некоторые аминокислоты получают целый блок из четырех кодонов, например аланин (Ala). , треонин (Thr) и пролин (Pro). Некоторые получают пиримидиновую половину своего блока, например гистидин (His) и аспарагин (Asn). Другие получают пуриновую половину своего блока, например глутамат (Glu) и лизин (Lys). Обратите внимание, что некоторые аминокислоты имеют блок и полублок, что в сумме составляет шесть кодонов.

Спецификация одной аминокислоты множеством похожих кодонов называется «вырожденностью». Вырождение считается клеточным механизмом, снижающим негативное влияние случайных мутаций. Кодоны, которые определяют одну и ту же аминокислоту, обычно отличаются только одним нуклеотидом. Кроме того, аминокислоты с химически подобными боковыми цепями кодируются подобными кодонами.Например, аспартат (Asp) и глутамат (Glu), которые занимают блок GA *, оба заряжены отрицательно. Этот нюанс генетического кода гарантирует, что мутация с заменой одного нуклеотида может указывать на ту же аминокислоту, но не иметь эффекта или указывать аналогичную аминокислоту, предотвращая превращение белка в полностью нефункциональный.

Генетический код почти универсален. За небольшими исключениями, практически все виды используют один и тот же генетический код для синтеза белка. Сохранение кодонов означает, что очищенная мРНК, кодирующая белок глобин у лошадей, может быть перенесена в клетку тюльпана, и тюльпан будет синтезировать глобин лошади. То, что существует только один генетический код, является убедительным доказательством того, что вся жизнь на Земле имеет общее происхождение, особенно с учетом того, что существует около 10 84 возможных комбинаций из 20 аминокислот и 64 триплетных кодонов.

Ссылка на обучение

Транскрибируйте ген и транслируйте его в белок, используя комплементарную пару и генетический код на этом сайте.

Рисунок 4. Делеция двух нуклеотидов сдвигает рамку считывания мРНК и изменяет все белковое сообщение, создавая нефункциональный белок или полностью прекращая синтез белка.

Подключение научного метода

У кого больше ДНК: у киви или клубники?

Рис. 5. Как вы думаете, у киви или клубники больше ДНК на каждый плод? (кредит «kiwi»: «Kelbv» / Flickr; источник: «клубника»: Alisdair McDiarmid)

Вопрос : Будет ли киви и клубника примерно одинакового размера ((Рисунок)) иметь примерно одинаковое количество ДНК?

Предпосылки : Гены находятся на хромосомах и состоят из ДНК. Все млекопитающие диплоидны, то есть у них есть две копии каждой хромосомы. Однако не все растения диплоидны. Земляника обыкновенная - октоплоидная (8 n ), а культурный киви - гексаплоидная (6 n ). Изучите общее количество хромосом в клетках каждого из этих фруктов и подумайте, как это может соответствовать количеству ДНК в ядрах клеток этих фруктов. Какие еще факторы могут влиять на общее количество ДНК в одном фрукте? Прочтите о методике выделения ДНК, чтобы понять, как каждый этап протокола выделения помогает высвобождать и осаждать ДНК.

Гипотеза : Выскажите гипотезу, сможете ли вы обнаружить разницу в количестве ДНК у клубники и киви аналогичного размера. Как вы думаете, какой фрукт даст больше ДНК?

Проверьте свою гипотезу : выделите ДНК клубники и киви одинакового размера. Проведите эксперимент по крайней мере в трех экземплярах для каждого фрукта

  1. Приготовьте бутылку буфера для экстракции ДНК из 900 мл воды, 50 мл средства для мытья посуды и двух чайных ложек поваренной соли. Переверните (накройте крышкой и переверните несколько раз вверх дном).
  2. Измельчите клубнику и киви вручную в пластиковом пакете, используя ступку и пестик, или металлическую миску и наконечник тупого инструмента. Измельчайте каждый фрукт не менее двух минут.
  3. Добавьте 10 мл буфера для экстракции ДНК в каждый плод и хорошо перемешайте в течение как минимум одной минуты.
  4. Удалите клеточный мусор, фильтруя каждую фруктовую смесь через марлю или пористую ткань в воронку, помещенную в пробирку или соответствующий контейнер.
  5. Налейте ледяной этанол или изопропанол (медицинский спирт) в пробирку. Вы должны увидеть белую осажденную ДНК.
  6. Соберите ДНК каждого фрукта, намотав ее на отдельные стеклянные стержни.

Запишите свои наблюдения : Поскольку вы не измеряете количественно объем ДНК, вы можете записать для каждого испытания, производили ли два плода одинаковое или разное количество ДНК, наблюдаемое на глаз. Если тот или иной плод дал заметно больше ДНК, запишите и это.Определите, согласуются ли ваши наблюдения с несколькими кусочками каждого фрукта.

Проанализируйте свои данные : Заметили ли вы очевидную разницу в количестве ДНК, производимой каждым фруктом? Были ли ваши результаты воспроизводимы?

Сделайте вывод : Учитывая то, что вы знаете о количестве хромосом в каждом плоде, можете ли вы сделать вывод, что число хромосом обязательно коррелирует с количеством ДНК? Можете ли вы выявить недостатки этой процедуры? Если бы у вас был доступ к лаборатории, как бы вы могли стандартизировать сравнение и сделать его более количественным?

Декодирующие свойства тРНК оставляют обнаруживаемый сигнал смещения использования кодонов | Биоинформатика

Аннотация

Мотивация: Стандартный генетический код переводит 61 кодон в 20 аминокислот с использованием менее 61 транспортной РНК (тРНК). Это возможно из-за способности тРНК «колебаться» на третьем основании для декодирования более чем одного кодона. Хотя антикодон-кодоновое картирование тРНК на мРНК является предпосылкой для определенных индексов использования кодонов и может способствовать пониманию эволюции альтернативных генетических кодов, оно обычно не определяется экспериментально, поскольку такие анализы чрезмерно дороги и сложны. Вместо этого считывание кодонов приближается к теоретическим выводам о связывании нуклеотидов, правилам колебания.К сожалению, эти правила не охватывают все нюансы считывания кодонов. В этом исследовании рассматриваются свойства тРНК считывания кодонов и их эволюционное влияние на смещение использования кодонов.

Результатов: Используя три различных вычислительных метода, идентифицируют сигнал декодирования тРНК в смещении использования кодона. Предсказания, полученные с помощью методов, в целом согласуются друг с другом и хорошо сравниваются с экспериментальными доказательствами считывания кодонов. Этот анализ предполагает пересмотренное считывание кодонов цитозольной тРНК в геноме дрожжей ( Saccharomyces cerevisiae, ), что является более точным, чем обычное присвоение правил колебания.Результаты подтверждают ранее сделанное наблюдение, что правила колебания недостаточны для полного описания считывания кодонов, поскольку они зависят от геном-специфичных факторов. Представленные здесь вычислительные методы применимы к любому полностью секвенированному геному.

Наличие: По запросу автора.

Контакт: [email protected]

1 ВВЕДЕНИЕ

Стандартный генетический код состоит из 61 смыслового кодона и 3 стоп-кодонов, кодирующих 20 аминокислот и сигнал терминации.Молекулы, передающие это отображение трансляции, представляют собой несколько типов транспортной РНК (тРНК). К одной стороне тРНК аминокислота присоединена обозначенной аминоацил тРНК синтетазой (ARS). Это соединение каждой аминокислоты с помощью ARS с соответствующей молекулой тРНК является ключевой частью картирования генетического кода (Ibba and Söll, 2000). С другой стороны от тРНК расположен антикодон, который связывается со специфическими кодонами информационной РНК (мРНК) в A-сайте рибосомы, обеспечивая декодирование правильной аминокислоты.ТРНК меньше, чем кодонов, так как нестандартное связывание оснований позволяет одной молекуле тРНК читать несколько кодонов, тем самым уменьшая количество тРНК, необходимых для чтения всех кодонов. В зависимости от организма количество различных изоакцепторов тРНК колеблется от 23 (допуская полностью вырожденное связывание в положении третьего кодона) до 45 (допуская только вырожденное связывание пиримидинов). Это антикодон-кодоновое картирование тРНК на мРНК является фокусом данного исследования (см. Рис. 1). Сначала мы исследуем влияние декодирующих свойств тРНК на систематическую ошибку использования кодонов, а затем используем сигнал для определения считывания кодонов в дрожжах.

Рис. 1.

Отображение генетического кода. В стандартном генетическом коде есть 61 кодон мРНК, которые определяют 20 аминокислот. Расшифровка осуществляется 23–45 молекулами тРНК, каждая из которых заряжена назначенной аминокислотой с помощью ARS. Картирование антикодонов тРНК к кодонам мРНК является предметом настоящего исследования.

Рис. 1.

Картирование генетического кода. В стандартном генетическом коде 61 кодон мРНК, которые определяют 20 аминокислот.Расшифровка осуществляется 23–45 молекулами тРНК, каждая из которых заряжена назначенной аминокислотой с помощью ARS. Сопоставление антикодонов тРНК с кодонами мРНК является предметом данного исследования

Ошибка использования кодонов - это неслучайное, неравное использование синонимичных кодонов. Он формируется балансом мутационной предвзятости и отбора (Bulmer, 1991). Мутационные смещения, возникающие из-за процессов ДНК (ошибки репликации и восстановления и т. Д.), Порождают вариации в последовательностях. Эти вариации последовательности подвергаются различным селективным давлениям.Ярким таким паттерном отбора является коэволюция количества тРНК и систематической ошибки использования кодонов (Dong et al. , 1996). Многие из различных паттернов вызваны физиологическими ограничениями трансляционного отбора (Plotkin and Kudla, 2011). . Относительная сила и важность всех факторов, влияющих на систематическую ошибку использования кодонов, еще не решены. Учитывая центральную роль тРНК в трансляции, не исключено, что сигнал, вызванный свойствами декодирования тРНК, может быть обнаружен с помощью анализа систематической ошибки использования кодонов.

Декодирующие свойства тРНК определяются несколькими факторами. По сути, рибосома ограничивает первую и вторую позицию кодона строгим связыванием родственного (Watson – Crick) связывания, но отслеживает третью позицию кодона менее строго (Ogle and Ramakrishnan, 2005). Таким образом, третье положение кодона и первое положение антикодона называют положением колебания. В связи с необходимостью стабильного синтеза белка, нуклеотиды в позиции колебания тРНК часто химически модифицируются для изменения специфичности связывания (Agris et al., , 2007). Клетка вкладывает сравнительно большие средства в гены для модификаций тРНК, чтобы поддерживать стабильность тРНК, способствовать распознаванию соответствующего ARS и обеспечивать точное считывание кодонов (de Crécy-Lagard, 2007).

Определение считывания кодонов важно для нескольких методов анализа последовательностей. Некоторые показатели использования кодонов зависят от знания специфического антикодон-кодонного картирования [например, tAI (Friberg et al. , 2006) и TPI (dos Reis et al. , 2003)].Картирование может помочь понять эволюцию генетического кода и найти потенциальные цели для реинжиниринга генетического кода для включения неприродных аминокислот в белки (Moura et al. , 2010). Наиболее убедительный способ определения характеристик связывания (то есть точности и эффективности) - с помощью экспериментов (Björk и Hagervall, 2005; Johansson et al. , 2008). К сожалению, экспериментальное определение свойств тРНК является дорогостоящим и трудоемким.Следовательно, способность предсказывать декодирующие свойства тРНК является весьма желательной альтернативой экспериментальному назначению.

Используя знания нуклеотидной химии спаривания оснований, Фрэнсис Крик предложил схему для декодирующих свойств тРНК (Crick, 1966). Это правила колебания, которые до сих пор остаются общим описанием для отображения антикодон-кодон. Первоначальная версия правил колебания может быть кратко описана как: A: U, C: G, G: {C, U}, U: {A, G}, а в случае аденина, модифицированного до инозина: I: {A, C, U}.Последнее было единственной известной модификацией при разработке правил колебания. Это обозначение понимается следующим образом: основание в первой позиции антикодона находится перед двоеточием, а набор оснований в третьей позиции кодона, который может связываться с первой позицией антикодона, находится после двоеточия. Например, U: {A, G} означает, что урацил в положении колебания тРНК может связывать либо аденозин, либо гуанин. Исходные правила колебания кратко представлены на рисунке 2A.

Рис. 2.

Отображения антикодонов и кодонов. ( A ) Исходные правила колебания (Crick, 1966). ( B ) Возможные считывания кодонов, наблюдаемые в экспериментах

Рис. 2.

Сопоставления антикодонов и кодонов. ( A ) Исходные правила колебания (Crick, 1966). ( B ) Возможные считывания кодонов, наблюдаемые в экспериментах

Со временем, когда были обнаружены новые модификации тРНК, было обнаружено несколько случаев, в которых исходные правила колебания не могли описать истинное считывание кодонов Agris (1991); Agris et al., (2007); Гатри и Абельсон (1982); Ёкояма и Нисимура (1995). В ответ исходные правила качания были обновлены несколько раз, чтобы учесть вновь обнаруженные показания кодонов. Например, в ограниченной версии правил колебания для эукариот колебание I: A не допускается (Guthrie and Abelson, 1982). Наблюдаемые возможности считывания кодонов суммированы на рисунке 2B. Оказывается, найти простые «правила» для считывания кодонов нетривиально и, возможно, невозможно. На сегодняшний день нет обобщения правил колебания, даже если известны базовые модификации.

Особый метод, расширяющий правила колебания, заслуживающий упоминания, - это метод экономии колебаний (Percudani и др. , 1997; Percudani, 2001). Этот метод определяет назначение считывания кодонов у эукариот на основе геномных данных. Он использует правила колебания и добавляет информацию о присутствии изоакцепторов тРНК для данного организма, информацию, которую можно довольно легко извлечь из полного генома (Lowe and Eddy, 1997). Экономия на колебании предполагает, что кодон с родственной тРНК имеет только каноническое декодирование.Расширенное считывание кодона тРНК предполагается, если кодон не имеет родственной тРНК. Правила, которые определяют экономию вобуляции у эукариот: (i) кодонам с родственными тРНК назначается каноническое декодирование, (ii) кодонам без родственной тРНК назначается в соответствии с принципом ограниченного колебания (G: U, A: C) и (iii) расширенные пары (A: A, U: G) предполагаются для кодонов, которые остаются неназначенными. Снижение колебаний применимо только к эукариотам, но не к бактериям, тРНК которых обычно распознают больше кодонов, чем эукариоты.

Другой основанный на последовательностях подход к выводу тенденций в считывании кодонов тРНК основан на анализе генов тРНК и модифицирующих тРНК ферментов у разных видов (Grosjean et al. , 2010). Четыре основных стратегии декодирования трех царств жизни были идентифицированы по паттернам отсутствия / присутствия тРНК и генов, которые участвуют в специфических модификациях нуклеотидов. Предполагается, что белки для нуклеотидных модификаций эволюционировали с целью оптимизации специфичности и эффективности трансляции.Есть несколько исключений для стандартных режимов декодирования, в частности для модификаций урацила, где трудно различить считывание кодона. Это ограничение метода. Например, в боксе с четырьмя кодонами нет необходимости предотвращать считывание U *: U, хотя неясно, является ли это считывание жизнеспособным или нет.

В этом исследовании мы используем новый подход, чтобы обнаружить отпечаток свойств тРНК-декодирования в смещении использования кодонов и сделать вывод о считывании кодонов тРНК. Мы предлагаем метод скрытой марковской модели (HMM) и два вспомогательных метода: регрессию (REG) и корреляцию кодонов (CC). Результаты показывают, что лучшие прогнозы занимают высокое место в распределении всех решений. Кроме того, все три метода обычно согласуются с предсказанием. Предсказания методов превосходят правила колебания на экспериментально подтвержденных показаниях кодонов.

2 ПОДХОД

2.1 Прогнозирование антикодон-кодонного картирования с использованием данных последовательности

Три метода используют исключительно геномные данные.В случаях HMM и CC используются последовательные синонимичные кодоны. Наблюдение, что количество тРНК коррелирует с систематической ошибкой использования кодонов, используется в методе регрессии. Чтобы сократить обширное пространство возможных считываний кодонов, мы делаем следующие предположения:

  1. Мы берем аминокислотную идентичность тРНК, полученную из данных геномной тРНК, и предполагаем, что ошибки аминоацилирования при ARS незначительны, потому что Этап аминоацилирования тРНК намного точнее декодирования мРНК.Ошибки аминоацилирования возникают со скоростью ~ 10 -6 (Schulman, 1991; Söll, 1990), тогда как оценочная средняя частота ошибок для декодирования мРНК составляет < 4 × 10 -4 на кодон (Parker, 1989). . Мы также предполагаем, что считывание кросс-бокса тРНК для других аминокислот незначительно (Kramer and Farabaugh, 2007).

  2. Мы делаем различие между точностью декодирования (оптимизация считывания кодонов и предотвращение ошибок) и эффективностью декодирования (оптимизация скорости трансляции).Нас интересует, может ли тРНК читать кодон, и нас не волнует скорость трансляции. Мы предполагаем, что эффективность ортогональна точности считывания и что считывания редких кодонов могут быть обнаружены в смещении кодонов. Поэтому мы применяем бинарное антикодон-кодонное взаимодействие тРНК и связывания мРНК. Оценка относительных частот связывания не рассматривается. Использование кодонов может иметь большое влияние на скорость трансляции (Ingolia et al. , 2009), а неравномерное считывание разных кодонов одной и той же тРНК, как известно, влияет на смещение кодонов (Curran, 1995; Ran and Higgs, 2010).С другой стороны, экспериментальные данные на дрожжах показывают, что все кодоны транслируются с одинаковой скоростью (Qian et al. , 2012).

  3. Мы разделяем все возможные двоичные отображения на два взаимоисключающих подмножества считываний кодонов. Это необходимо, потому что сильно вырожденные аминокислоты могут иметь большое количество отображений (порядка миллиардов). Большое количество возможностей может привести к неправдоподобным показаниям, которые случайным образом имеют более высокий балл, чем истинное чтение.Поэтому мы ограничиваем пространство решений набором правдоподобных отображений, то есть отображений, которые наблюдались экспериментально (рис. 2B). Другое подмножество неправдоподобных решений используется для справки, чтобы оценить распределение баллов и оценить их значимость. Правдоподобные показания рассматривают альтернативные решения для нуклеотидов A и U (и модификаций) в положении колебания тРНК. Нуклеотид C может предполагать только родственное связывание (C: G), а нуклеотид G конститутивно считывает пиримидиновые основания (G: {U, C}).Это отражено в генетическом коде, где все двухблочные пиримидиновые кодоны имеют одну единственную тРНК NNG . Вместе с кодонами с одним блоком эти случаи имеют только одно тривиальное решение.

3 МЕТОДА

3.1 HMM для состояний тРНК

В этом исследовании основным методом определения считывания кодона является дискретный конечный HMM. Скрытые состояния HMM - это неизвестные тРНК, которые используются для декодирования кодонов. Наблюдаемый результат состояний тРНК представляет собой последовательность последовательных синонимичных кодонов для одной аминокислоты независимо от размера интервала.HMM для считывания кодонов конкретной аминокислоты описывается исходными вероятностями начала π , вероятностями перехода t и вероятностями излучения e состояний тРНК. Рисунок 3 иллюстрирует пример структуры ГММ аланина. Для каждой аминокислоты может быть несколько моделей, каждая из которых определяется различным набором вероятностей. Цель состоит в том, чтобы определить, какая модель имеет наибольшую вероятность наблюдения последовательностей кодонов с учетом параметров.Из модели с наивысшей оценкой мы делаем вывод о картировании антикодон-кодон. Параметры данной модели определяются оцениваемым гипотетическим считыванием кодонов. Во время оценки параметры HMM не оптимизируются, вместо этого все параметры предварительно определены следующим образом.

Рис. 3.

HMM для аланина в дрожжах. Серые стрелки представляют вероятности перехода t изменения между неизвестными состояниями тРНК. С моделью связаны вероятности начального состояния тРНК π .Черные стрелки представляют собой вероятности и эмиссии наблюдения кодона с учетом состояний тРНК. Вероятности перехода и начала оцениваются по количеству тРНК и параметру повторного использования тРНК. Каждая модель имеет разные вероятности эмиссии, полученные на основе оцениваемого считывания кодонов. Модель с наивысшей вероятностью с учетом последовательностей - это предсказанное считывание кодона

Рис. 3.

HMM для аланина в дрожжах. Серые стрелки представляют вероятности перехода t изменения между неизвестными состояниями тРНК.С моделью связаны вероятности начального состояния тРНК π . Черные стрелки представляют собой вероятности и эмиссии наблюдения кодона с учетом состояний тРНК. Вероятности перехода и начала оцениваются по количеству тРНК и параметру повторного использования тРНК. Каждая модель имеет разные вероятности эмиссии, полученные на основе оцениваемого считывания кодонов. Модель с наивысшей вероятностью при данных последовательностях - это предсказанное считывание кодона

Матрица вероятностей выбросов E содержит нулевые или ненулевые элементы.Строки представляют тРНК для данной аминокислоты, а столбцы представляют кодоны, кодирующие эту аминокислоту. Например, для аланина в дрожжах (две тРНК и четыре кодона) матрица имеет две строки и четыре столбца. Матричный элемент положительный, если тРНК может использоваться для декодирования этого кодона, или ноль в противном случае. Чтобы матрица выражала вероятности, строки матрицы нормализуются до суммы в единицу (∑ j e ij = 1), и вероятность равномерно распределяется по всем допустимым кодонам.Например, если первая тРНК считывает два первых кодона из четырех, вероятности в первой строке E будут [0,5, 0,5, 0, 0].

Матрица переходов T представляет собой квадратную матрицу вероятностей, изменяющихся между состояниями tRNA, где сумма всех переходов, покидающих или оставшихся в состоянии, равна единице (∑ j t ij = 1). Вероятности перехода предопределяются из вектора частоты тРНК, так что вероятность остаться или перейти в состояние пропорциональна количеству тРНК.Мы предполагаем, что лежащая в основе динамика тРНК одинакова для разных моделей считывания кодонов, а T постоянна для всех моделей. В соответствии с наблюдениями, смещение использования внутривидовых кодонов (Cannarozzi et al. , 2010; Tuller et al. , 2010), вероятность остаться в том же состоянии выше. Мы фиксируем это, добавляя линейный член к диагонали, что придает больший вес повторному использованию редкой тРНК. Срок повторного использования предварительно оценивается на основе данных с точкой пересечения α = 0.065, а градиент β = –0,087, с помощью итерационной процедуры, которую можно описать следующим образом. Начиная с первоначального предположения о вероятностях перехода (на основе частот тРНК), алгоритм Витерби вычисляет наиболее вероятную последовательность состояний с учетом наблюдаемых последовательностей кодонов. На основе предполагаемых состояний мы подсчитываем количество переходов, и параметры обновляются соответствующим образом, и процедура повторяется до тех пор, пока вероятности переходов не сойдутся. С помощью этой процедуры мы обнаружили, что повторное использование, по-видимому, более выражено для тРНК, кодирующей редкие кодоны, и поэтому вес для них линейно увеличивается.Значения вероятностей перехода оцениваются путем введения нормально распределенного шума и проверки степени воспроизводимости результатов.

Вектор начального состояния π = [ π 1 π 2 ] T вычисляется из собственного разложения матрицы перехода, что дает предельное использование тРНК. Разложение матрицы перехода выбирается вместо использования кодона или частотного вектора тРНК, потому что мы предполагаем, что трансляция - это непрерывный процесс, в котором несколько рибосом участвуют в многократной трансляции одной и той же мРНК (Карамышев et al., 2004). Гипотетически профиль концентрации тРНК вокруг рибосомы отличается от глобального среднего содержания тРНК. Однако оказывается, что выбор любой из двух альтернатив мало влияет на конечный результат.

Теперь, когда мы описали, как определять вероятности, мы хотим найти модель, которая имеет наибольшую вероятность описания наблюдаемой последовательности последовательных кодонов. Все модели имеют одинаковые вероятности начала и перехода, но вероятности выбросов различаются.Чтобы оценить соответствие модели λ = { E, T, π } и наблюдаемой последовательности O , нам необходимо найти вероятность последовательности кодонов для модели P ( O | λ ). Это включает рассмотрение всех возможных путей через HMM, которые могут быть эффективно решены с помощью прямой процедуры (Rabiner, 1989).

Мера, которая используется для сравнения моделей для различных возможностей считывания кодонов, - это объединенные вероятности HMM для всех наблюдаемых последовательностей.Модель, которая дает наивысшую общую вероятность, - это предполагаемое считывание кодона. Следует отметить, что мы используем вероятность P ( O | λ ), а не апостериорную вероятность P ( λ | O ). Поскольку мы считаем, что все модели одинаково вероятны (т.е. априорная вероятность P ( M ) одинакова для всех моделей), вероятность и апостериорная вероятность фактически равны. Точно так же вероятность свидетельства P ( O ) одинакова для всех оценок.

3.2 Регрессия количества тРНК и использования кодонов

Метод регрессии (REG) использует систематическую положительную корреляцию использования кодонов и количества тРНК (Garel, 1974; Ikemura, 1981). То есть количество тРНК в клетке коррелирует с систематической ошибкой использования кодонов, так что наиболее распространенные тРНК соответствуют наиболее часто встречающимся родственным кодонам. Для нашей цели количество копий гена тРНК используется в качестве показателя количества тРНК (Dong et al. , 1996; Ikemura, 1981).

Эксперименты показывают, что количество тРНК изменяется в зависимости от квадрата частот кодонов (Dong et al. , 1996). Существуют теории, предлагающие другие зависимости (Эренберг и Курланд, 1984; Liljenström и др. , 1985). Однако мы обнаружили, что квадратичная зависимость лучше соответствует известным показаниям кодонов, и, следовательно, эта зависимость используется в модели.

Метод регрессии предсказывает считывание кодонов, оценивая, какое из всех возможных решений лучше всего подходит для взаимосвязи между частотой кодонов и количеством тРНК.Пример оценки считывания кодонов для аланина в дрожжах проиллюстрирован на рисунке 4 (соответствие других аминокислот показано на дополнительном рисунке S1). Для каждого потенциального считывания двоичных кодонов частота кодонов вычисляется как сумма всех вхождений кодонов, которые могут быть считаны данной тРНК. Сумма количества кодонов x i , считываемая тРНК i , вычисляется по формуле, где n c - коэффициент нормализации для учета множественного считывания кодонов tRNA i .ТРНК распределяется часть количества кодонов на основе общего числа различных синонимичных кодонов, которые тРНК может считывать, так что каждая тРНК улавливает правильную пропорцию количества кодонов. Коэффициент нормализации вычисляется по формуле: где r - это доля различных кодонов, которые тРНК может считывать. Например, кодон c читается тРНК i , которая может читать четыре кодона. Кодон c также может быть прочитан другой тРНК, которая считывает три кодона. Следовательно, коэффициент нормализации становится равным n c = (1 / 4) / (1 / 4 + 13) = 3 / 7.

Рис. 4.

Описание метода регрессии. Метод регрессии, описанный для аланина в дрожжах. Матрица считывания отображает количество копий гена тРНК на кодоны. В этом примере тРНК AGC Ala имеет 11 копий в геноме дрожжей и может считывать кодоны {GCU, GCC}, которые имеют частоту 58 952 и 35 580 соответственно, и трансформируется в 94 532 (на основе кодона чтение в примере). Суммирование может быть удобно выполнено путем умножения вектора кодона на матрицу считывания.Это дает точку (94 532, 11), и аналогично для тРНК AGC Ala , читающая {GCA, GCG}, имеет точку (66 324, 5). Прогнозируемое считывание кодонов представляет собой матрицу, которая дает наилучшее соответствие линейной регрессии квадратичному члену использования кодонов (тРНК ~ γx 2 + e ). Регрессия перехватывается через начало координат, и параметр формы квадратичного члена оценивается на основе регрессии. Соответствие конкретного считывания кодона измеряется коэффициентом детерминации R 2

Рис.4.

Описание метода регрессии. Метод регрессии, описанный для аланина в дрожжах. Матрица считывания отображает количество копий гена тРНК на кодоны. В этом примере тРНК AGC Ala имеет 11 копий в геноме дрожжей и может считывать кодоны {GCU, GCC}, которые имеют частоту 58 952 и 35 580 соответственно, и трансформируется в 94 532 (на основе кодона чтение в примере). Суммирование может быть удобно выполнено путем умножения вектора кодона на матрицу считывания.Это дает точку (94 532, 11), и аналогично для тРНК AGC Ala , читающая {GCA, GCG}, имеет точку (66 324, 5). Прогнозируемое считывание кодонов представляет собой матрицу, которая дает наилучшее соответствие линейной регрессии квадратичному члену использования кодонов (тРНК ~ γx 2 + e ). Регрессия перехватывается через начало координат, и параметр формы квадратичного члена оценивается на основе регрессии. Соответствие конкретного считывания кодона измеряется коэффициентом детерминации R 2

Теперь у нас есть суммарное количество кодонов x i для определенного считывания кодона и соответствующее количество тРНК tRNA i согласно геномным данным.Согласно предполагаемой зависимости соответствие матрицы считывания кодонов вычисляется с помощью регрессионной модели

. Модель использует только квадратичный член, а точка пересечения всегда проходит через начало координат. Значение параметра формы γ оценивается по данным во время регрессии. Таким образом, существует только одна степень свободы, и можно учесть две точки, как в случае с аминокислотами с двумя изоакцепторами тРНК. Член ошибки i представляет отклонения наблюдаемых значений от ожидаемого значения (т.е.е. остаточная дисперсия, не объясняемая моделью). Здесь мы выбрали для оценки соответствия модели коэффициент детерминации R 2 .

3.3 Автокорреляция синонимичных кодонов

Существует сильное предпочтение использованию идентичного кодона в следующем последовательном экземпляре аминокислоты. Это происходит из-за нескольких заметных предубеждений, таких как смещение кодонов в сторону оптимального кодона и вариабельное содержание GC в геноме.В результате этих эволюционных сил возникает положительная автокорреляция этих кодонов. Здесь мы используем это явление для анализа считывания кодонов. Этот метод отныне называется СС, не путать с корреляцией использования кодонов и количества тРНК.

На фиг. 5 показана матрица кодоновой корреляции для аланина в дрожжах (другие аминокислоты показаны на дополнительном рисунке S2). Эта матрица строится из числа последовательных синонимичных кодонов в экземплярах аминокислоты независимо от расстояния между ними для всех последовательностей, отвечающих требованиям (см. Ниже).Подсчеты измеряются в баллах z , то есть они сравниваются с ожидаемым использованием встречаемости кодонов. Это делается путем вычитания ожидаемого значения из наблюдаемых подсчетов и деления на стандартное отклонение, Z = ( X - E [ X ]) / σ X , предполагая, что кодон имеет значение являются независимыми событиями и подчиняются биномиальному распределению. Матрица, преобразованная в z , дает наблюдения в стандартных отклонениях от среднего.Как и ожидалось, диагональ имеет большие положительные значения, как и ожидалось из-за преобладающих смещений (например, смещения использования кодонов, распределения нуклеотидов и т. Д.). Более интересны положительные входы вне диагоналей. Эти записи часто совпадают с известным считыванием кодонов изоакцепторной тРНК, и кодоны, считываемые той же самой тРНК, появляются как блочные структуры в матрице (рис. 5). Эти блочные структуры используются для прогнозирования считывания кодонов.

Рис. 5.

Кодоновая корреляция последовательных синонимичных кодонов.Матрица корреляции последовательных кодонов аланина в дрожжах. Цифры представляют собой стандартизованные нормальные преобразованные отклонения от среднего ( Z -баллов). Например, наблюдаемое количество GCU, за которым следует еще один GCU, на 11,0 стандартных отклонений чаще, чем ожидалось. Два блока положительных Z-оценок (заштрихованные) совпадают с считыванием кодонов двух тРНК. Это наблюдение используется для вывода кодонов.

Рис. 5.

Кодоновая корреляция последовательных синонимичных кодонов.Матрица корреляции последовательных кодонов аланина в дрожжах. Цифры представляют собой стандартизованные нормальные преобразованные отклонения от среднего ( Z -баллов). Например, наблюдаемое количество GCU, за которым следует еще один GCU, на 11,0 стандартных отклонений чаще, чем ожидалось. Два блока положительных Z-оценок (заштрихованные) совпадают с считыванием кодонов двух тРНК. Это наблюдение используется для вывода о считывании кодонов

. Потенциальное считывание кодонов оценивается следующим образом. Сумма × подсчетов пар кодонов, считываемых одной и той же тРНК, вычисляется путем суммирования элементов матрицы наблюдаемых отсчетов × в соответствии с оцениваемым считыванием кодонов.Если элемент матрицы считывается той же тРНК, счетчик добавляется, если нет, то вычитается. Диагональ, которая представляет смещение для повторного использования одного и того же кодона в последовательных экземплярах, игнорируется. Эта процедура описывается как где C ij равно +1, если кодоны считываются одной и той же тРНК, и –1, если нет.

Та же процедура выполняется для матрицы «ожидаемых» подсчетов последовательных кодонов. После этого преобразование z дает общий балл путем вычитания общего ожидаемого количества из общего наблюдаемого количества и деления на общее стандартное отклонение.Это обеспечивает процедуру для оценки различных матриц чтения. Матрица считывания кодонов, которая дает наивысший общий балл z , представляет собой предсказанное отображение антикодон-кодон.

3.4 Источники и подготовка данных

Все сравнения в этом исследовании используют одни и те же источники данных о последовательностях. Данные о количестве копий гена тРНК взяты из «Геномной базы данных тРНК» (Chan and Lowe, 2009). Частоты использования кодонов взяты из опубликованных последовательностей генома (Kersey et al., 2010 г.). В процессе сборки частот использования кодонов данные последовательности фильтруются для удаления последовательностей, которые имеют несоответствующие кодоны, такие как: внутренние стоп-кодоны, запрограммированные сдвиги рамки и неопределенные нуклеотиды. Последовательности короче 50 аминокислот отбрасываются. При подсчете пар синонимичных кодонов аминокислоты исключаются последовательности с менее чем тремя экземплярами этой аминокислоты. Другие экспериментальные справочные данные, собранные из различных источников, упомянуты в соответствующих частях разделов ниже.

4 РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

В этом разделе мы проверим методы и протестируем их, сначала проверив, где наиболее правдоподобные показания кодонов находятся в пространстве решений. Затем мы используем процедуру консенсуса, чтобы увидеть, как часто три разных метода согласуются друг с другом. Наконец, мы сравниваем предсказания с экспериментальными данными. Используя эти методы и экспериментальные данные, мы предлагаем улучшенный прогноз чтения кодонов у дрожжей.

4.1 Правдоподобные показания кодонов занимают высокое место в пространстве решений

Чтобы исследовать эволюционный сигнал в смещении использования кодонов из-за физиологических ограничений декодирования тРНК, мы смотрим, как подмножество правдоподобных считываний кодонов ранжируется по сравнению с другими показаниями двоичных кодонов. Правдоподобные показания кодонов основаны на аргументах химии нуклеотидов и на тенденциях в наблюдаемых сопоставлениях антикодон-кодон (возможности показаны на рис.2Б). Распределение оценок трех методов определения аланина в дрожжах показано на рисунке 6, где подмножества правдоподобных считываний кодонов обозначены черными квадратами, а другие неправдоподобные решения - серыми точками. Баллы нормализованы в диапазоне от 0 (самый низкий) до 1 (самый высокий) по с n = ( с -мин с ) / (макс. с -мин с ). Лучшее правдоподобное решение для аланина занимает первое место в распределении для всех трех методов.Для REG и HMM все вероятные решения находятся в верхней половине распределения, тогда как в методах CC разброс больше.

Рис. 6.

Относительное распределение баллов трех методов для аланина в дрожжах. Каждая точка представляет собой относительную оценку по оси y всех возможных считываний двоичных кодонов. Баллы масштабируются в диапазоне от 0 до 1. Значения имеют случайность, добавленную к координате x , чтобы лучше визуализировать распределение.Подмножества считывания кодонов, которые являются правдоподобными, показаны в виде черных квадратов. Эти показания кодонов занимают высокое место среди других решений, обозначенных серыми точками.

Рис. 6.

Относительное распределение оценок трех методов для аланина в дрожжах. Каждая точка представляет собой относительную оценку по оси y всех возможных считываний двоичных кодонов. Баллы масштабируются в диапазоне от 0 до 1. Значения имеют случайность, добавленную к координате x , чтобы лучше визуализировать распределение.Подмножества считывания кодонов, которые являются правдоподобными, показаны в виде черных квадратов. Эти показания кодонов занимают высокое место среди других растворов, обозначенных серыми точками

Повторение этого для всех нетривиальных аминокислот в дрожжах показывает, что наиболее вероятные показания кодонов с наибольшей оценкой имеют тенденцию быть в верхней части распределений (см. Рис. S3). . Для CC, REG и HMM все вероятные решения находятся в 25, 58 и 75% верхней половины распределения, соответственно. Метод кодоновой корреляции имеет наибольшие вариации, и подмножество часто распространяется по остальной части распределения.Из трех методов у HMM есть правдоподобные решения, которые обычно занимают высокое место в распределении.

Затем мы сравниваем предсказания со случайными. Рандомизация использования кодонов с использованием глобального использования кодонов организма удаляет сигнал считывания кодонов. Рандомизация для CC и HMM производится путем взятия исходных аминокислотных последовательностей и рисования случайных синонимичных кодонов в соответствии с частотами кодонов. Метод REG рандомизируется путем извлечения из искаженного нормального распределения на основе использования кодонов в геноме.Лучшее правдоподобное решение сравнивается с лучшими правдоподобными решениями рандомизированных данных.

Чтобы вычислить значимость наших решений, мы сравниваем 99 рандомизированных точек выборки с реальным решением. Мы используем эмпирические значения P , основанные на процедуре Монте-Карло, которая основана на ранге и не полагается на предположения о распределении. Значения P вычисляются как ⁠, где n - общее количество симуляций, а r - количество симуляций, которые равны или больше фактического, не рандомизированного значения данных.В таблице 1 приведены эмпирические значения P для растворов аминокислот в дрожжах. Решения для метода HMM все значимы с P -значения от 0,01 до 0,02, которые выражают, что решения HMM занимают первое или второе место по сравнению с смоделированными данными. Это не относится к CC и REG, которые производят только несколько решений, которые значительно отличаются от случайного назначения. В частности, для считывания атипичных кодонов аргинина метод CC работает плохо, когда большинство смоделированных решений имеют лучшие результаты, чем фактические данные.Хотя блочные структуры метода CC часто согласуются с известными случаями, CC, как правило, имеет меньшую предсказательную силу, чем REG и HMM, вероятно, из-за внутренних ограничений метода CC для предсказания случаев широкого считывания кодонов, когда тРНК могут считывать несколько кодонов. Таким образом, эти наблюдения являются показателями сигнала о свойствах декодирования тРНК в кодирующих последовательностях.

Таблица 1.

Результаты рандомизации для нетривиальных аминокислот в дрожжах

Аминокислота . CC . REG . HMM .
Аланин 0,01 0,10 0,01
Аргинин 0,97 0,48 0,01
Глицин 0,20 0,31 0,01 0,20 0,31 0,01 0,12 0,31 0,02
Пролин 0.40 0,15 0,02
Серин 0,25 0,22 0,01
Треонин 0,06 0,06 0,01
Валин 0,04 0,07
Аминокислота . CC . REG . HMM .
Аланин 0,01 0,10 0,01
Аргинин 0,97 0,48 0,01
Глицин 0,20 0,31 0,01 0,20 0,31 0,01 0,12 0,31 0,02
Пролин 0,40 0,15 0,02
Серин 0.25 0,22 0,01
Треонин 0,06 0,06 0,01
Валин 0,04 0,07 0,02
Таблица 1.

Результаты рандомизации для нетривиальных аминокислоты в дрожжах

Аминокислоты . CC . REG . HMM .
Аланин 0,01 0,10 0,01
Аргинин 0,97 0,48 0,01
Глицин 0,20 0,31 0,01 0,20 0,31 0,01 0,12 0,31 0,02
Пролин 0,40 0,15 0,02
Серин 0.25 0,22 0,01
Треонин 0,06 0,06 0,01
Валин 0,04 0,07 0,02
Аминокислота . CC . REG . HMM .
Аланин 0,01 0.10 0,01
Аргинин 0,97 0,48 0,01
Глицин 0,20 0,31 0,01
Лейцин 0,12 0,31 0,02 Пролин 0,40 0,15 0,02
Серин 0,25 0,22 0,01
Треонин 0.06 0,06 0,01
Валин 0,04 0,07 0,02

4,2 Три различных метода часто приводят к согласию в результате

Согласование между предсказаниями методов может указывать на способность методов обнаруживать сигнал. Чтобы проверить это, мы подсчитываем, насколько совпадают прогнозы каждого метода для считывания кодонов нетривиальных аминокислот с вырожденностью кодонов больше трех в 241 геноме.Это дает в общей сложности 1583 прогноза. Каждое из предсказанных решений сравнивается с распределением наилучшего правдоподобного решения из нескольких данных рандомизированной последовательности (сгенерированных, как описано выше). Результат сравнения представлен в виде диаграммы Венна на Рисунке 7. В 205 случаях все три прогноза совпадают, что на 26 случаев больше, чем ожидаемое значение 179. Этот результат является статистически значимым при P -значение = 0,012. , вычисленный с использованием процедуры Монте-Карло, как описано выше.С другой стороны, случай, когда все три метода не согласуются, имеет счет 428, что на 115 меньше ожидаемого ( P - значение < 10 -10 ). Для 73% из 1583 прогнозов совпадают как минимум два метода. Методы HMM и REG имеют наибольшее количество согласований, 419 раз, что немного больше, чем REG и CC (412). HMM и CC имеют только 119 совпадающих прогнозов, что на 168 меньше, чем ожидалось случайно. Это несколько неожиданно, потому что HMM и CC используют частоты пар кодонов для своих предсказаний.Это несоответствие возможно из-за присущего CC недостатка захвата широких считываний кодонов. Таким образом, наблюдение, что методы согласуются друг с другом чаще, чем ожидалось случайным образом, поддерживает идею о том, что считывание кодонов может быть обнаружено по смещению использования кодонов.

Рис. 7.

Консенсус между методами, основанными на последовательностях. Черные числа показывают количество совпадающих прогнозов для разных методов. Серые числа под черными числами указывают на различие в случайном.Например, на среднем перекрестке есть 205 прогнозов, в которых совпадают все три метода, что на 26 больше, чем ожидалось случайным образом. Все значения существенно отличаются от случайных

Рис. 7.

Консенсус между методами, основанными на последовательностях. Черные числа показывают количество совпадающих прогнозов для разных методов. Серые числа под черными числами указывают на различие в случайном. Например, на среднем перекрестке есть 205 прогнозов, в которых совпадают все три метода, что на 26 больше, чем ожидалось случайным образом.Все значения значительно отличаются от случайных

4.3 Проверка достоверности показывает значительное согласие с экспериментальными данными

Для дальнейшей оценки эффективности методов мы сравниваем прогнозы с экспериментально определенными показаниями кодонов. Это делается для того, чтобы установить, какой из методов работает лучше всего, и сравнить методы, основанные на последовательностях, с упрощенным методом экономии на колебаниях, который обычно используется для дрожжей. Экспериментально подтвержденные показания кодонов и прогнозы перечислены в таблице 2.Правила экономии вобуляции правильно описывают считывание кодонов в 2 из 11 случаев (18%) у дрожжей. Результат хуже случайного присвоения, указывая на ограничения специализированных правил. Фактически, обобщение считывания кодонов нецелесообразно, даже если модификации тРНК известны, потому что влияние модификаций оснований зависит от контекста. Например, тРНК нсм 5 UGU Pro может считывать весь кодонный блок, тогда как та же самая модификация в сериновой тРНК нсм 5 UGA Ser считывает только кодоны, заканчивающиеся пурином {TCA TCG}.Следовательно, семейства кодонов с четырьмя блоками и могут иметь одинаковые модификации оснований в положении колебания с различным считыванием кодонов. Экономия колебаний применима только к эукариотам, и если применить ее к бактериям в таблице 2, ни один случай не будет правильным.

.c 0 UA 5 0 UA
. Антикодон . Org . Читать . WP . CC . REG . HMM .
Arg мкм 5 UCU a Sc R
Gln мкм s 500 9120 UUG a Sc R
Glu мкм 5 s 2 UUC a A
Gly мкм 5 UCC a Sc R
Leu UAG a Sc N
Pro ncm 5 UGG 900 a С.c N
Ser IGA a Sc D
Ser ncm 5 UGA a Sc R
Thr ncm 5 UGU 60 a С.c R
Val IAC a Sc Y
Val нсм 5 UAC a Sc R
Ala cmo 5 UGC e 21 С.e N NA
Thr cmo 5 UGU e Se V NA
Val cmo 5 UAC e Se N NA
Leu cmnm 5
E.c R NA
Leu cmo 5 UAG c Ec D NA
Val cmo 5 UAC b Ec N NA
Val mnm 5 UUU т.t R NA

Всего правильных назначений: 2 8 7 9
.c 0 UA 5 0 UA
. Антикодон . Org . Читать . WP . CC . REG . HMM .
Arg мкм 5 UCU a Sc R
Gln мкм s 500 9120 UUG a Sc R
Glu мкм 5 s 2 UUC a A
Gly мкм 5 UCC a Sc R
Leu UAG a Sc N
Pro ncm 5 UGG 900 a С.c N
Ser IGA a Sc D
Ser ncm 5 UGA a Sc R
Thr ncm 5 UGU 60 a С.c R
Val IAC a Sc Y
Val нсм 5 UAC a Sc R
Ala cmo 5 UGC e 21 С.e N NA
Thr cmo 5 UGU e Se V NA
Val cmo 5 UAC e Se N NA
Leu cmnm 5
E.c R NA
Leu cmo 5 UAG c Ec D NA
Val cmo 5 UAC b Ec N NA
Val mnm 5 UUU т.t R NA

Всего правильных назначений: 2 8 7 9
.c 0 UA 5 0 UA
. Антикодон . Org . Читать . WP . CC . REG . HMM .
Arg мкм 5 UCU a Sc R
Gln мкм s 500 9120 UUG a Sc R
Glu мкм 5 s 2 UUC a A
Gly мкм 5 UCC a Sc R
Leu UAG a Sc N
Pro ncm 5 UGG 900 a С.c N
Ser IGA a Sc D
Ser ncm 5 UGA a Sc R
Thr ncm 5 UGU 60 a С.c R
Val IAC a Sc Y
Val нсм 5 UAC a Sc R
Ala cmo 5 UGC e 21 С.e N NA
Thr cmo 5 UGU e Se V NA
Val cmo 5 UAC e Se N NA
Leu cmnm 5
E.c R NA
Leu cmo 5 UAG c Ec D NA
Val cmo 5 UAC b Ec N NA
Val mnm 5 UUU т.t R NA

Всего правильных назначений: 2 8 7 9
.c 0 UA 5 0 UA
. Антикодон . Org . Читать . WP . CC . REG . HMM .
Arg мкм 5 UCU a Sc R
Gln мкм s 500 9120 UUG a Sc R
Glu мкм 5 s 2 UUC a A
Gly мкм 5 UCC a Sc R
Leu UAG a Sc N
Pro ncm 5 UGG 900 a С.c N
Ser IGA a Sc D
Ser ncm 5 UGA a Sc R
Thr ncm 5 UGU 60 a С.c R
Val IAC a Sc Y
Val нсм 5 UAC a Sc R
Ala cmo 5 UGC e 21 С.e N NA
Thr cmo 5 UGU e Se V NA
Val cmo 5 UAC e Se N NA
Leu cmnm 5
E.c R NA
Leu cmo 5 UAG c Ec D NA
Val cmo 5 UAC b Ec N NA
Val mnm 5 UUU т.t R NA

Всего правильных назначений: 2 8 7 9

Из Для методов, основанных на последовательностях, HMM работает лучше всего, где девять (из 18) предсказанных назначений кодонов назначены правильно, за ними следуют CC (8 из 18) и REG (7 из 18). Случайное присвоение будет правильным в среднем пять раз, и HMM - единственный метод, который значительно отличается от случайного распределения ( P -значение = 0.04), основанный на биномиальном распределении подмножества правдоподобных решений. Обратите внимание, что имея всего 18 точек данных, трудно получить значимые результаты, потому что отсутствие экспериментальных данных ограничивает возможности теста и что данные сами могут содержать ошибки.

4.4 Лучшее описание считывания кодонов в дрожжах

Здесь мы суммируем то, что известно о считывании кодонов цитозольной тРНК в дрожжах S.cerevisiae на основе экспериментальных результатов и предсказаний, полученных с помощью методов, основанных на последовательностях.Метод HMM работает лучше всего и поэтому используется для большинства прогнозов. Когда в прогнозах есть двусмысленность, мы частично полагаемся на ручное управление. Например, когда оба CC и REG соглашаются на решение, которое совпадает со вторым лучшим предсказанием HMM, мы выбираем этот прогноз. Независимо от прогнозов, мы доверяем экспериментальным данным, и эти назначения имеют приоритет (Johansson et al. , 2008).

Назначение считывания кодонов для всех тРНК в дрожжах показано на рисунке 8, наложенном на генетический код (см. Также дополнительную таблицу S1).Таким образом, в дрожжах имеется 42 различных изоакцептора тРНК, из которых 23 тРНК имеют тривиальные решения, 11 ранее были определены экспериментально (Johansson et al. , 2008), а 8 предсказаны с помощью описанных здесь методов. Предсказания существенно отличаются от прогнозов с использованием метода экономии колебаний, когда 12 из 19 нетривиальных тРНК имеют другие назначения, чем наши. Общей чертой несоответствия является то, что базовая модификация в положении колебания позволяет более широкие особенности для обеспечения функционально избыточной системы декодирования, чем показания кодонов, предсказанные с помощью экономичности колебания.

Рис. 8.

Генетический код и возможности декодирования отдельных видов тРНК дрожжей. Символы, соединенные линией, указывают на то, что кодоны считываются одной и той же тРНК. Квадратные символы указывают кодоны с родственной тРНК, а кружки - без кодонов. Символы серого цвета - это значения кодонов, которые определены экспериментально, а символы белого цвета - рассчитаны с помощью вычислений на основе данных последовательности. Черные символы обозначают случаи, когда считывание кодонов тривиально, то есть существует только одна тРНК для декодирования кодонов

Рис.8.

Генетический код и возможности декодирования отдельных видов тРНК дрожжей. Символы, соединенные линией, указывают на то, что кодоны считываются одной и той же тРНК. Квадратные символы указывают кодоны с родственной тРНК, а кружки - без кодонов. Символы серого цвета - это значения кодонов, которые определены экспериментально, а символы белого цвета - рассчитаны с помощью вычислений на основе данных последовательности. Черные символы указывают на случаи, когда считывание кодонов является тривиальным, то есть существует только одна тРНК для декодирования кодонов

Проверка считывания кодонов в дрожжах показывает случаи, которые отклоняются от общего шаблона у эукариот.Для аминокислот, аланина, пролина и лейцина тРНК с С в положении колебания отсутствует. Следовательно, кодоны NNG могут быть декодированы только посредством чтения вобуляции. Еще одно отклонение от ожидаемой стратегии декодирования - это аргинин, в котором отсутствует общая тРНК для декодирования кодона CGA. Это означает, что этот кодон считывается тРНК ICG Arg (аденин, модифицированный до инозина в положении колебания). Кодон CGA не является редкостью в дрожжах, что позволяет предположить, что чтение I: A не является неэффективным, в отличие от Escherichia coli (Curran, 1995).Эта стратегия декодирования аргинина наблюдается у нескольких других грибов. Глицин является другим частным случаем эукариот, поскольку он не использует тРНК ACC Gly (или любые производные), хотя родственный GGT часто является частым кодоном. Более того, тРНК мкм 5 UCC Gly представляет собой модификацию, которая в дрожжах в остальном наблюдается только для боксов семейства пуриновых 2-кодонов, что указывает на особые свойства этого кодонного бокса. ТРНК UAG Leu в дрожжах необычна для эукариот тем, что она имеет немодифицированный U в положении колебания, что позволяет урацилу считывать все четыре нуклеотида.Декодирование боксов семейства 2-кодонов следует ожидаемому образцу одной тРНК для декодирования пиримидинов и двух тРНК для пуринов, хотя считывание кодонов для пуринов отличается для разных аминокислот. Наконец, тРНК, которая считывает кодон ATA изолейцина, содержит модификацию псевдоуридиновой тРНК ψ A ψ Ile , предотвращая перекрестное считывание кодона AUG, кодирующего метионин.

4.5 Последовательные методы предсказания считывания кодонов

В этом разделе мы обсуждаем два вспомогательных метода (CC и REG) и основной метод, основанный на последовательности (HMM).

4.5.1 CC

Ярким примером импринта тРНК в смещении использования кодонов является появление блочных структур в преобразованных z таблицах пар кодонов для метода CC (дополнительный рисунок 5 и дополнительный S2). Некоторые факторы могут способствовать недиагональной кросс-корреляции кодонов. Существует сильная разница в частотах кодонов между генами с низкой и высокой экспрессией, где гены с высокой экспрессией имеют использование кодонов, которое смещено в сторону кодонов, соответствующих частым тРНК.Следовательно, следующий кодон, скорее всего, будет более частым, чем в среднем. Фактически, существует положительная корреляция между синонимичными кодонами одного и того же гена, независимо от того, являются ли они последовательными или нет. В начале гена имеется более высокое количество редких кодонов для медленной загрузки рибосом, чтобы избежать трансляционной перегрузки (Tuller et al. , 2010). Также с динамикой трансляции связано предпочтительное повторное использование тРНК (Cannarozzi et al. , 2010). Относительные концентрации различных тРНК зависят от условий роста клетки (Dong et al., 1996). Гены, экспрессируемые в разных условиях, могут иметь разное использование кодонов и разные пулы тРНК, к которым они адаптированы (Elf et al. , 2003). Вместе использование кодонов формируется этими связанными с тРНК эффектами и их свойствами декодирования. Есть два случая, когда метод CC не может справиться. Один - в гипотетическом случае, когда все тРНК могут читать все кодоны аминокислоты. Во-вторых, этот метод имеет ограниченное применение для аминокислот, которые декодируются двумя кодонами.

4.5.2 REG

Метод регрессии - интуитивно привлекательный метод, основанный на корреляции количества тРНК и систематической ошибки использования кодонов (Ikemura, 1981). Однако у метода REG есть некоторые потенциальные недостатки. Трансферная РНК не экспрессируется конститутивно, и уровни содержания могут колебаться в зависимости от регуляции, что игнорируется. Кроме того, некоторые организмы имеют низкое количество копий тРНК, что снижает разрешающую способность прогноза. Как и для всех методов, бинарная матрица с наивысшей оценкой представляет собой предсказанное считывание кодонов для аминокислоты.Таким образом, данные определяют положительные случаи считывания кодонов. Например, считывание кодонов, которое экспериментально наблюдается только во время сверхэкспрессии тРНК, может по-прежнему оставлять след в смещении кодонов. Следовательно, это считается жизнеспособным считыванием кодонов.

4.5.3 HMM

HMM - это универсальный подход, основанный на статистических данных (Rabiner, 1989). Что касается CC, HMM основан на предположении, что сигнал присутствует в следующих друг за другом парах синонимичных кодонов.Хотя HMM привлекательно имитирует физический процесс удлинения, предлагая повторное использование тРНК, это не является требованием. Основная проблема HMM - это большое пространство для решения параметров, определяющих модель. Количество возможных решений сокращается до вычислительно приемлемого размера за счет принятия важных предположений (как упомянуто выше). Заранее определенные значения вероятностей перехода оцениваются путем введения случайного шума. Оказывается, в модели преобладают вероятности выбросов, более высокие, чем вероятности перехода и начальные вероятности, которые могут допускать неверные спецификации как минимум до 10%.Хотя в неоднозначных случаях, когда первое и второе вероятные решения очень близки, надежность параметров ниже. Это дела, которые требуют дополнительных доказательств и ручного лечения.

Наконец, что относится ко всем методам, естественным вопросом является вопрос, как изменяется анализ с использованием только высокоэкспрессированных генов. Хорошо известно, что степень систематической ошибки использования кодонов увеличивается с увеличением уровня экспрессии. Следовательно, сигнал может быть сильнее при использовании последовательностей с уровнями экспрессии, оцененными по данным обилия белка.Оказывается, это не улучшает результаты. Возможная причина этого заключается в том, что в подмножестве высокоэкспрессированных генов другой эффект, кроме декодирования, преобладает при отборе по смещению кодонов. Кроме того, эти последовательности содержат несколько экземпляров редких кодонов, что ослабляет сигнал считывания редких кодонов. Это подчеркивает множественные основные причины смещения кодонов и то, что сила отбора различна для генов. Включение в анализ как можно большего количества информации усиливает сигнал считывания кодона.

5 ЗАКЛЮЧЕНИЕ

В этом исследовании мы исследуем отображение антикодонов на кодоны. Мы исследуем слабый, но обнаруживаемый отпечаток в кодонном смещении выбора из свойств декодирования тРНК. Мы показываем, что мы можем обнаружить сигнал, который совпадает с известным считыванием кодонов тРНК. Для этого мы используем три метода на основе последовательностей: HMM, регрессия и CC. Предсказанные сопоставления кодонов и антикодонов часто согласуются с экспериментальными результатами, в частности, для метода HMM, который лучше, чем два других метода, и превосходит метод экономии на колебании.Кроме того, все три разных метода в значительной степени совпадают в прогнозах, и прогнозы обычно занимают высокое место в пространстве решений.

С методами связаны важные допущения, сделанные для помощи в прогнозировании, поскольку пространство решений огромно. Как мы показываем, результатов, основанных на этих предположениях, достаточно, чтобы делать прогнозы, согласующиеся с экспериментальными результатами. Это обеспечивает ценную основу для дальнейших исследований, которые могут улучшить как модель, так и допущения.

Мы переходим к использованию обнаруживаемых паттернов декодирования тРНК для предсказания считывания кодонов в дрожжах. Мы используем экспериментально определенные считывания кодонов, предсказания на основе последовательностей и ручное курирование. Эти новые сопоставления более точны, чем обычно используемые сопоставления экономии колебаний. Мы не советуем использовать только экономию вобуляции, потому что организмы склонны использовать функционально избыточное широкое распознавание кодонов. Случаи, когда предсказанное отображение антикодон-кодон отклоняется от общепринятых паттернов декодирования, являются интересными целями для дальнейших экспериментов и теоретических исследований.С помощью HMM мы представляем статистически надежный метод определения этих целей.

Конфликт интересов : не объявлен.

Список литературы

.

Нуклеозиды с измененным вобуляционным положением эволюционировали для селекции распознавания кодонов транспортной РНК: гипотеза модифицированного вобуляции

,

Biochimie

,

1991

, vol.

73

(стр.

1345

-

1349

) и др.

расшифровка колебания тРНК генома: 40 лет модификации

,

J.Мол. Биол.

,

2007

, т.

366

(стр.

1

-

13

),. , и другие.

Переносная модификация РНК

,

Escherichia coli и Salmonella. Клеточная и молекулярная биология

,

2005

Вашингтон, округ Колумбия

AMS Press

.

Теория выбора-мутации-дрейфа использования синонимичных кодонов

,

Genetics

,

1991

, vol.

129

(стр.

897

-

907

) и др.

Роль порядка кодонов в динамике трансляции

,

Cell

,

2010

, vol.

141

(стр.

355

-

367

),.

GtRNAdb: база данных генов транспортной РНК, обнаруженных в геномной последовательности

,

Nuc. Acids Res.

,

2009

, т.

37

(стр.

D93

-

D97

).

Спаривание кодонов и антикодонов: гипотеза колебания

,

J. Mol. Биол.

,

1966

, т.

19

(стр.

548

-

555

).

Декодирование с парой колебаний A: I неэффективно

,

Nuc.Acids Res.

,

1995

, т.

23

(стр.

683

-

688

).

Идентификация генов, кодирующих ферменты модификации тРНК, методом сравнительной геномики

,

Методы Enzymol

,

2007

, vol.

425

(стр.

153

-

183

) и др.

Совместное изменение количества тРНК и использования кодонов в Escherichia coli при различных скоростях роста

,

J. Mol. Биол.

,

1996

, т.

260

(стр.

649

-

663

) и др.

Неожиданные корреляции между экспрессией генов и ошибкой использования кодонов из данных микрочипов для всего генома Escherichia coli K-12

,

Nucl. Acids Res.

,

2003

, т.

31

(стр.

6976

-

6985

),.

Стоимость точности определяется ограничением максимальной скорости роста

,

Q. Rev. Biophys.

,

1984

, т.

17

(стр.

45

-

82

) и др.

Выборочная зарядка изоакцепторов тРНК объясняет закономерности использования кодонов

,

Science

,

2003

, vol.

300

(стр.

1718

-

1722

) и др.

Измерения смещения кодонов у дрожжей, индекса спаривания тРНК и возможных механизмов репарации ДНК

,

Algor. Биоинформ. Продолжить.

,

2006

, т.

4175

(стр.

1

-

11

).

Функциональная адаптация популяции тРНК

,

J.Теор. Биол.

,

1974

, т.

43

(стр.

211

-

25

) и др.

Расшифровка синонимичных кодонов в трех сферах жизни: совместная эволюция со специфическими ферментами модификации тРНК

,

FEBS Lett.

,

2010

, т.

584

(стр.

252

-

64

),.

Организация и экспрессия генов тРНК в Saccharomyces cerevisiae

,

Молекулярная биология дрожжевых Saccharomyces: метаболизм и экспрессия генов

,

1982

, vol.

, том 11B

Колд-Спринг-Харбор, Нью-Йорк

Лаборатория Колд-Спринг-Харбор

(стр.

487

-

528

),.

Синтез аминоацил-тРНК

,

Annu. Rev. Biochem.

,

2000

, т.

69

(стр.

617

-

650

).

Корреляция между количеством РНК-переносчиков Escherichia coli и наличием соответствующих кодонов в его белковых генах

,

J. Mol. Биол.

,

1981

, т.

146

(стр.

1

-

21

) и др.

Полногеномный анализ трансляции in vivo с разрешением нуклеотидов с использованием профилирования рибосом

,

Science

,

2009

, vol.

324

(стр.

218

-

223

) и др.

Модификации уридина эукариотического колебания способствуют функционально избыточной системе декодирования

,

Mol. Cell Biol.

,

2008

, т.

28

(стр.

3301

-

3312

) и др.

Временное бездействие посттерминационных рибосом, готовых к возобновлению синтеза белка

,

Biochimie

,

2004

, vol.

86

(стр.

933

-

938

) и др.

Геномы ансамбля: расширение ансамбля по таксономическому пространству

,

Nucl. Acids Res.

,

2010

, т.

38

(стр.

D563

-

D569

),.

Частота ошибок неправильного считывания трансляции в E. coli во многом определяется конкуренцией тРНК

,

РНК

,

2007

, vol.

13

(стр.

87

-

96

) и др.

Цикл тРНК и его связь со скоростью синтеза белка

,

Eur. Biophys J.

,

1985

, т.

12

(стр.

115

-

119

),.

tRNAscan-SE: программа для улучшенного обнаружения генов транспортной РНК в геномной последовательности

,

Nucl. Acids Res.

,

1997

, т.

25

(стр.

955

-

64

) и др.

Распознавание кодонов-актикодонов в семействе кодонов валина

,

J.Биол. Chem.

,

1977

, т.

252

(стр.

471

-

478

) и др.

Разработка генетического кода: выводы из переназначения грибкового кодона

,

FEBS Lett.

,

2010

, т.

584

(стр.

334

-

341

) и др.

Роль модификаций в распознавании кодонов тРНК (Lys) UUU

,

Nat. Struct. Мол. Биол.

,

2004

, т.

11

(стр.

1186

-

1191

) и др.

Пересмотр гипотезы колебания: уридин-5-оксиуксусная кислота имеет решающее значение для считывания кодонов на конце G

,

РНК

,

2007

, vol.

13

(стр.

2151

-

2164

),.

Структурное понимание верности перевода

,

Annu. Rev. Biochem.

,

2005

, т.

74

(стр.

129

-

177

).

Ошибки и альтернативы при чтении универсального генетического кода

,

Microbiol.Ред.

,

1989

, т.

53

(стр.

273

-

98

) и др.

Избыточность гена транспортной РНК и трансляционный отбор у Saccharomyces cerevisiae

,

J. Mol. Биол.

,

1997

, т.

268

(стр.

322

-

330

).

Ограниченные правила колебания для геномов эукариот

,

Trends. Genet.

,

2001

, т.

17

(стр.

133

-

135

),.

Синонимы, но не одно и то же: причины и последствия смещения кодонов

,

Нат.Преподобный Жене.

,

2011

, т.

12

(стр.

32

-

42

) и др.

Сбалансированное использование кодонов оптимизирует эффективность трансляции эукариот

,

PLoS Genet.

,

2012

, т.

8

стр.

e1002603

.

Учебное пособие по скрытым, марковским моделям и избранным приложениям в распознавании речи

,

Proc. IEEE

,

1989

, т.

77

(стр.

267

-

296

),.

Влияние взаимодействий антикодон-кодон и модифицированных оснований на предвзятость использования кодонов у бактерий

,

Мол. Биол. Evol.

,

2010

, т.

27

(стр.

2129

-

2140

).

Распознавание тРНК аминоацил-тРНК синтетазами

,

Prog. Nucl. Acid Res. Мол. Биол.

,

1991

, т.

41

(стр.

23

-

87

).

Точность аминоацилирования - обеспечение верности генетического кода

,

Experientia

,

1990

, vol.

46

(стр.

1089

-

1096

) и др.

Сверхэкспрессия изоакцептора тРНК (Leu) изменяет характер зарядки лейциновых тРНК и выявляет новое считывание кодонов

,

J. Mol. Биол.

,

2005

, т.

354

(стр.

16

-

24

) и др.

Распознавание кодонов UUN двумя видами лейциновой тРНК из Escherichia coli

,

FEBS Lett.

,

1994

, т.

344

(стр.

31

-

34

) и др.

Эволюционно консервативный механизм управления эффективностью трансляции белков

,

Cell

,

2010

, vol.

141

(стр.

344

-

354

),. ,.

Модифицированные нуклеозиды и распознавание кодонов

,

тРНК: структура, биосинтез и функция

,

1995

Вашингтон, округ Колумбия

Американское общество микробиологии

(стр.

207

-

223

)

© Автор (ы) (2012).Опубликовано Oxford University Press.

Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License (http://creativecommons.org/licenses/by/3.0), которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии, что оригинал работа правильно процитирована.

кодон-триплетный контекст раскрывает уникальные особенности генома, кодирующего белок Candida albicans | BMC Genomics

Инструменты для изучения триплетов кодонов

Мы реализовали вычислительные алгоритмы и средства хранения данных для сравнительной геномики анализа триплетов кодонов в геномах грибов (рис. 1).Разработанный алгоритм имитирует рибосому во время декодирования, считывая открытые рамки считывания (ORF) из инициирующего кодона ATG и перемещая окно считывания на три нуклеотида за раз, пока не встретится стоп-кодон. При этом он запоминает все триплеты кодонов, которые представляют кодоны A-, P- и E-сайтов во время декодирования мРНК. В этом исследовании подсчет триплетов выполнялся на полных наборах ORF (ORFeomes), которые изначально были отфильтрованы для устранения аберрантных ORF, лишенных инициации ATG или стоп-кодонов TAG / TGA / TAA, или содержащих преждевременные стоп-кодоны или неоднозначные основания (N).Первый и последний триплеты каждой ORF не рассматривались, чтобы избежать контекстных эффектов инициации и завершения трансляции [17, 18].

Рисунок 1

Схематическое изображение биоинформатической системы . Последовательности генов были загружены из баз данных генома (таблица 1) и отфильтрованы в локальную базу данных для исключения ложных открытых рамок чтения. Затем последовательности обрабатывали путем подсчета всех триплетов кодонов, исключая первый и последний из каждой ORF, которые имеют определенные контексты инициации и завершения трансляции.Эти данные были перенесены в 3-мерную матрицу 61 × 61 × 61 и сохранены в виде файла базы данных Microsoft Access. Обработанные данные затем анализировались с помощью инструментов интеллектуального анализа данных Weka-3 [19] и прямых запросов к базе данных. Эта методология позволила нам обрабатывать очень большие наборы данных и выявлять различия в кодон-триплетном контексте между видами грибов. Наконец, эти различия были подвергнуты статистическому анализу.

Поскольку анализ триплетов кодонов генерирует 3-мерную матрицу 61 × 61 × 61 для каждого ORFeome, мы использовали реляционную базу данных для хранения обработанных данных (рисунок 1).Затем эти большие наборы данных были проанализированы с помощью инструментов интеллектуального анализа данных [19] и прямых запросов к базе данных. Эти исследования были направлены на выявление основных различий в контексте триплет-кодонов между ORFeome грибов, хранящимися в основной базе данных (Таблица 1). Аналогичную методологию использовали для подсчета триплетов аминокислот, генерируемых из одних и тех же последовательностей ORFeome. Для этого кодоны транслировали в соответствующие аминокислоты с использованием стандартных правил генетического кода или с использованием нестандартного декодирования кодонов лейцин-CTG как серина в Candida albicans и Debaryomyces hansenii [20–22].Наконец, были реализованы новые алгоритмы для подсчета повторений кодонов и аминокислот в широком масштабе ORFeome. Все полученные результаты сравнивали со значениями, ожидаемыми для случайного распределения кодонов, которые были рассчитаны с учетом частот случайного распределения отдельных кодонов или аминокислот в геномах.

Кодон-триплеты в грибковых геномах

Описанные выше инструменты позволили провести сравнительный анализ кодон-триплетов в 11 ORFeomes грибов (Таблица 1).Четкие шаблоны предпочтений и отклонений триплетов кодонов были идентифицированы для каждого ORFeome, и, что касается контекстов пар кодонов [4], такие шаблоны были специфичными для каждого ORFeome (таблицы 2 и 3 и дополнительный файл 1, рисунок S1). Этот первый анализ также показал, что процент триплетов кодонов, которые исчезли из ORFeomes, был намного выше, чем ожидалось из случайного распределения триплетов в этих ORFeomes (Рисунок 2A). Процент исчезнувших триплетов кодонов варьировал от 8 до 11% у большинства ORFeome грибов, но был значительно ниже у Aspergillus fumigatus (0.5%), Eremothecium gossypii (2,9%) и Saccharomyces mikatae (1,6%). Патоген человека Candida albicans имел более высокий процент таких триплетов (16,5%), и эти исчезнувшие триплеты кодонов отражались также на уровне аминокислот, поскольку C. albicans был единственным видом, у которого триплет аминокислот, а именно Trp -Мет-Трп, отсутствовал. И наоборот, анализ 10 наиболее часто встречающихся триплетов кодонов (рис. 2B) показал равномерное распределение в этих ORFeome грибов за исключением C.albicans , где процент этих многочисленных троек увеличился более чем в 2 раза (0,45%). В целом, в C. albicans наблюдалось явное чрезмерное представительство подмножества триплетов кодонов, а именно (CAA-CAA-CAA), (GAA-GAA-GAA), (AAT-AAT-AAT) или (GAT -GAT-GAT) (Таблица 2) и сильная репрессия другого подмножества, а именно (GAA-AAA-AAA), (AAA-AAA-AAT), (AAA-AAA-AAA) или (TTA-AAA-AAA) (Таблица 3), что указывает на более высокую систематическую ошибку использования триплетов кодонов в этом патогене человека (дополнительный файл 1, рисунок S1).

Таблица 2 Рейтинг 10 наиболее предпочтительных триплетов кодонов в ORFeomes грибов Таблица 3 Рейтинг 10 наиболее отклоняемых триплетов кодонов в ORfeomes грибов Рисунок 2

Основные различия в контекстах триплетов кодонов в геномах грибов . Чтобы охарактеризовать распределение триплетов кодонов у 11 изученных видов грибов, мы рассчитали процент триплетов кодонов, которые не появлялись в ORFeome грибов (панель A). Кроме того, также была определена фракция, соответствующая 10 наиболее частым триплетам кодонов (панель B).В обоих случаях C. albicans показали более сильную систематическую ошибку в распределении кодонов-триплетов, чем другие виды. Столбцы представляют наблюдаемые проценты, а синие точки указывают значения, ожидаемые от случайного распределения триплетов кодонов.

Поскольку выбор триплета кодонов был специфической особенностью ORFeome, которая могла влиять на эффективность декодирования мРНК (см. Выше), более сильное смещение, обнаруженное у C. albicans , вызвало вопрос о том, может ли он быть связан с трансляцией мРНК. Чтобы пролить новый свет на этот вопрос, смещение использования кодонов и количество копий гена тРНК, которое обеспечивает прямое указание уровня экспрессии тРНК, были определены по шкале ORFeome для всех проанализированных ORFeomes (Таблица 4).В C. albicans было меньше генов тРНК (131), но общее количество кодонов было вторым по величине (2 939 109) в наборе ORFeomes. Следовательно, относительное количество тРНК (определяемое числом копий гена) на кодон (или на аминокислоту) было ниже у C. albicans , чем у других грибов (Рисунок 3). Например, ген тРНК Asn имел 4 копии у C. albicans и от 4 до 10 копий у других видов, но общее количество кодонов Asn было наибольшим у C.albicans (общее количество кодонов Asn = 201 917) (данные не показаны). Чтобы определить, является ли это относительное уменьшение числа копий гена тРНК несбалансированным количеством тРНК и использованием кодонов, мы вычислили значения относительного использования синонимичных кодонов (RSCU) для всего набора кодонов (дополнительный файл 2, таблица S1), а также относительные значения использования синонимичных кодонов. Значения использования изоакцепторов тРНК (RIU). Последнее эквивалентно значениям RSCU [23], но, поскольку оно было рассчитано с использованием числа копий гена тРНК, оно дает информацию о смещении изобилия тРНК.То есть разные значения RIU в группе изоакцепторов указывают на различия в клеточных уровнях этих тРНК. Ограничив отношение RSCU / RIU парами родственных кодонов и родственных тРНК, мы смогли вычислить коэффициент адаптации декодирования (DAQ = RSCU / RIU) путем усреднения отношений, полученных для каждой пары кодон / тРНК (см. Методы). Значения DAQ, близкие к 1, показывают, что использование кодонов и число копий гена тРНК (количество тРНК) хорошо согласованы (высокая корреляция), как и в случае A.fumigatus , C. glabrata , E. gossypii , K. lactis , S. paradoxus или S. pombe (дополнительный файл 1, рисунок S2). Организмы с DAQ >> 1 часто использовали редкие тРНК для декодирования часто используемых кодонов, как это было в случае D. hansenii , S. bayanus , S. cerevisiae или S. mikatae . Интересно, что C. albicans вызвало самое низкое значение DAQ (0,841) среди всех изученных грибов (дополнительный файл 1, рисунок S2), что указывает на то, что этот грибковый патоген предпочитает кодоны, которые декодируются близкими, а не родственными тРНК.Расхождение в предпочтениях декодирования между C. albicans и другими грибами может быть четко проиллюстрировано для кодонов Asn (AAC и AAU). Все проанализированные грибы декодируют оба кодона с использованием одной тРНК (тРНК GUU Asn ) и обычно предпочитают родственный кодон AAC, однако C. albicans имеет сильное предпочтение кодонов AAU (RSCU = 1,435) перед AAC (RSCU = 0,565), (Дополнительный файл 2, Таблица S1). То есть его наиболее часто используемый кодон Asn декодируется почти родственной тРНК (тРНК Asn GUU ).Это предпочтение декодирования близких родственников также наблюдалось для кодонов, соответствующих аминокислотам His ( CAC , CAU ), Asp ( GAC , GAU ), Gly ( GGA , GGC , GGG, GGU ), Tyr ( UAC , UAU ), Cys ( UGC , UGU ) и Phe ( UUC , UUU ), где предпочтительные кодоны в C. albicans (подчеркнуты выше) не имеют родственных тРНК (кодоны с родственными тРНК выделены жирным шрифтом).

Таблица 4 Число копий гена тРНК против общего числа кодонов у грибов Рисунок 3

Относительное число копий гена тРНК ниже у C. albicans , чем у других грибов . Число копий гена тРНК определяли для каждого изоакцептора тРНК с помощью tRNAscan-SE [40], и количество копий гена каждой группы изоакцепторов суммировали и делили на количество раз, когда соответствующая аминокислота присутствовала в каждом ORFeome.Для проведения сравнения ORFeomes данные, полученные для отдельных аминокислот, усредняли в одной колонке для каждого организма. Значения представлены как количество копий гена тРНК на 100 000 родственных аминокислот. A. fumigatus и C. albicans имеют самое низкое число копий гена тРНК (количество тРНК) на а.о., а C. bayanus и S. mikatae - самое высокое.

Относительно низкое количество генов тРНК в C. albicans предполагает, что либо C.albicans регулирует экспрессию определенных тРНК через еще неизвестные цис-действующие элементы и использует новые активаторы транскрипции polIII (то есть количество копий гена тРНК не указывает на доступность тРНК), или его механизм трансляции мРНК работает в условиях ограничения тРНК. Чтобы прояснить эти важные моменты, мы просканировали 5'-вышестоящие последовательности генов тРНК C. albicans и провели поиск консервативных элементов, которые могли бы объяснить повышающую регуляцию тРНК с помощью транскрипционного аппарата polIII.Однако нам не удалось идентифицировать такие предполагаемые консервативные энхансеры polIII (данные не показаны). Следовательно, остается интригующая возможность, что ограничение тРНК и обобщенное декодирование близких родственников может быть еще одной уникальной особенностью трансляционного аппарата C. albicans . Это может объяснить сильное смещение использования кодонов-триплетов C. albicans , поскольку, в отличие от других видов, C. albicans максимизирует использование небольшого подмножества тРНК для декодирования сильно смещенных кодонов, присутствующих в триплетах.Этот загадочный результат требует экспериментального подтверждения посредством количественной оценки in vivo тРНК, чтобы уточнить, является ли ограничение тРНК особенностью трансляционного аппарата C. albicans и, что более важно, увеличивает ли такая предполагаемая ограниченная доступность тРНК ошибку декодирования [17, 24, 25]. Недавно мы обнаружили, что неоднозначное декодирование переназначенного кодона CUG (серин + лейцин) генерирует фенотипическое разнообразие у этого человеческого патогена [26, 27], и будет наиболее интересно выяснить, действительно ли C.albicans использует обобщенный неправильный перевод как стратегию выявления скрытого фенотипического разнообразия. Наконец, мы не можем исключить, что смещения триплетов кодонов возникают из-за ограничений первичной структуры белка. Действительно, наше исследование изменения генетического кода у C. albicans поддерживает эту гипотезу (см. Ниже). Однако трипептидные смещения были бы актуальны для этого исследования, только если бы они значительно различались у C. albicans , а этого не наблюдалось. Вернее, основные отличия C.albicans и другие виды были связаны с ограниченным подмножеством контекстов с повторяющимися кодонами и аминокислотами в последовательных положениях (см. ниже).

Строки повторяющихся кодонов

Высокая частота повторяющихся кодонов и аминокислот в ORFeome грибов и высокий процент триплетов идентичных кодонов и аминокислот в C. albicans (Рисунок 4A, B) побудили нас выполнить более подробный анализ кодонного состава таких повторов. Для этого определяли распределение изолированных кодонов, идентичных пар кодонов, идентичных триплетов кодонов и идентичных цепочек кодонов (Фиг.5).Изолированные кодоны были недостаточно представлены во всех ORFeomes, в частности, в C. albicans (фиг. 5A). Однако этот эффект был минимизирован в парах идентичных кодонов, где наблюдаемые и ожидаемые (случайное распределение) значения были аналогичными (рис. 5B). В C. albicans сильное недопредставление изолированных кодонов не было заметно в идентичных парах кодонов (рис. 5B), и это смещение было обращено на противоположное и резко увеличивалось для повторений идентичных триплетов кодонов и идентичных цепочек кодонов (рис. 5В, Г).Действительно, распределение последних заметно различается между C. albicans и другими ORFeomes (рис. 5D).

Рисунок 4

Большое количество повторений идентичных кодонов и аминокислот в C. albicans . Определяли процент ORFeomes, состоящих из идентичных триплетов кодонов. Процент этих триплетов (панель A) и их соответствующих аминокислот (панель B) был намного выше у C. albicans , чем у других видов, что указывает на сильное смещение в распределении повторяющихся кодонов в его ORFeome (красные столбцы ).Полосы представляют наблюдаемые проценты, а синие точки указывают ожидаемые значения.

Рисунок 5

Низкая частота изолированных (неповторяющихся) кодонов в C. albicans . Поскольку повторы кодонов были очень часты у C. albicans , а также у других видов, мы вычислили раздельную долю кодонов, которые оказались изолированными или в идентичных парах кодонов, тройках или более длинных цепочках. C. albicans имеет более низкую частоту изолированных кодонов (неповторяющиеся идентичные кодоны), чем у других видов, хотя общая репрессия изолированных кодонов наблюдается у всех видов (панель A).Это смещение было обращено для повторения 2 или более идентичных кодонов, что снова усугублялось у C. albicans (красная полоса; панели B-D).

Затем мы проанализировали аминокислотный состав повторяющихся триплетов кодонов и снова наблюдали сильные смещения (рис. 6). В большинстве повторений участвовали аминокислоты Gln, Asp, Glu, Asn и Ser, что подтверждает предыдущие наблюдения на S. cerevisiae и более высоких эукариотах [28, 29]. Повторы аминокислот Ala, Pro, His, Thr, Gly, Lys и Arg имели промежуточное представление, в то время как аминокислоты Val, Phe Ile и Leu часто были недостаточно представлены, а в некоторых ORFeomes повторы Tyr, Cys, Met и Trp отсутствовали. или редко используется (Рисунок 6).Из всех аминокислот Gln встречается чаще и также редко присутствует в виде изолированной аминокислоты во всех ORFeomes (синие столбцы, первый столбец на фиг. 6). Еще раз, C. albicans продемонстрировали более сильную систематическую ошибку для повторов аминокислот, поскольку количество повторов Gln, Asp, Glu, Asn и Ser было выше, чем в других ORFeomes, в то время как повторы Pro, His и Thr были нечастыми. в других геномах часто встречались в геноме C. albicans (рис. 6).

Рисунок 6

Специфичность аминокислотных повторов .Вырожденность генетического кода побудила нас определить, дадут ли аминокислотные повторы лучшее представление о частоте повторяющихся функций в ORFeomes грибов. Для этого повторы были количественно определены и отображены, как показано. На диаграмме и для каждого вида первая строка в каждом столбце сверху соответствует случаям, в которых аминокислота оказалась изолированной в ORF. Вторая линия соответствует изолированным парам идентичных аминокислот и так далее, так что для каждого столбца большее количество строк соответствует более длинным цепочкам аминокислот.Как и ожидалось, аминокислотные повторы были смещены, на что указывает цветовая шкала, использованная на карте, где голубой цвет соответствует подавленным повторам, а коричневый цвет указывает на предпочтительные повторы. Желтый представляет собой повторы, наблюдаемые и ожидаемые частоты которых совпадают. Аминокислотные повторы были аминокислотно-специфичными. Например, Gln, Asp, Glu, Asn или Ser (первая группа слева) формировали длинные строки чаще, чем ожидалось (коричневый цвет), тогда как строки Phe, Ile и Leu подавлялись во всех ORFeome (синие столбцы). C. albicans имел самые длинные цепочки почти всех аминокислот, в частности Asn, Pro, His и Thr (выделены серым в верхней части диаграммы).

Наконец, было проанализировано распределение вышеуказанных повторов для синонимичных кодонов каждой аминокислоты (дополнительный файл 1, рисунки S3A, B). Из наиболее частых аминокислотных повторов Gln использовал кодоны CAA в основном во всех, кроме A. fumigatus . В цепочках Asn часто используются кодоны AAC, но некоторые ORFeomes предпочитают кодоны AAT (дополнительный файл 1, рисунок S3A).Из 6 кодонов серина наиболее часто использовались AGT, TCA и TCT, в то время как повторы Thr использовали ACA или ACT, но редко кодоны ACC или ACG. Несколько наблюдаемых повторений Lys использовали кодоны AAG почти исключительно и подавляли кодоны AAA, эффект, который может быть связан с сильной репрессией гомополимерных цепочек, поскольку повторы кодонов CCC, GGG и TTT также сильно подавлялись (дополнительный файл 1, рисунок S3B).

Состав триплетов кодонов, исчезнувших из ORFeomes

Высокая доля триплетов, исчезнувших из ORFeomes грибов (рис. 2A), побудила нас исследовать, можно ли идентифицировать определенные тенденции кодон-контекста, которые могли бы объяснить репрессию определенных комбинаций кодонов.Для этого определяли кодонный состав триплетов, отсутствующих в каждом ORFeome, в 3 различных положениях кодонов (XXX-YYY-ZZZ). Не удалось обнаружить значительных различий между ORFeomes или положениями кодонов, и результаты, полученные с кодонами, начинающимися с любого основания (N), были избыточными (данные не показаны). Чтобы преодолеть этот эффект и выделить основные эффекты, были усреднены только данные. Стал очевидным четко определенный образец предпочтений и отторжений, связанных со вторым и третьим основаниями кодонов в отсутствующих триплетах кодонов (Рисунок 7).Это указывало на то, что первое основание кодона и положение кодона в триплете не способствовали исчезновению триплета. И наоборот, кодоны, оканчивающиеся двумя аденозинами (NAA), показали плохую ассоциацию с отсутствующими триплетами, в то время как NCC, NCG или NGN были сильно связаны с репрессированными триплетами кодонов (Рисунок 7).

Рисунок 7

Смещение триплетов кодонов, которое исчезло из ORFeomes . Число возможных комбинаций кодон-триплет, которые не присутствовали в ORFeome грибов, было неожиданно высоким.Чтобы выяснить, почему эти триплеты исчезли из ORFeomes, соответствующие кодоны были дополнительно изучены, а именно путем подсчета количества раз, когда каждый кодон появлялся в первом, втором или третьем положении триплетов. Существенных различий между видами и положениями кодонов-триплетов не обнаружено. Кроме того, первая база всех кодонов дала избыточные результаты. Поэтому значения для всех ORFeomes, положений триплетов, а также для всех кодонов, начинающихся с A, C, G или T, усредняли.Кодоны NCC, NCG и NGN были наиболее частыми кодонами в триплетах кодонов, которые отсутствовали в ORFeome грибов (красные столбцы на панели B). Напротив, кодоны NAA были недостаточно представлены в этой группе (желтая полоса).

Как и раньше, переназначение CTG в C. albicans и D. hansenii побудило нас исследовать, вызывает ли необычное декодирование кодонов CTG исчезновение триплетов кодонов. Для этого были изучены отсутствующие триплеты, содержащие кодоны CTN, то есть CTA, CTC, CTG или CTT (дополнительный файл 1, рисунок S4).У каждого вида были свои предпочтения. Кодон CTA отсутствовал в основном в триплетах A. fumigatus , CTC у C. glabrata и Saccharomyces sp. и CTT в E. gossypii . Примечательно, что кодоны CTG были наиболее частыми кодонами CTN в триплетах кодонов, которые исчезли из ORFeome C. albicans и D. hansenii ORFeomes (дополнительный файл 1, рисунок S4A). Более того, у D. hansenii количество триплетов кодонов, исчезнувших только из этого ORFeome и лишенных CTG, было в два раза выше, чем у других грибов, включая C.albicans (дополнительный файл 1, рисунок S4B).

Сигнатура изменения генетического кода

В C. albicans и D. hansenii лейциновые CTG-кодоны декодируются как сериновые [20–22]. Это изменение генетического кода появилось примерно 272 ± 25 миллионов лет назад у предка дрожжей и перепрограммировало более 30 000 CTG, присутствующих в его генах [30]. Такое драматическое генетическое событие оказало отрицательное давление на использование CTG и устранило большинство этих кодонов. Интересно, что большое количество «старых» лейцин-CTG было заменено «новыми» сериновыми-CTG, которые возникли в результате мутации сериновых, а не лейциновых кодонов [30].Другими словами, CTG, существующие в ORFeomes C. albicans и D. hansenii , представляют собой новые сериновые кодоны, появившиеся за последние 272 ± 25 миллионов лет. Поскольку сериновые кодоны часто присутствуют в повторах кодонов, в то время как кодоны лейцина сильно подавлены (рис. 6), мы воспользовались этим изменением генетического кода, чтобы пролить новый свет на эволюционную динамику повторов кодонов (аминокислот) у дрожжей. Кроме того, поскольку лейцин гидрофобен, а серин полярен, мы предположили, что ограничения, налагаемые структурой белка, будут видны как изменения в контексте CTG-содержащих триплетов.

Контексты типов NNN-Leu-NNN и NNN-Ser-NNN были идентифицированы в наборе ORFeomes, и значения были отображены таким образом, что восходящие и нисходящие отклоненные и предпочтительные соседние кодоны могли быть выделены (рис. 8). Это было выполнено путем определения комбинаций соседних кодонов (выше и ниже по течению), которые были предпочтительны в триплетах, несущих лейцин или серин (сигнатуры соседних лейцинов и серинов), и вычисления количества раз, когда каждая сигнатура появляется выше ожидаемого порога, когда средний кодон триплета был CTG (фигура 8A).Как и ожидалось, лейцин и серин имели четкие предпочтения по соседству, но эта контекстная сигнатура была потеряна для CTG в C. albicans и D. hansenii (синие прямоугольники, фиг. 8A), которые декодируют кодоны лейцин-CTG как серин. У этих видов CTG имели сигнатуру, которая не наблюдалась для кодонов лейцин-CTA или серин-TCA, используемых в качестве внешнего контроля (рис. 8B, 8C).

Рисунок 8

Аминокислотные контекстные сигнатуры обнаруживают изменения генетического кода . Чтобы определить, могут ли изменения генетического кода привести к определенной триплетной сигнатуре, частота контекстов аминокислот, содержащих лейцин или серин в среднем положении (например,LYS- LEU -ASP / LYS- SER -ASP) были вычтены. Всякий раз, когда эта разница была выше 0,0005 или ниже -0,0005, соответствующий контекст считался смещенным в сторону лейцина или серина соответственно. Эти смещенные окрестности были проверены на кодоны Leu / Ser-CTG, Leu-CTA и Ser-TCA. Ожидаемые значения были рассчитаны для всех контекстов и вычтены из наблюдаемых значений. Чтобы нормализовать систематическую ошибку с общим размером пула для каждого контекста кодона, каждое различие делили на ожидаемое значение [(Obs-Exp) / Exp].Сумма отношений всех районов, предпочтительных по лейцину (желтые столбцы) и по серину (красные столбцы), для каждого ORFeome показала глобальный эффект. Как и ожидалось, кодоны CTG лейцина (панель-A) чаще встречались в контекстах, предпочтительных для лейцина (желтые столбцы), чем в контекстах, предпочтительных для серина (красные столбцы). Однако эта сигнатура была нарушена у C. albicans и D. hansenii (где CTG декодируются как серин, а не лейцин), поскольку CTG были связаны с серином, а не с предпочтительными для лейцина соседями.Эта тенденция не была обнаружена ни в одном другом кодоне лейцина или серина (например, Leu-CTA и Ser-TCA, панели-B и -C, соответственно), что указывает на то, что изменения генетического кода могут быть обнаружены с помощью анализа контекста триплета кодонов.

Биосинтез белка

Биосинтез белка

Биосинтез белка

ДНК

Информация, которая сообщает клетке, как строить белки. потребность выжить закодирована в структуре ДНК в ядро этой клетки.Этот код не может быть основан на индивидуальном соответствие между нуклеотидами и аминокислотами, потому что есть только четыре нуклеотида и 20 аминокислот, которые необходимо кодировать. Однако если нуклеотиды сгруппированы по три, их будет 64 возможных триплетов, или кодонов , что больше чем достаточно комбинаций для кодирования 20 аминокислот.

Чтобы понять, как производятся белки, мы должны разделить процесс декодирования в два этапа. ДНК хранит только генетические информации, она не участвует в процессе информация используется.Первый шаг в биосинтезе белка поэтому должен включать расшифровку информации в структура ДНК в полезную форму. На отдельном этапе это информация может быть переведена в последовательность аминокислот кислоты.

Транскрипция

Прежде чем информация в ДНК может быть расшифрована, небольшая часть двойной спирали ДНК должна быть развернута.Нить РНК тогда синтезируется, что является дополнительной копией одной цепи ДНК.

Предположим, что скопированный участок ДНК имеет следующая последовательность нуклеотидов, начиная с 3 конца.

3 T-A-C-A-A-G-C-A-G-T-T-G-G-T-C-G-T-G ... 5 ДНК

Когда мы предсказываем последовательность нуклеотидов в РНК дополнение, мы должны помнить, что РНК использует U, где T будет найдено в ДНК.Мы также должны помнить, что происходит спаривание оснований. между двумя цепями, идущими в противоположных направлениях . В РНК-комплемент этой ДНК, следовательно, следует записать как следует.

3 T-A-C-A-A-G-C-A-G-T-T-G-G-T-C-G-T-G ... 5 ДНК
5 A-U-G-U-U-C-G-U-C-A-A-C-C-A-G-C-A-C... 3 мРНК

Поскольку эта цепь РНК содержит сообщение, которое было закодировано в ДНК, она называется информационная РНК или мРНК .

Перевод

Информационная РНК теперь связывается с рибосомой, где сообщение транслируется в последовательность аминокислот.Аминокислоты которые включены в синтезируемый белок: переносятся относительно небольшими молекулами РНК, известными как передача РНК , или тРНК . Есть на не менее 60 тРНК, незначительно различающихся по своей структуре, в каждая ячейка. На одном конце каждой тРНК находится определенная последовательность три нуклеотида, которые могут связываться с информационной РНК. На другой конец - определенная аминокислота. Таким образом, каждый трехнуклеотидный сегмент молекулы информационной РНК кодирует включение определенной аминокислоты.Отношения между триплеты или кодоны мРНК и аминокислот показаны на таблица ниже.

Генетический код

Первая позиция
(5 'конец)
Вторая позиция Третья позиция
(3 'конец)
U С А г
Phe Ser Тир Cys U
U Phe Ser Тир Cys С
лей Ser и и А
лей Ser и Trp G
лей Pro Его Арг U
С лей Pro Его Арг С
лей Pro Gln Арг А
лей Pro Gln Арг G
Иль Thr Asn Ser U
А Иль Thr Asn Ser С
Иль Thr Lys Арг А
Встреча Thr Lys Арг G
Вал Ала Асп Gly U
г Вал Ала Асп Gly С
Вал Ала Glu Gly А
Вал Ала Glu Gly G
a Есть три тройни код терминации полипептидной цепи: UAA, UGA, и UAG.

Практическая задача 4:

Предположим что цепь ДНК, которая кодирует синтез конкретный белок содержит триплет A-G-T (чтение с 3 по 5 конец). Предсказать последовательность нуклеотиды в триплете или кодоне, который будет построен в матричной РНК, построенной на этой матрице ДНК. Затем предскажите аминокислоту, которая будет включена в эта точка в белке.

Нажмите здесь, чтобы проверить ваш ответ на практическую задачу 4

Сигнал к началу создания полипептидной цепи простым, прокариотические клетки - это триплет AUG, который кодирует амино кислотный метионин (Met). Синтез каждого белка в этих клетки поэтому начинаются с остатка Met на N -концевом конец полипептидной цепи.После тРНК, несущей Met связывается со стартовым сигналом на информационной РНК, тРНК, несущей вторая аминокислота связывается со следующим кодоном. Дипептид - это синтезируется при переносе остатка Met из первого тРНК к аминокислоте на второй тРНК. Если описанная ДНК в этом разделе дипептид будет Met-Phe (чтение с терминала N на терминал C аминокислота).

Информационная РНК теперь движется через рибосому, а тРНК несущий третью аминокислоту (Val) связывается со следующим кодоном.В дипептид затем переносится на аминокислоту на этой трети тРНК с образованием трипептида. Эта последовательность шагов продолжается до тех пор, пока встречается один из трех кодонов: UAA, UGA или UAG. Эти кодоны дают сигнал для прекращения синтеза полипептидная цепь, и цепь отщепляется от последней тРНК остаток.

Последовательность ДНК, описанная в этом разделе, дает следующая последовательность аминокислот.

Met-Phe-Val-Asn-Gln-His-...

Этот полипептид не обязательно является активным белком. Все белки в прокариотических клетках при синтезе начинаются с Met, но не все белки сначала Met в их активной форме. это часто необходимо обрезать этот Met после того, как полипептид были синтезированы с получением белка с другим N -концевым аминокислота.

Модификации полипептида часто приходится вносить перед образуется активный белок.Инсулин, например, состоит из две полипептидные цепи, соединенные дисульфидными связями. В теория, можно было бы сделать эти цепочки по одной а затем попробуйте собрать их, чтобы получился окончательный белок. Природа, однако было более тонким. Полипептидная цепь, которая Синтезированный содержит 81 аминокислоту. Все дисульфидные связи, которые будут присутствовать в инсулине, присутствуют в эта цепочка. Белок образуется, когда последовательность из 30 аминокислот вырезан из середины этой полипептидной цепи.


.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *