Стол 15 по певзнеру: Лечебная диета. Стол № 15 по Певзнеру. Меню на неделю. Продукты, рецепты

Содержание

в чем заключается, кому показана, советы

При некоторых тяжелых заболеваниях пациентам назначают лечебную диету со множеством ограничений. Кроме того, после оперативных вмешательств организм находится в ослабленном состоянии. Чтобы постепенно выйти из лечебной диеты и восстановиться после операции, назначают стол № 15. Показаниями к назначению может быть нахождение на стационарном лечении и некоторое время после выписки, исключение составляют заболевания пищеварительной системы, так как для них существует специальная диета.

Общие сведения

Цель диетыпомощь организму в борьбе с заболеванием посредством обеспечения его микроэлементами и полезными веществами, а также одновременное снижение нагрузки. Она рассчитана на пациентов, не имеющих желудочно-кишечных заболеваний.  Стол № 15 выполняет функцию переходного питания. Он облегчает выход из лечебной диеты, отличается разнообразием блюд и в то же время предусматривает ряд ограничений.

Стол № 15 выполняет функцию переходного питания

Рекомендуется питаться четыре раза в день. Способы приготовления пищи не ограничиваются. Характерно повышенное содержание витаминов и отсутствие острых, плохо усваиваемых продуктов. Длительность медицинской диеты № 15 можно не ограничивать.

Белковой пище отводится главная роль, так как именно белок участвует в создании новых клеток. Из 100 г суточной дозы белка 65 г должно относиться к продуктам животного происхождения. Это относится и к жирам: 75 % животного происхождения, 25 % – растительного. Рекомендуются оливковое и льняное масла. Углеводам отводится 500 г в суточном рационе.

Для нормальной работы кишечника в рацион включается достаточное количество клетчатки и кисломолочных продуктов

Соблюдение диеты способствует полноценному питанию, насыщению микроэлементами, восстановлению и укреплению организма. Главное отличие диеты № 15 от обычного питания – сбалансированность.

Показания для диеты № 15

Диета № 15 по Певзнеру

Лечебное питание, разработанное в начале 20 века профессором М. И. Певзнером, до сих пор используется в медицине. Согласно ему, стол № 15 рекомендуется как щадящее питание при заболеваниях, не требующих специального рациона. Разрешается употреблять практически все продукты, исключая жирное, острое и трудно перевариваемое. В результате получается полноценное питание.

Суточный химический состав пищи:

  • белки – 90 г;
  • жиры – 100 г;
  • углеводы – 400 г.

По калорийности рацион не уступает обычному меню и содержит около 2900 ккал

Стол № 15: что можно и что нельзя

Диета достаточно лояльная. В меню входят разнообразные продукты, обеспечивающие нормальную жизнедеятельность организма.

Разрешенные продукты

Разрешаются почти все продукты и блюда, что и в обычном меню. В рацион включаются нежирные сорта мяса, рыба, яйца, овощи, фрукты. Допускается употребление жареных на масле блюд, сало для жарки не используют.

Иногда к основному рациону добавляют отвары и настои трав, витамины.

Запрещенные продукты

Исключается отягощенная животными жирами, острая пища, фастфуды.

При гипертонической болезни применяют разновидность диеты № 15 под названием гипонатриевая. Она предусматривает ограничение количества потребляемой соли: ее сокращают в три раза. Рекомендуется во время приготовления пищу не солить, а немного подсаливать уже во время принятия пищи.

Запрещенные продукты

Диета №15: меню на неделю

Этот вид диеты не предусматривает каких-то особенностей приготовления. Можно использовать обычные рецепты блюд. Даже те небольшие ограничения, которые рекомендует диета, благотворно влияют на самочувствие.

Примерное недельное меню может состоять из следующих блюд:

  1. Перловка, яйцо, борщ, голубцы, овсянка, творог, морковный салат, печенье, чай.
  2. Рисовая каша, грибной суп, пшеничная каша, котлеты из мяса, рыба, картофельное пюре, салат из овощей, печенье, компот.
  3. Овсянка, щи с говядиной, макароны, куриные биточки, овощное рагу, отбивная, кисель.
  4. Манная каша, гороховый суп, картофель, запеченный с мясом, кабачки, куриная котлета, отвар шиповника.
  5. Гречка с молоком, бутерброд с маслом, куриный суп-лапша, пшеничная каша, тефтели, омлет, творог, печенье, сок.
  6. Молочный суп, бутерброд с сыром, рассольник, рис с подливкой, винегрет, куриное суфле, чай.
  7. Пшеничная каша, гороховый суп, сухарики, картофельное пюре, куриная грудка, салат мясной, печенье, компот.

В качестве перекусов можно использовать фрукты и овощи, перед сном выпивать стакан кефира, ряженки или йогурта

Отзывы пациентов свидетельствуют о том, что эта разновидность диеты не сильно отличается от привычного рациона, поэтому соблюдать ее не сложно.

Стол № 15

Правильно подобранное меню способствует выздоровлению, усиливая эффект терапевтических назначений. Следует помнить, что любую диету должен назначить врач в соответствии с состоянием пациента.

Диета Номер 15 Общий Стол По Певзнеру – Telegraph


➡➡➡ ПОДРОБНЕЕ ЖМИТЕ ЗДЕСЬ!

Диета Номер 15 Общий Стол По Певзнеру
Диета стол 15 по Певзнеру – это последняя диета в списке номерных лечебных столов Певзнера, которая не привязана к какой-либо группе болезней. Она предназначена для взрослых и детей с исправно работающей пищеварительной системой и с заболеваниями на стадии выздоровления.
Дорогие читатели, приглашаем ПОДПИСАТЬСЯ НА НАШ НОВЫЙ КАНАЛ о похудении и здоровом образе жизни. Полезные материалы будут выходить несколько раз в неделю!
Практически все лечебные столы довольно жесткие и имеют много ограничений, поэтому перед переходом к своему обыденному питанию необходим так называемый «выход» из диеты. Для этих целей разработан диетический стол № 15.  Оздоровительно-профилактическое питание нацелено:
Диета 15 по Певзнеру имеет такую же энергетическую ценность, как и физиологически полноценный рацион здорового человека с минимальной физической активностью – 2700–3100 калорий.
В сутки можно употреблять до 12–15 грамм поваренной соли.
Общий объем свободной жидкости – 1,5–2 литра.
Диета № 15 разрешает питаться с минимумом ограничений. В меню можно включать практически все продукты, используемые на общем столе:
Во время диеты № 15 по Певзнеру нельзя употреблять наиболее трудно перевариваемые (жирные сорта мяса и тугоплавкие жиры) и острые (горчицу, перец, хрен) продукты. Также стоит «держаться подальше» от фаст-фуда, полуфабрикатов, сладких газированных напитков.
Какого-то конкретного рациона диеты 15 не существует. Каждый выбирает сам, что ему есть, опираясь на вкусовые предпочтения. Главное, «вписываться» в энергетический баланс и химический состав диеты, а также не злоупотреблять запрещенными продуктами.
Для лучшего пищеварения перед сном можно выпивать стакан кефира.
Стол № 15 предельно повышает количество витаминов, которые участвуют во всех биохимических процессах организма и укрепляют иммунитет. В ежедневном рационе должны присутствовать свежие овощи, фрукты и зелень.
Диета № 15 для детей ничем не отличается от лечебного питания взрослых: ребенок также должен питаться дробно (5–6 раз в день) и разнообразно. Из списка разрешенных продуктов можно составить полезное, питательное и, что самое главное для детей, вкусное меню.
Рацион малыша должен состоять из каш, молочных продуктов, овощей, фруктов, яиц, мяса и рыбы.
И если взрослым диета иногда существенно ограничивает употребление продуктов, отвечающих их вкусовым пристрастиям к острому, соленому и жирному, то для детей последний номерной стол Певзнера – обыденный рацион. У юных пациентов не будет проблем с его соблюдением.
Детское меню на день выглядит следующим образом:
Стол № 15 разрешает все виды термической обработки: варку, тушение, запекание, жарку. Однако жареными блюдами злоупотреблять не стоит, лучше, если они будут появляться в меню не чаще 2–3 раз в неделю.
Кабачки натереть на терке и оставить на 7–10 минут, чтобы они пустили сок. После хорошо отжимаем овощи от выделившейся жидкости, добавляем к ним порезанную кубиками курицу, яйца, муку, разрыхлитель, мелко нарубленную зелень и соль. Все тщательно перемешиваем, разлаживаем тесто по формочкам и отправляем в духовку на 20–30 минут. На стол кексы подаются остывшие.
Диета № 15 по Певзнеру практически полностью отвечает нормам питания здоровых людей.
Стол быстро восстановит организм, и повысит иммунитет. Такого питания можно придерживаться не только после перенесенных болезней, оно идеально подойдет в качестве ежедневного меню.
Экспертом в области питания и похудения. Занимаюсь лечением ожирения, а также даю рекомендации пациентам по вопросам правильного питания, ведения здорового образа жизни.

Диета стол № 15 по Певзнеру
Лечебная диета №15: назначение, меню, отзывы | Food and Health
Лечебные столы (диеты ) № 1-15 по Певзнеру… | Кронколит
Стол № 15 | vnarkoze.ru | Диета «Стол № 15 » по Певзнеру
Диета номер 15 или общий стол при различных заболеваниях
Похудение За Неделю На 10
Диета 5 10 Кг
Упражнения Убрать Живот И Подтянуть Попу
Диета 45 Диет Формула Отзывы
Диета На Гречке 10 Дней Отзывы

Диета «Стол №5» по Певзнеру / Блог / Клиника ЭКСПЕРТ

Хлебные изделия

Пшеничный хлеб из муки 1-го и 2-го сорта, ржаной хлеб из сеяной и обдирной муки вчерашней выпечки или подсушенный, несдобное печенье.

Свежий хлеб, слоёное и сдобное тесто, жареные пирожки.

Молоко и молочные продукты

Нежирное молоко, свежая простокваша, кефир, творог (полужирный или нежирный) до 200 г в день. В небольшом количестве разрешается неострый, нежирный сыр.

Молоко 6%-ной жирности, сливки, ряженка, сметана, жирный творог, солёный, жирный сыр.

Супы

Вегетарианские супы с протёртыми овощами, супы-пюре и кремы, молочные супы пополам с водой. Допускаются первые блюда с хорошо разваренной крупой (рис, овсяная крупа) и мелко шинкованным картофелем, морковью, тыквой.

Мясные, рыбные и грибные бульоны, окрошка, солёные щи.

Мясо и мясные блюда

Нежирные сорта мяса без сухожилий и фасций, например, говядина, телятина, кролик, курица, индейка. Из мяса обязательно удаляются сухожилия и жир, а птица употребляется без кожи. Рекомендуется готовить котлеты на пару из нежирного фарша.

Жирные сорта мяса, утка, гусь, печень, почки, мозги, копчёности, большинство колбас и все мясные консервы.

Рыба и рыбные блюда

Нежирные сорта рыбы – отварная, паровая или в виде котлет.

Жирные сорта рыбы, копчёную и солёную рыбы, рыбные консервы.

Крупы и макаронные изделия

Рисовая, гречневая, овсяная крупа приготовленная в виде каши на молоке пополам с водой с хорошо разваренной крупой. Также допускаются отварные макаронные изделия.

 

Овощи

Картофель, морковь, свекла, цветная капуста, зелень. Овощи готовят протёртые, в отварном, паровом виде (пюре, суфле и др.) и сырые.

Шпинат, щавель, редис, редька, зелёный лук, чеснок, грибы, все бобовые, маринованные овощи.

Яйца и блюда из яиц

Белковые паровые и запечённые омлеты. При приготовлении омлета рекомендуют использовать ½-1 желток и 1-2 белков.

Яйца сваренные вкрутую и жареные. При желчекаменной болезни – до ½ желтка в день в блюда.

Жиры

Сливочное масло в ограниченном количестве (в чистом виде 10-20 г в день). При переносимости в блюда можно включать свежие рафинированные растительные масла (20-30 г в день).

Свиное, говяжье, баранье сало, кулинарные жиры.

Закуски

Салаты из свежих овощей с растительным маслом, фруктовые салаты, винегреты, кабачковая икра, заливная рыба (после отваривания), вымоченная, нежирная сельдь, фаршированная рыба, салаты из морепродуктов, отварной рыбы и мяса, докторская, молочная, диетическая колбаса, нежирная ветчина, неострый, нежирный сыр.

Острые и жирные закуски, икра, копчёности, консервы.

Ягоды и фрукты

Спелые, мягкие, сладкие фрукты и ягоды (кроме кислых сортов) в сыром натуральном или протёртом виде, запечённые, варёные. Также готовят кисели, желе, муссы. Сухофрукты употребляют протёртые.

Кислые сорта фруктов и ягод.

Сладости

Сахар, мёд, варенье, мармелад (до 70 г в день), молочные и фруктовые кисели.

Шоколад и изделия из шоколада, кремовые изделия, мороженое, пирожные, торты.

Напитки

Некрепкий чай с лимоном, молоком, некрепкий кофе с молоком, сладкие фруктово-ягодные соки, компот, отвар шиповника.

Чёрный кофе, какао, холодные напитки.

Санаторий «Спутник»

Типы бронирования и условия оплаты:

Негарантированное бронирование предлагает сохранение брони на номер в течение 5 дней с момента выставления счет-фактуры до момента поступления денежных средств.

Гарантированное бронирование сохраняет бронь на номер, на весь период, указанный при бронировании в случае 100% предоплаты.

Пожалуйста, после проведения платежа банковской картой, сохраняйте полученные карт-чеки (подтверждения оплаты) для сверки с выпиской из карт-счета, с целью подтверждения совершения операции в случае возникновения спорных ситуаций.

Условия отмены брони:

В случае досрочного отъезда (неприбытия) Заказчика по уважительной причине: смерть или болезнь близких родственников, болезнь  самого отдыхающего, вызов государственными органами, вызов на работу или учебу, производится возврат денежных средств за неиспользованные дни путевки. Вышеназванные факты должны быть подтверждены документально: телеграмма, копия свидетельства о смерти, копия справки или больничного листа, подтверждение вызова на работу или учебу.

Возврат денежных средств производится в течение 10 банковских дней, начиная со дня, следующего за днем подачи письменного заявления Заказчика и копий документов, удостоверяющие уважительность причин согласно требованиям  договора. Вышеназванные документы должны быть представлены Исполнителю Заказчиком не позднее одного месяца со дня отъезда (неприбытия) в санаторий. В случае непредставления Исполнителю вышеуказанных документов в сроки, определенные договором, возврат денежных средств не производится.

Возврат денежных средств производится за вычетом комиссионного вознаграждения причитающегося  банку на ту карту, с которой была совершена оплата.

В случаях, не предусмотренных  договором, возврат денежных средств Заказчику не производится.

Исполнитель  не несет ответственность за отмену бронирования, сделанную в устной форме.

В случае возврата средств фактическое зачисление денежных средств на счет банковской карты Заказчика может занимать до 30 дней в зависимости от правил и условий, межбанковских процессинговых центров и банков, участвующих в данной операции. Возврат осуществляется на ту же карту, с которой была произведена оплата!


Инструкция по бронированию и оплате:

онлайн-бронирование:

1. Выбирите интересующую вас дату заезда, гражданство и количество отдыхающих. Нажмите кнопку «Найти». Система подберёт все доступные варианты исходя из Вашего запроса.

2. Нажав кнопку «Выбрать»  — Вы добавляете в заявку наиболее подходящий для Вас номер, после чего у Вас появится возможность скорректировать дату заезда и выезда (в рамках выбранного Вами номера), добавить отдыхающих и тип путевки. После этих шагов нажав кнопку «Забронировать» Вы перейдете к анкетным данным для договора.

3. Ознакомьтесь с договором, если Вас все устраивает – поставьте галочку, что Вы согласны с договором. Заполните анкетные данные и нажмите кнопку «Забронировать».

4. После проверки администратором на Вашу электронную почту будет выслано письмо, содержащее: 

1. ссылку для онлайн-оплаты; 
2. договор; 
3. счет-фактуру для оплаты; 
4. срок оплаты.

Если у администратора будут вопросы, он свяжется с Вами по телефону, указанному в анкетных данных.

подтверждение брони по пин-коду:

1. В поле «пин-код» введите код, который сообщил Вам менеджер.

2. Ознакомьтесь с договором, если Вас все устраивает – поставьте галочку, что Вы согласны с договором.

Заполните анкетные данные и нажмите кнопку «Забронировать».

3. После проверки администратором на Вашу электронную почту будет выслано письмо, содержащее: 

1. ссылку для онлайн-оплаты; 
2. договор; 
3. счет-фактуру для оплаты; 
4. срок оплаты.

Если у администратора будут вопросы, он свяжется с Вами по телефону, указанному в анкетных данных.

 

Оплата банковской картой VISA, MasterCard, БЕЛКАРТ через систему Ассист

Оплата производится через интернет в режиме реального времени непосредственно после оформления заказа.

Для совершения финансовой операции подходят карточки международных систем VISA (всех видов), MasterCard (в том числе Maestro), эмитированные любым банком мира, в том числе эмитированные АСБ «Беларусбанк», а также карты системы БЕЛКАРТ.

О процедуре оплаты по карточам БЕЛКАРТ ОАО «АСБ Беларусбанк»

* Код CVV2/CVC2 — это контрольный номер, состоящий из трех цифр, который напечатан на обратной стороне банковской карты. Этот номер, обычно, напечатан в верхнем правом углу специальной полосы для подписи. Ввод номера необходим, чтобы убедиться, что карта используется настоящим владельцем.

При выборе оплаты заказа с помощью банковской карты, обработка платежа (включая ввод номера банковской карты) производится ООО «Компания электронных платежей «АССИСТ» с использованием программно-аппаратного комплекса системы электронных платежей ASSIST, которая прошла международную сертификацию.

В системе, обеспечивающей безопасность платежей, используется защищённый протокол TLS для передачи конфиденциальной информации от клиента на сервер и дальнейшей обработки в процессинговом центре. Это значит, что конфиденциальные данные плательщика (реквизиты карты, регистрационные данные и др.) не поступают в интернет-магазин, их обработка полностью защищена, и никто не может получить персональные и банковские данные клиента. Кроме того, при обработке платежей по банковским картам, используется безопасная технология 3D-Secure, которую в обязательном порядке требует международная платежная система VISA и MasterCard.

Чтобы оплатить этим способом:

  1. Выбираете способ оплаты картой on-line.
  2. После нажатия на кнопку «Подтвердить и оплатить» система направит вас на сайт провайдера электронных платежей belassist.by, обеспечивающей безопасность платежей. Авторизационный сервер устанавливает с Покупателем соединение по защищенному протоколу TLS и принимает от Покупателя параметры его банковской карты (номер карты,  дата окончания действия карты, имя держателя карты в той транскрипции, как оно указано на банковской карте, а также номер CVC2, либо CVV2, указанные на оборотной стороне карты).   Операция оплаты банковской картой онлайн полностью конфиденциальна и безопасна.
  3. Ваши персональные данные и реквизиты карточки вводятся не на странице нашего сайта, а на авторизационной странице платежной системы. Доступ к ним осуществляется по протоколу безопасной передачи данных TLS, так же применяются технологии безопасных интернет платежей Verified by Visa и MasterCard SecureСode.

К оплате принимаются карты платежных систем Visa International, MasterCard и Белкарт всех классов и банков. Мы рекомендуем заранее обратиться в свой банк, чтобы удостовериться в том, что ваша карта может быть использована для платежей в сети интернет. Причины отказа в авторизации могут быть следующими:

—  на карте недостаточно средств для оплаты заказа;

—  банк, выпустивший карточку Покупателя, установил запрет на оплату в Интернете;

—  истекло время ожидания ввода данных банковской карты;

—  введённые данные не были подтверждены вами на платежной странице, ошибка формата данных и.

т.д.

В зависимости от причины отказа в авторизации для решения вопроса вы можете:

—  обратиться за разъяснениями в Банк, выпустивший карточку Покупателя;

— в случае невозможности решения проблемы Банком — повторить попытку оплаты, воспользовавшись картой, выпущенной другим Банком.

Активное долголетие. Старости — нет!

Диета и режим

Назначение диеты

Химический состав и калорийность диеты

Диета № 1
(стол № 1)

6 раз в день
6-12 месяцев

 Язвенная болезнь желудка и двенадцатиперстной кишки

 Гастрит с повышенной кислотностью после обострения

Белки 110-120 г.
Жиры 100-120 г.
Углеводы 400-500 г

Калорийность 3000-3200 ккал.

Диета № 1а
(стол № 1)

Каждые 2-2,5 часа

 Острый гастрит

 Обострение хронического гастрита с повышенной кислотностью

 Обострение язвенной болезни желудка

Белки 80-100 г.
Жиры 100 г
Углеводы 200 г

Калорийность 1800-2100 ккал

Диета 1б
(стол № 1б)

6 раз в день

 Затихание обострения язвенной болезни и хронических гастритов с повышенной кислотностью

Белки 100-110 г
Жиры – 100-110 г
Углеводы 300 г.

Калорийность 2600-2700 ккал

Диета № 2
(стол № 2)

5 раз в день

 Хронические гастриты с недостаточной кислотностью

 Выраженные бродильные процессы

 Хронические запоры

Белки 100-110 г
Жиры 100 г
Углеводы 400 г

Калорийность 2800 ккал

Диета № 3
(стол № 3)

5-6 раз в день

 Атонические запоры

 Хронические запоры

Белки 90-100 г. (из них 60 % животные)
Жиры 100 г. (из них 30 % растительные)
Углеводы 400 г

Калорийность 2500-3000 ккал

Диета № 4
(стол № 4)

6 раз в день
4-5 дней

 Заболевания тонкого кишечника и толстой кишки (колиты, энтероколиты, начальная стадия гастероэнтероколита)

 Дизентерия

 Брюшной тиф

Белки 100 г
Жиры 75 г
Углеводы 300-350 г

Калорийность 2500 ккал

Диета № 4а
(стол № 4а)

6 раз в день

 Кишечные заболевания с преобладанием процессов брожения

Белки 120 г
Жиры 50 г
Углеводы 140-150 г

Калорийность 1600-1700  ккал

Диета № 4б
(стол № 4б)

4-6 недель

6 раз в день

 Острые и хронические формы заболеваний кишечника

 Одновременные заболевания кишечника и желудка, и/или поджелудочной железы, и/или печени и/или желчевыводящих путей

Пища только протертая

Белки 100 г. (из них 80 % животные)
Жиры 100 г. (из них 80 % животные)
Углеводы 250-300 г

Калорийность 1800-2300 ккал

Диета № 4в
(стол № 4в)

После диеты № 4б

 То же, в период восстановления, затем при необходимости переход к диете №2 или сразу к диете №15.

То же, но уже не только протертая пища

Диета № 5
(стол № 5)

5 раз в день

 Заболевания печени, желчного пузыря, желчевыводящих путей вне стадии обострения

 Гепатит

 Хронические холецистит, гастрит, колит

 Цирроз печени

Белки 100 г
Жиры 80-100 г
Углеводы 400-450 г.

Витамины обязательны

Калорийность 2800-3000 ккал

Диета № 5а
(стол № 5а)

6 раз в день
7-14 дней

 Острые холецистит, гепатит

 Хронические холециститы и гепатиты в период обострения

 Желчнокаменная болезнь

Протертая пища

Белки 100 г
Жиры 80-100 г
Углеводы 400-450 г.

Витамины обязательны

Калорийность 2800-3000 ккал

Диета № 5п
(стол № 5п)

6 раз в день

 Хронический и острый панкреатит

Белки 150 г.(из них 80 % животные)
Жиры 60-80 г
Углеводы 180-200 г.

Калорийность 1600-1800 ккал

Диета № 6
(стол № 6)

5 раз в день

 Подагра

 Мочекаменная болезнь с уратурией

Белки 80 г.(из них 80 % животные)
Жиры 90 г
Углеводы 240-400 г.

Калорийность 2600-2900 ккал

Диета № 7
(стол № 7)

6 раз в день

 Хронические заболевания почек при отсутствии почечной недостаточности

 Хронический нефрите вне обострения

 Острый нефрит в период выздоровления

Белки 70-80 г
Жиры 90 г
Углеводы 400 г

Калорийность 2800-3000 ккал

Диета № 7а
(стол № 7а)

6 раз в день по назначению врача

 Острые заболевания почек

Белки 20-25 г
Жиры 90 г
Углеводы 400 г

Калорийность 2800-3000 ккал

Диета № 7б
(стол № 7б)

6 раз в день

 Переходная диета к столу № 7в при затихании острого воспалительного процесса в почках

То же

Снижение потребления соли и жидкости

Диета № 7в
(стол № 7в)

6 раз в день

 Хронические заболевания почек, сопровождающиеся нефротическим синдромом (туберкулез почек, амилоидоз, нефропатия беременных)

Белки 100-120 г
Жиры 80 г
Углеводы 400 г

Соль <2 г

Диета № 8
(стол № 8)

6 раз в день

 Ожирение, вызванное нарушением обмена веществ и постоянным перееданием (без серьезных нарушений в деятельности органов пищеварения и сердечно-сосудистой системы)

Белки 90-120 г
Жиры 60-85 г
Углеводы 200-250  г
Соль 5-6 г

Калорийность 1800-2000 ккал

Диета № 9
(стол № 9)

5 раз в день с частыми перекусами

 Сахарный диабет средней и легкой тяжести

Белки 100 г
Жиры 70-80 г . (из них 75 % животные)
Углеводы (желательно сложные) до 300 г

Калорийность 2100-2400 ккал

Диета № 10
(стол № 10)

5-6 раз в день

 Заболевания сердечно-сосудистой системы с недостаточностью кровообращения (кроме тяжелых форм)

 Нарушения сердечного ритма, учащенное сердцебиение

 Снижение работоспособности, повышение утомляемости

Белки 90-110 г
Жиры 65-75 г
Углеводы 400-500  г

Калорийность 2500-3000 ккал

Диета № 11, лечебная диета для набора веса
(стол № 11)

5 раз в день

 Туберкулез легких, костей, лимфатических узлов, суставов при нерезком обострении или затухании

 Истощение после инфекционных болезней, операций, травм

 Истощение, пониженная масса тела

Белки 110-130 г
Жиры 100-120 .(из них 60 % животные) г
Углеводы 400-500  г
Соль 15 г

Калорийность 3000-3400 ккал

Диета № 12
(стол № 12)

6 раз в день

 Функциональные заболевания центральной нервной системы, в том числе:
 • депрессии
 • снижение концентрации внимания, памяти, интеллекта
 • нарушение сна

Белки 90 г (из них 60% растительных)
Жиры 70 . (из них 60 % животные) г
Углеводы 350  г

Калорийность 2300-2400 ккал

Диета № 13
(стол № 13)

5 раз в день

 Острые инфекционные заболевания

 Поддержка общих сил организма и повышение его сопротивляемости инфекции

 Для снижения интоксикации

Белки 75-80 г .(из них 70 % животные и молочные)
Жиры 100-120 г (из них 85-90% животные)
Углеводы 300-350  г
Соль 8-10 г

Калорийность 2200-2300 ккал

Диета № 14
(стол № 14)

4 раза в день (в промежутках и натощак— питье)

 Мочекаменная болезнь (фосфатурия), сопровождаемая щелочной реакцией мочи и выпадением фосфорно-кальциевых солей в виде осадка

Белки 90 г
Жиры 100 г
Углеводы 380-400  г
Соль 10-12 г

Калорийность 2700-2800 ккал

Диета № 15
(стол № 15)

5 раз в день

 Заболевания, не требующие соблюдения специальных диет и без нарушенной работы пищеварительной системы

 Диета для перехода к обычной пище в период выздоровления и после использования других лечебных диет

Белки 90-95 г (из них 55% животные)
Жиры 100 г (из них 70% животные)
Углеводы 380-400  г
Соль 15 г

Калорийность 2800-2900 ккал

Как правильно питаться и нужны ли вам диеты | Санаторий.

ру | Отдых с пользой

Темы о диетах и истинно правильном для человека питании волнуют многих. Но одним из самых знаменитых поборников диет вот уже сотню лет считается Мануил Певзнер. Он разработал классические диет-столы, которые и сегодня используют в медицине. Разбираемся, не устарел ли его подход, помогают ли эти диеты и надо ли вообще так заморачиваться по поводу еды.

Кто такой Певзнер и почему мы должны есть по его правилам

Все хотя бы раз в жизни слышали про номерные диет-столы. Их назначают в больницах и санаториях, советуют врачи для питания в обычной жизни. Именно их и разработал еще в 1930 году Мануил Певзнер — один из основоположников советской диетологии.

Певзнер — человек, без сомнения, талантливый, амбициозный, неординарный и даже немного таинственный. Например, историки до сих пор не знают точную дату его рождения: то ли июнь, то ли август, то ли ноябрь 1872 года. О месте рождения и том, кем были его родители, тоже спорят.

Точно известно, что образование Певзнер получил отличное: учился на медицинском факультете Московского Университета. Правда, вскоре после поступления на полгода был отчислен за участие в беспорядках. Затем был одним из основателей Института питания в Москве и стал заслуженным деятелем науки РСФСР.

Еще одна необычная деталь его биографии — уже посмертно он стал фигурантом знаменитого сталинского «дела врачей». Напомним: официально объявлялось, что группа врачей была замешана в заговоре против советских лидеров, по факту — дело имело сионистскую направленность. Оно считалось одним из последних сталинских репрессивных дел, но после смерти вождя развалилось. Впоследствии Певзнер был оправдан, а его работы не были преданы забвению и использовались повсеместно.

Зачем Певзнером были придуманы диет-столы

До создания своей книги о питании Певзнер стажировался за границей. В том числе, в Германии, где в послевоенные годы остро стоял вопрос недорогого и качественного питания. В СССР проблемы были те же, поэтому полученные в помешанной на диетах еще с 19 века Европе знания были как нельзя кстати. В итоге Певзнер пришел к выводу, что индивидуальное питание — удовольствие дорогое, поэтому для большинства находящихся в больницах и санаториях людей будет недоступно.

Так пришла идея создания специальных диет «группового» питания, которую смогут предложить тысячам и миллионам советских людей. Как писал Певзнер, ориентировано оно будет «на болезнь, а не на конкретного больного». Результатом всех исследований стала книга «Рациональное и лечебное питание». Она содержала описание 23 лечебных столов, а если считать нумерацию — 16 основных: с 0 по 15, часть из которых имела дополнительные подпункты. Первые столы показаны при определенных группах заболеваний, например, ЖКТ и диабете. Последний, 15 стол — общий, его назначали людям без хронических заболеваний.

Певзнер против специй

Хотя столов у Певзнера и 16, в большинстве из них прослеживаются общие правила. Расскажем об основных, а вы в комментариях не забудьте написать, согласны ли вы с ними.

  • Алкоголю — бой. Его не разрешается употреблять ни в одном столе.
  • Предпочтительно дробное питание 5-6 раз в день.
  • КБЖУ — наше все, обязательно считаем нужные соотношения.
  • Запрещенные блюда: белый хлеб, копченое, жареное, наваристые супы, маринады и соленья.
  • Если уж очень хочется жареного, то использовать при приготовлении только маргарин или сливочное масло.
  • Никаких пряностей и приправ: они «возбуждающие и вредные», максимум — черный перец и соль.
  • Витамины и минеральные соли наиболее органично потреблять из ягод, фруктов и сырых овощей, в крайнем случае — свежевыжатых соков

Важнейший посыл — диета не заменяет медикаментозное и физиолечение. Это лишь дополнительный инструмент комплексной терапии. Она поможет оздоровить организм, избежать появления неприятных симптомов и улучшить общее самочувствие.

Что говорят о Певзнере современные врачи

С наступлением нового тысячелетия разработанный Певзнером подход стал находить все больше критики. Основная претензия — столы определяют лишь общие правила питания при конкретных болезнях, тогда как каждый человек индивидуален. Например, у кого-то может быть несколько заболеваний, пищевая непереносимость определенных продуктов, да и просто банальная нелюбовь к некоторым позициям готовых рационов.

Еще одна причина замены столов — человеческий фактор. Не секрет, что не все врачи горят своим делом и делают для пациентов все возможное. Таким эскулапам проще было поставить в карточке номер стола, чем долго разбираться с конкретным рационом питания. Кроме того, такое обилие столов создавало проблемы для столовых: на готовку тратилось слишком много времени.

Изменился и базовый принцип — лечат не болезнь, а человека, поэтому сейчас практикуют более индивидуальный подход. Кроме того, были разработаны и новые методические указания для оздоровительного питания.

На практике — в санаториях и больницах — столы Певзнера все так же используют. В одних учреждениях без изменений, в других применяют скорректированные варианты, утвержденные в методических рекомендациях.

Тщательно изучая партнерские санатории, наши эксперты по здоровому отдыху отмечают, что в большинстве из них действует индивидуальный подход к каждому гостю. Лечащий врач после осмотра подбирает персональную диету: она может базироваться на столах Певзнера, но и учитывает особенности и предпочтения в питании каждого человека. Еду в санаториях обычно подают в формате шведского стола с указанием КБЖУ: гость легко может сам определить, какие блюда ему подходят по рекомендациям врача и больше по вкусу.

Благодаря этому определен идеальный баланс между пользой для здоровья и вкусным питанием. А это очень важно во время отдыха в санатории, который должен приносить удовольствие во всех аспектах, в том числе и в еде.

Совсем недавно мы делали подборку лучших санаториев на море с хорошим питанием. Можно подробнее прочитать про то, как и чем кормят в санаториях, а также выбрать для себя и своих близких хороший вариант для отдыха.

Тем более, что сейчас действует выгодная акция на путешествия по России. Надо лишь оплатить путевку картой «Мир» до 15 июня и целых 20% от ее стоимости вернется вам на карту. Никакого обмана: цены в санаториях на период акции остаются прежними. А мы делаем их еще выгоднее: на sanatory.ru всегда действуют приятные акции и скидки.

Наши специалисты всегда рады вам помочь телефону +7 800 511-04-66, в WhatsApp по номеру +7 991 310-93-43, в чате на sanatory.ru или прямо здесь в комментариях.

Диета стол №5 по Певзнеру: меню и рецепты

Соблюдение диет необходимо не только для избавления от лишних килограммов. Правильное питание может помочь в лечении заболеваний или предотвратить их обострение. В данной статье вы узнаете об особенностях 5 диетического стола по Певзнеру.

Михаил Певзнер — советский диетолог, разработавший ряд диет для людей с различными заболеваниями. Его вариант меню под номером 5 показан для людей, имеющих проблемы с поджелудочной железой, желчным пузырём и печенью.

Чаще всего эту диету назначают пациентам с диагнозами острый или хронический гепатит, желчнокаменная болезнь, хронический или острый холецистит, цирроз печени.  При этих болезнях правильное питание позволяет снизить нагрузки на органы, что в свою очередь благоприятно сказывается на восстановлении их работы и предотвращении обострений.

Стол номер 5 — полноценная сбалансированная диета, в рационе которой в нужных пропорциях присутствуют жиры, белки, углеводы. Значит соблюдать данный стол можно на протяжении всей жизни, а не только в период обострения болезни или после операции.

Данная диета является лечебной, её нужно соблюдать. Ваша ответственность и дисциплинированность помогут сохранить и восстановить здоровье. Это гораздо важнее внешнего вида, который всегда можно исправить.

Примерное меню диеты и популярные рецепты.

Диета номер 5 по Певзнеру довольно щадящая. Она категорически запрещает лишь жареные блюда, жирную пищу и продукты, содержащие пурины. Отказ от этих продуктов будет способствовать не только восстановлению внутренних органов, но и снижению веса.

Меню 5 диеты должно быть разнообразным. Вы можете есть практически всё при соблюдении ряда правил:

  • Исключена жарка продуктов и использование жиров и масел. Исключение составляют оливковое и льняное масла.
  • Питайтесь не менее 5 раз в день в одно и тоже время с одинаковыми перерывами между приёмами пищи.
  • Ежедневно выпивайте большое количество воды. Не менее полутора литров. Точный объем необходимой жидкости определяется из расчёта 60 мл на каждый килограмм.
  • Откажитесь от консервированных продуктов.

5 стол подразумевает полный отказ от грибов, жирного мяса и рыбы и бульонов на них. Под запретом также шпинат, щавель, редька, лук, чеснок. Исключаются из рациона печень, ливер, колбасы, утка. Свежий хлеб, все изделия из сдобного теста, шоколад и другие сладости также входят в список запрещённых продуктов.

Во время лечебной диеты нужно сделать акцент на нежирном мясе без сухожилий, молочных супах и овощных бульонах. Можно употреблять все крупы, овощи и некислые ягоды и фрукты в любой кулинарной обработке. Разрешены и кисломолочные продукты с небольшой жирностью.

Предлагаем вам примерное меню 5 стола на один день.

Завтрак должен быть полноценным. Приготовьте гречу и заправьте её сливочным маслом. Затем съешьте 100 гр творога и запейте стаканом чая. Можно приготовить омлет из белков на пару и морковно-яблочный салатик.

На второй завтрак можно приготовить один крупный фрукт — яблоко, апельсин, грушу или банан (около 100 граммов). Можно выпить стакан кефира или свежевыжатого сока из любого разрешённого овоща или фрукта.

Обед можно сделать вегетарианским. Приготовьте вегетарианский супчик (в 300 гр овощного бульона добавьте по 50 гр капусты и картофеля, 20 гр моркови, 40 гр кабачков и 5 гр зелени). Можно приготовить стейк из нежирной говядины или рыбы и подать его вместе с салатом из свежих овощей.

Крупяной суп на овощном отваре или молочный суп с добавлением макаронных изделий — также хорошие варианты блюд на обед.
На полдник выпейте стакан компота с печеньем или сухариками. Можно перекусить фруктом или стаканом фреша.

На ужин можно приготовить рыбу на пару вместе с картофельным пюре. Можно приготовить салат из овощей или рататуй. Для приготовления последнего блюда вам понадобятся баклажаны, кабачки, морковь, картофель в равных пропорциях.

На ночь выпейте стакан кефира.

Длительное соблюдение диеты позволит вам избавиться от болезненных признаков основного заболевания, очистить организм от шлаков, сбросить лишние килограммы, улучшить состояние кожи и ногтей.
Теги по теме: питаниеродители

Оцените материал:

спасибо, ваш голос принят

 

В чем разница между графиком точек останова и графиком де Брейна? | BMC Genomics

Теперь мы обобщим понятия графов де Брейна и точек разрыва от одноцепочечных до двухцепочечных геномов. Вместо явного представления обеих цепочек (как в большинстве существующих ассемблеров) мы описываем более эффективное представление, кодирующее обе нити в одну каноническую цепочку (сравните с аналогичными представлениями обеих цепочек в SPAdes [12] и некоторых других ассемблерах). ).

Для нуклеотида x обозначим его комплементарный нуклеотид как x¯, например, A¯=T T и C¯=G. Дано k -mer s = s 1 s 2 . . . s k , мы определяем его обратное дополнение как k -mer s¯=sk¯…s2¯s1¯. Мы называем k -mer каноническим , если оно меньше или равно (в лексикографическом порядке), чем его обратное дополнение. Например, AG и AT являются каноническими 2-мерами, но CT не является каноническим 2-мером.В этом разделе мы будем представлять строки как пути, помеченные только каноническими k -мерами, и определим точки останова и графы де Брейна как результаты склейки этих путей.

В то время как DB ( String, k ) и BP ( String, k ) клей идентичные ( k -1)-меры в String , 900 ( k -1)-мер с его обратным дополнением (см. фиг. 9). Во многих приложениях было бы полезно склеить ( k -1)-меры с их обратными дополнениями; например, разработчики многих ассемблеров генома прилагают значительные усилия для поддержания «симметричных» графов де Брейна на всех этапах сборки, чтобы подграф, представляющий одну нить, был топологически идентичен подграфу, представляющему другую нить [12]. Поскольку граф точек останова и граф де Брейна на рис. 9 не позволяют анализировать взаимодействие между перестройками и инвертированными повторами, нам необходимо придумать новую теоретико-графовую модель для двухцепочечных геномов. Отметим, что, поскольку графы А-Брейна были разработаны для склеивания произвольных позиций в строки (при условии, что они определены как «выровненные» в структуре графа А-Брейна [13]), склеивание ( k -1)-меры с их обратными дополнениями идеально вписываются в рамки графов А-Брейна.

Рисунок 9

Строка String = ACAGTC A

3 (TOP), BP ( STRING , 3 ) (слева) и БД ( Строка , 3) ​​(справа) . Пара повторов в String показана коричневым цветом, а пара инвертированных повторов показана красным.

Чтобы смоделировать двухцепочечные строки как пути, мы вводим понятие канонического пути , представляющего строку String (это отличается от стандартного представления String как пути из раздела 2). Преобразовать стандартный путь Путь БП ( String, k ) в канонический путь CPathBP ( String, k ), меняем направления всех черных ребер, помеченных неканоническими ( k -1)-мерами, и меняем их метки на их обратные дополнения (см. рис. 10, слева).В результате все черные ребра канонического пути помечены каноническими ( k -1)-мерами.

Рисунок 10

Строка String = ACAGTCA (TOP), представленные каноническими путями CPath BP ( Строка , 3) ​​и CPath БД ( String , 3), двухцепочечная точка останова диаграммы BP * ( String , 3) (слева) и двухцентрированный график de bruijn БД *( Строка , 3) ​​(справа) . Пара повторов в String показана коричневым цветом, а пара инвертированных повторов показана красным.

Для преобразования стандартного пути Путь БД ( String, k ) в канонический путь CPath DB ( String, k ), мы просто меняем метки всех вершин, помеченных неканоническими ( k -1)-мерами, на их обратные дополнения (см. рис. 10, справа).

После преобразования стандартных путей Путь БП (строка , k ) и путь БД ( String, k ) в канонические пути CPath BP (строка , k ) и CPath БД ( String, k ) соответственно определение точки останова графа (склейка одинаково помеченных черных ребер в CPath BP ( String, k )) и граф де Брейна (склейка одинаково помеченных вершин в CPath BP ( String, k )) остаются без изменений. Пары k -меров также склеиваются, если они представляют собой обратное дополнение k -мера друг друга и помечены обоими k -мерами. Графы, полученные после склейки этих путей, называются двухцепочечным графом точек останова BP* ( String, k ) и двухцепочечным графом де Брейна DB * ( String, k ) (рис. 10). ). В то время как BP *( String, k ) использует направление черного края, чтобы представить, используется ли каноническая строка или ее обратное дополнение

, DB * ( String, k ) сворачивает все черное ребра в вершины и больше не поддерживает информацию о направлении, чтобы различать эти две возможности.Пара вершин в DB * ( String, k ), помеченная каноническими ( k -1)-мерами v и w , потенциально может соответствовать 4 типам ребер в зависимости от того, соединяет ли ребро ( i) v и w , (ii) v и w¯, (iii) v¯ и w , и (iv) v¯ и w¯ (сравните с двунаправленным графом де Брейна [29]).

Как и прежде, DB *( String, k ) получается из BP *( String, k ) свертыванием всех черных ребер, а BP *( String4, k)900 из DB *( String, k ) путем расширения всех вершин в черные ребра (и соединения черных ребер в соответствии с метками на цветных ребрах).

Можно заметить, что хотя двухцепочечный граф де Брейна подобен двунаправленному графу де Брейна, введенному в [29], он не требует явного введения двунаправленных ребер. Понятия двухцепочечных графов точек останова и графов де Брейна также могут быть естественным образом расширены от одной двухцепочечной строки до нескольких двухцепочечных строк.

%!PS-Adobe-2.0 %%Создатель: dvips(k) 5.86 Copyright 1999 Radical Eye Software %%Название: проект.дви %%Страниц: 37 %%PageOrder: по возрастанию %%BoundingBox: 0 0 612 792 %%DocumentFonts: Helvetica %%EndComments %DVIPSWebPage: (www.radicaleye.com) %DVIPSCommandLine: dvips -o proj.ps proj.dvi %DVIPSParameters: dpi=600, сжатый %DVIPSSource: вывод TeX 2001. 11.15:1246 %%BeginProcSet: texc.pro %! /TeXDict 300 dict def TeXDict begin/N{def}def/B{bind def}N/S{exch}N/X{S N}B/A{dup}B/TR{translate}N/isls false N/vsize 11 72 mul N/hsize 8,5 72 mul N/landplus90{false}def/@rigin{isls{[0 landplus90{1 -1}{-1 1}ifelse 0 0 0]concat}if 72 Раздел разрешения 72 Раздел VResolution отрицательный масштаб isls{ landplus90{VResolution 72 div vsize mul 0 exch}{Разрешение -72 div hsize mul 0}ifelse TR}if Resolution VResolution vsize -72 div 1 add mul TR[ матрица currentmatrix{A круглый субабс 0.00001 lt{раунд}if}всего раунда exch round exch]setmatrix}N/@landscape{/isls true N}B/@manualfeed{ statusdict/manualfeed true put}B/@copies{/#copies X}B/FMat[1 0 0 -1 0 0] N/FBB[0 0 0 0]N/nn 0 N/IEn 0 N/ctr 0 N/df-tail{/nn 8 dict N nn begin /FontType 3 N/FontMatrix fntrx N/FontBBox FBB N string/base X array /BitMaps X/BuildChar{CharBuilder}N/Encoding IEn N end A{/foo setfont}2 копирование массива cvx N load 0 nn put/ctr 0 N[}B/sf 0 N/df{/sf 1 N/fntrx FMat N df-tail}B/dfs{div/sf X/fntrx[sf 0 0 sf neg 0 0]N df-tail}B/E{pop nn A definefont setfont}B/Cw{Cd A длина 5 sub get}B/Ch{Cd A длина 4 sub get }B/Cx{128 Cd A длины 3 sub get sub}B/Cy{Cd A длины 2 sub get 127 sub} B/Cdx{Cd A length 1 sub get}B/Ci{Cd A type/stringtype ne{ctr get/ctr ctr 1 добавить N}if}B/id 0 N/rw 0 N/rc 0 N/gp 0 N/cp 0 N/G 0 N/CharBuilder{сохранить 3 1 roll S A/base get 2 index get S/BitMaps get S get/Cd X pop/ctr 0 N Cdx 0 Cx Cy Ch sub Cx Cw добавить Cy setcachedevice Cw Ch true[1 0 0 -1 -. 1 Сх sub Cy .1 sub]/id Ci N/rw Cw 7 add 8 idiv string N/rc 0 N/gp 0 N/cp 0 N{ rc 0 ne{rc 1 sub/rc X rw}{G}ifelse}imagemask restore}B/G{{id gp get/gp gp 1 add N A 18 mod S 18 idiv pl S get exec}loop}B/adv{cp add/cp X}B /chg{rw cp id gp 4 index getinterval putinterval A gp add/gp X adv}B/nd{ /cp 0 N rw exit}B/lsh{rw cp 2 copy get A 0 eq{pop 1}{A 255 eq{pop 254}{ A A добавить 255 и S 1 и или}ifelse}ifelse положить 1 adv}B/rsh{rw cp 2 скопировать получить A 0 eq{pop 128}{A 255 eq{pop 127}{A 2 idiv S 128 и или}ifelse} ifelse put 1 adv}B/clr{rw cp 2 index string putinterval adv}B/set{rw cp fillstr 0 4 индекс getinterval putinterval adv}B/fillstr 18 строка 0 1 17 {2 copy 255 put pop}for N/pl[{adv 1 chg}{adv 1 chg nd}{1 add chg}{1 add chg nd}{adv lsh}{adv lsh nd}{adv rsh}{adv rsh nd}{1 add adv}{/rc X nd}{ 1 add set}{1 add clr}{adv 2 chg}{adv 2 chg nd}{pop nd}]A{bind pop} forall N/D{/cc X Тип/тип строки ne{]}if nn/base get cc ctr put nn /BitMaps get S ctr S sf 1 ne{A A length 1 sub A 2 index S get sf div put }if put/ctr ctr 1 добавить N}B/I{cc 1 добавить D}B/bop{userdict/bop-hook известный{ bop-hook}if/SI save N @rigin 0 0 moveto/V матрица currentmatrix A 1 get A mul exch 0 получить mul add . 99 lt{/QV}{/RV}ifelse load def pop pop}N/eop{ SI восстановить userdict/eop-hook известный{eop-hook}if showpage}N/@start{ userdict/start-hook известный {start-hook}, если pop/VRResolution X/Resolution X 1000 дел/DVImag X/IEn 256 массив N 2 строка 0 1 255{IEn S A 360 добавить 36 4 index cvrs cvn put} for pop 65781.76 div/vsize X 65781.76 div/hsize X}N /p{show}N/RMat[1 0 0 -1 0 0]N/BDot 260 строка N/Rx 0 N/Ry 0 N/V{}B/RV/v{ /Ry X/Rx X V}B statusdict begin/product where{pop false[(Display)(NeXT) (LaserWriter 16/600)]{длина продукта длины le{длина продукта обмен 0 exch getinterval eq{pop true exit}if}{pop}ifelse}forall}{false}ifelse end{{gsave TR -.1 .1 TR 1 1 шкала Rx Ry false RMat{BDot}imagemask grestore}}{{gsave TR -.1 .1 TR Rx Ry масштаб 1 1 false RMat{BDot} imagemask grestore}}ifelse B/QV{gsave newpath transform round exch round exch itransform moveto Rx 0 rlineto 0 Ry neg rlineto Rx neg 0 rlineto fill grestore}B/a{moveto}B/delta 0 N/tail{A/delta X 0 rmoveto}B/M{S p дельта добавить хвост}B/b{S p хвост}B/c{-4 M}B/d{-3 M}B/e{-2 M}B/f{-1 M}B/g{0 M } B/h{1 M}B/i{2 M}B/j{3 M}B/k{4 M}B/w{0 rmoveto}B/l{p -4 w}B/m{p — 3 изн}б/н{ p-2w}B/o{p-1w}B/q{p1w}B/r{p2w}B/s{p3w}B/t{p4w}B/x{ 0 с rmoveto}B/y{3 2 roll p a}B/bos{/SS save N}B/eos{SS restore}B end %%EndProcSet %%BeginProcSet: специальный. профессионал %! TeXDict begin/SDict 200 dict N SDict begin/@SpecialDefaults{/hs 612 N /vs 792 N/ho 0 N/vo 0 N/hsc 1 N/vsc 1 N/ang 0 N/CLIP 0 N/rwiSeen false N /rhiSeen false N/letter{}N/note{}N/a4{}N/legal{}N}B/@scaleunit 100 N /@hscale{@scaleunit div/hsc X}B/@vscale{@scaleunit div/vsc X}B/@hsize{ /hs X/CLIP 1 N}B/@vsize{/vs X/CLIP 1 N}B/@clip{/CLIP 2 N}B/@hoffset{/ho X}B/@voffset{/vo X}B/@angle{/ang X}B/@rwi{10 div/rwi X/rwiSeen true N}B /@rhi{10 div/rhi X/rhiSeen true N}B/@llx{/llx X}B/@lly{/lly X}B/@urx{ /urx X}B/@ury{/ury X}B/magscale true def end/@MacSetUp{userdict/md известный {userdict/md get type/dicttype eq{userdict start md length 10 add md maxlength ge{/md md dup length 20 add dict copy def}if end md begin /letter{}N/note{}N/legal{}N/od{txpose 1 0 mtx defaultmatrix dtransform S atan/pa X newpath clippath mark{transform{itransform moveto}}{transform{ itransform lineto}}{6 -2 roll transform 6 -2 roll transform 6 -2 roll transform {itransform 6 2 рулона itransform 6 2 рулона itransform 6 2 рулона curveto}}{{closepath}}pathforall newpath counttomark array astore/gc xdf pop ct 39 0 put 10 fz 0 fs 2 F/|______Courier fnt invertflag{PaintBlack} if}N/txpose{pxs pys scale ppr aload pop por{noflips{pop S neg S TR pop 1 -1 шкала}если xflip yflip и{поп S отрицательный S TR 180 повернуть 1 -1 шкала ppr 3 получить ppr 1 получить neg sub neg ppr 2 получить ppr 0 получить neg sub neg TR}if xflip yflip not and{pop S neg S TR pop 180 повернуть ppr 3 получить ppr 1 получить neg sub neg 0 TR}if yflip xflip not and{ppr 1 получить neg ppr 0 получить neg TR}if}{ noflips{TR pop pop 270 повернуть в масштабе 1–1}if xflip yflip and{TR pop pop 90 повернуть 1 -1 шкала имп/об 3 получить имп/об 1 получить отрицательный суботрицательный имп. 2 получить имп./об 0 получить neg sub neg TR}if xflip yflip not and{TR pop pop 90 rotate ppr 3 get ppr 1 получить neg sub neg 0 TR}if yflip xflip not and{TR pop pop 270 rotate ppr 2 получить ppr 0 получить neg sub neg 0 S TR}if}ifelse scaleby96{ppr aload pop 4 -1 рулон добавить 2 раздел 3 1 рулон добавить 2 раздел 2 копировать TR .96 двойная шкала, отрицательная S, отрицательная S TR}if}N/cp{pop pop showpage pm restore}N end}if}if}N/normalscale{ Разрешение 72 деления VResolution 72 деления, отрицательная шкала magscale{DVImag dup scale }if 0 setgray}N/psfts{S 65781.76 div N}N/startTexFig{/psf$SavedState save N userdict maxlength dict begin/magscale true def normalscale текущая точка TR/psf$ury psfts/psf$urx psfts/psf$lly psfts/psf$llx psfts /psf$y psfts/psf$x psfts текущая точка/psf$cy X/psf$cx X/psf$sx psf$x psf$urx psf$llx sub div N/psf$sy psf$y psf$ury psf$lly sub div N psf$sx psf$sy шкала psf$cx psf$sx div psf$llx sub psf$cy psf$sy div psf$ury sub TR/showpage{}N/erasepage{}N/copypage{}N/p 3 def @MacSetUp}N/doclip{ psf$llx psf$lly psf$urx psf$ury currentpoint 6 2 roll newpath 4 copy 4 2 roll moveto 6 -1 roll S lineto S lineto S lineto closepath clip newpath moveto}N/endTexFig{end psf$SavedState restore}N/@beginspecial{SDict begin/SpecialSave save N gsave normalscale currentpoint TR @SpecialDefaults count/ocount X/dcount countdictstack N}N/@setspecial{ CLIP 1 eq{newpath 0 0 moveto hs 0 rlineto 0 vs rlineto hs neg 0 rlineto closepath clip} if ho vo TR hsc vsc масштабирование и поворот rwiSeen {rwi urx llx sub div rhiSeen{rhi ury lly sub div}{dup}ifelse scale llx neg lly neg TR }{rhiSeen{rhi ury lly sub div dup scale llx neg lly neg TR}if}ifelse CLIP 2 eq{newpath llx lly moveto urx lly lineto urx ury lineto llx ury lineto closepath clip}if/showpage{}N/erasepage{}N/copypage{}N newpath}N /@endspecial{count ocount sub{pop}repeat countdictstack dcount sub{end} повторить восстановление SpecialSave grestore end}N/@defspecial{SDict begin}N /@fedspecial{end}B/li{lineto}B/rl{rlineto}B/rc{rcurveto}B/np{/SaveX currentpoint/SaveY X N 1 setlinecap newpath}N/st{stroke SaveX SaveY moveto}N/fil{fill SaveX SaveY moveto}N/ellipse{/endangle X/startangle X /yrad X/xrad X/savematrix matrix currentmatrix N TR xrad yrad scale 0 0 1 startangle endangle arc savematrix setmatrix}N end %%EndProcSet TeXDict begin 40258431 52099146 1000 600 600 (проект. дви) @Начало %DVIPSBitmapFont: Fa cmti7 6 9 /Фа 9 106 df97 ДИИИИИИЭ %EndDVIPSBitmapFont %DVIPSBitmapFont: Fb cmti8 8 9 /Fb 9 106 df97 ДИИИИИИЭ %EndDVIPSBitmapFont %DVIPSBitmapFont: Fc cmcsc10 9 9 /Fc 9 117 df80 D99 D101 Д105 ДИ110 ДИ114 Д116 Д Е %EndDVIPSBitmapFont %DVIPSBitmapFont: Fd cmti10 10,95 7 /Fd 7 115 df49 D97 D104 DI111 DI114 Д Е %EndDVIPSBitmapFont %DVIPSBitmapFont: Fe cmmi6 6 1 /Fe 1 99 df98 D E %EndDVIPSBitmapFont %DVIPSBitmapFont: Ff cmmi8 8 16 /FF 16 122 df59 D67 D71 D83 D98 D100 Д105 D107 DIII112 D115 DI120 DI Е %EndDVIPSBitmapFont %DVIPSBitmapFont: Fg cmsy10 10.95 11 /Fg 11 107 df0 DII6 D21 D 25 Д91 ДИ102 ДИ106 Д Е %EndDVIPSBitmapFont %DVIPSBitmapFont: Fh cmex10 10 14 /Fh 14 106 df16 ДИ38 ДИ48 ДИ64 ДИ88 DI 104 ДИ Е %EndDVIPSBitmapFont %DVIPSBitmapFont: Fi cmsy6 6 2 /Fi 2 49 df0 D48 D E %EndDVIPSBitmapFont %DVIPSBitmapFont: Fj cmsy9 9 1 /Fj 1 3 df2 D E %EndDVIPSBitmapFont %DVIPSBitmapFont: Fk cmmi9 9 9 /Fk 9 123 df58 D100 D107 DIII115 DI 122 ДЭ %EndDVIPSBitmapFont %DVIPSBitmapFont: Fl cmr9 9 69 /Fl 69 123 df12 D14 D34 D37 D39 DII44 DIIIIII II IIIIIII61 Д65 ДИ IIIIII73 D76 DIIII82 DIII87 Д92 Д97 ДІІІІ IIIIIIIIIIIIIIIIIIIII II Э %EndDVIPSBitmapFont %DVIPSBitmapFont: Fm cmr6 6 5 /FM 5 98 df49 DIII97 D E %EndDVIPSBitmapFont %DVIPSBitmapFont: Fn cmtt10 10. 95 30 /Фн 30 120 дф45 ДИИ58 Д65 Д67 Д70 ДИ78 Д 82 ДИИ88 ДИ97 Д IIIIII110 D112 D114 DIII 119 Д Е %EndDVIPSBitmapFont %DVIPSBitmapFont: Fo cmr8 8 13 /Fo 13 98 df40 DI43 D48 DIIII55 DI61 D94 D97 D E %EndDVIPSBitmapFont %DVIPSBitmapFont: Fp cmmi10 10,95 38 /Fp 38 123 df18 D22 D27 D58 DIIII65 DI I69 D71 D75 DII80 D82 DII87 Д98 Д100 Д102 D105 ДИИИИ112 ДИИИИ 120 ДИИ Е %EndDVIPSBitmapFont %DVIPSBitmapFont: Fq cmbx12 14,4 33 /Fq 33 121 df49 DIII65 D67 D69 DI73 D I78 DII82 D84 D97 D99 DIIII II108 DIIII114 DIII120 Д Э %EndDVIPSBitmapFont %DVIPSBitmapFont: Fr cmcsc10 10.95 34 /Fr 34 122 df40 DI44 DI49 D54 D65 Д78 Д80 D82 DI97 ДIIIIIIIIIIIIIII IIIIII121 D E %EndDVIPSBitmapFont %DVIPSBitmapFont: Fs cmr10 10,95 88 /Фс 88 128 дф11 DIIII19 D22 Д34 Д37 DIIII43 DIIIIIIIIIIIIIIIIIII61 D65 DIIIIIIIIIIIIIIIIII82 DIIIIIIIIII II97 ДИИИИИИИИИИИИИИИИИИИИ IIIIII127 D E %EndDVIPSBitmapFont %DVIPSBitmapFont: ft cmbx10 10,95 20 /фут 20 117 df45 D58 D65 DI77 D80 D97 DIIIII105 D108 DIII114 DII Е %EndDVIPSBitmapFont %DVIPSBitmapFont: Fu cmr10 10 14 /Fu 14 118 df97 D99 DII103 DII 110 ДИИ114 ДIII Е %EndDVIPSBitmapFont %DVIPSBitmapFont: Fv cmsy7 7 1 /Fv 1 4 df3 D E %EndDVIPSBitmapFont %DVIPSBitmapFont: Fw cmr12 12 52 /Fw 52 122 df44 DII48 DIIIIIIIIII64 ДИИИИИ76 ДИ79 D83 D85 DII97 DIIIIIIIIIIIIIII114 DIIIIIII Е %EndDVIPSBitmapFont %DVIPSBitmapFont: Fx cmsy8 8 4 /Fx 4 51 df0 D3 D48 D50 D E %EndDVIPSBitmapFont %DVIPSBitmapFont: Fy cmbx12 12 52 /Fy 52 123 df12 D14 D40 DI

Модели хрупкой поломки и случайной поломки эволюции хромосом

Образец цитирования: Пэн К. , Певзнер П.А., Теслер Г. (2006) Модели хрупкой поломки и случайной поломки эволюции хромосом.PLoS Comput Biol 2(2): е14. https://doi.org/10.1371/journal.pcbi.0020014

Редактор: Phillip Bourne, Калифорнийский университет, Сан-Диего, США

Получено: 7 июля 2005 г.; Принято: 17 января 2006 г .; Опубликовано: 24 февраля 2006 г.

Авторские права: © 2006 Peng et al. Это статья с открытым доступом, распространяемая в соответствии с лицензией Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания оригинального автора и источника.

Конкурирующие интересы: Авторы заявили об отсутствии конкурирующих интересов.

Сокращения: п.н., базовая пара; NCBI, Национальный центр биотехнологической информации

Введение

Геномы постоянно меняются. Если геном сравнить с континентальной формой рельефа, то один тип изменений — точечные мутации — аналогичен постепенным изменениям ландшафта из-за эрозии ветром и водой. Второй тип изменений — перестройки генома — включает в себя эволюционные «землетрясения», резко меняющие ландшафт.Фундаментальный вопрос в исследованиях эволюции хромосом заключается в том, происходят ли эти землетрясения вдоль эволюционных «разломов» (горячих точек перестроек) или в «случайных» геномных позициях.

В знаменательной статье 1984 г. Надо и Тейлор [1] подсчитали, что существует примерно 200 консервативных сегментов (блоков синтении) между человеком и мышью, и предоставили убедительные аргументы в пользу модели случайной поломки геномной эволюции, постулированной Оно в 1973 г. 2]. Дальнейшие исследования значительно больших наборов данных (Copeland et al.в 1993 г. [3], DeBry и Seldin в 1996 г. [4], Burt et al. в 1999 г. [5], Lander et al. в 2001 г. [6], Mural et al. в 2002 г. [7]) с постепенно повышающимся уровнем разрешения сделал модель случайных поломок де-факто теорией эволюции хромосом, а предсказания Надо-Тейлора рассматриваются как одни из наиболее значительных результатов в «истории и развитии мыши как исследовательской инструмент» (Пенниси [8]).

Модель случайных разрывов подразумевает, что в геномах млекопитающих нет эволюционных «ошибок», и исключает систематическое повторное использование точек разрыва из одних и тех же областей генома.В 2003 году Певзнер и Теслер [9] выступили против модели случайного разрыва, показав, что любое преобразование порядка генов мыши в порядок генов человека потребует большого количества повторных использований точек останова. Этот вывод немедленно подразумевает, что точки разрыва перестановки образуют кластеры, что противоречит модели случайного разрыва. Аргументы Певзнера и Теслера не раскрывают конкретное расположение областей точек останова, где произошло повторное использование, а вместо этого дают неконструктивное комбинаторное доказательство того, что эти области существуют где-то (в неизвестных местах) в геноме.Основываясь на этом результате, Певзнер и Теслер отвергли модель случайных поломок и предложили альтернативную модель «хрупкой поломки» эволюции хромосом. Эта модель предполагает наличие ломких областей в геномах и постулирует, что точки разрыва происходят в основном внутри этих относительно коротких ломких областей (горячих точек перестроек).

В 2004 году Санкофф и Трин [10] выступили против теории хрупкого разрушения и выразили сомнения в том, что Певзнер и Теслер [9] представили какое-либо доказательство феномена повторного использования точки останова.Они описали изящный вычислительный эксперимент, в котором серия случайных перестановок создает видимость феномена повторного использования точки останова, и утверждали, что аргументы Певзнера и Теслера представляют собой артефакт, вызванный микроперестановками и алгоритмами идентификации блоков синтении. Sankoff и Trinh [10,11] внесли важный вклад, повысив осведомленность о том, что определение синтенийного блока является важным и нетривиальным аспектом анализа перегруппировок.

В результате возникают разногласия относительно модели хрупкой поломки.Например, Бейли и др. писали в 2004 году [12], что «наш анализ поддерживает неслучайную модель хромосомной эволюции, которая подразумевает преобладание повторяющихся мелкомасштабных дупликаций и крупномасштабных эволюционных перестроек в определенных хрупких регионах». Точно так же Чжао и соавт. [13] написали, что «независимое математическое моделирование распределения длины синтетических блоков, проведенное нами и другими, поддерживает модель хрупкого разрыва, но не модель случайного разрыва для эволюции генома млекопитающих». С другой стороны, Трин и соавт.[14] писали: «Действительно, нет прямых доказательств гипотезы хрупких регионов, кроме хорошо задокументированных тенденций к перестройкам в прицентромерных и субтеломерных регионах».

Тогда возникает вопрос, были ли аргументы Певзнера и Теслера [9] первым доказательством повторного использования точки останова или аргументы не имели смысла. Этот вопрос в конечном счете связан с вопросом о том, выявили ли Санкофф и Трин [10] ошибки в рассуждениях Певзнера и Теслера или же работа Санкофф и Трин [10] представляет собой артефакт.В этой статье мы демонстрируем, что (1) алгоритм идентификации синтенийного блока в [10] несовершенен и (2) параметры в [10] не отражают реалий сравнительной геномной архитектуры человека и мыши. Мы показываем, что если бы Санкофф и Трин [10] исправили проблемы (1) и (2), их аргументы против [9] исчезли бы.

В разделе 1 мы формально определяем коэффициент повторного использования точки останова (BRR). В разделе 2 мы описываем алгоритм идентификации блоков синтении Санкоффа и Трина, который мы называем ST-Synteny.В разделе 3 мы иллюстрируем несколько недостатков этого алгоритма. В разделе 4 мы воспроизводим моделирование Санкоффа и Трина, в котором они применяли ST-Synteny к синтетическим геномам, и мы выполняем соответствующие моделирования с использованием GRIMM-Synteny, получая разные результаты для влияния параметров на частоту повторного использования точки останова. В разделе 5 мы показываем иллюстрации различных блоков, идентифицированных с помощью ST-Synteny по сравнению с GRIMM-Synteny, с использованием как синтетических данных, так и реальных якорей X-хромосомы человека/мыши.

Моделирование в разделе 4 не принимает во внимание проблемы из реальных данных, такие как длина якоря в нуклеотидах и микроперестановки переменной длины. В разделе 6 мы делаем улучшенную симуляцию, учитывающую эти проблемы, и засеваем ее смоделированными геномами, основанными на длинах якорей в X-хромосомах человека/мыши и X-хромосомах человека/крысы.

В разделе 7 мы приводим результаты сравнения полных геномов человека и мыши, сначала на основе выравнивания, а затем на основе генов.

В Разделе 8 мы анализируем модель межгенных разрывов, в которой давление отбора предотвращает разрывы, происходящие внутри генов и внутри регуляторных регионов, расположенных выше генов.

Результаты

Раздел 1. Измерение коэффициента повторного использования точки останова

Мы изучаем блоки синтении вместо консервативных сегментов. Блоки синтении не обязательно представляют области непрерывного сходства между двумя геномами; вместо этого они могут состоять из множества коротких областей сходства, прерываемых непохожими областями и пробелами.Области сходства можно идентифицировать с помощью гомологичных генов, якорей (выравниваний, присутствующих в одной копии в обоих геномах) или других соответствующих маркеров; мы будем называть эти элементов .

При сравнении геномов перестановки элементов внутри блока синтении называются микроперестановками, или микроинверсиями , когда мы работаем в модели, состоящей только из инверсий. Перестройки порядка целых блоков синтении называются макроперестановками .

Расстояние реаранжировки — минимальное количество операций реаранжировки, необходимых для преобразования одного генома в другой; в монохромосомном случае — операции инверсии, а в мультихромосомном — операции инверсии, транслокации, деления и слияния.

Аргументы Певзнера и Теслера [9] основаны на вычислении частоты повторного использования точки останова для геномов человека и мыши. Частота повторного использования точки останова вычисляется как удвоенное расстояние перестановки, деленное на количество точек останова, где они вычисляются, как описано в [15].(Мы будем использовать общее число точек разрыва; вариант, использующий только внутренние точки разрыва и исключающий точки на концах хромосом, также использовался в [9] и [16], но здесь далее рассматриваться не будет. )

Модель случайной поломки предполагает низкую частоту повторного использования точки останова (близкую к единице, минимально возможное значение для частоты повторного использования точки останова), в то время как анализ перегруппировки человека/мыши выявил очень высокую частоту повторного использования точки останова (близкую к двум, максимально возможное значение). для скорости повторного использования точки останова).Основываясь на этом наблюдении, Певзнер и Теслер отвергли модель случайной поломки и предложили в качестве возможной альтернативы модель хрупкой поломки (которая согласуется с высокой частотой повторного использования точки останова).

Раздел 2. ST-Synteny: Алгоритм идентификации блока Sankoff и Trinh Synteny

В моделировании Санкоффа и Трина [10] использовался алгоритм идентификации блоков синтении, который мы называем ST-Synteny. Подчеркнем, что в [10] для формирования блоков синтении использовался ST-Synteny, а в [9] использовался другой алгоритм — GRIMM-Synteny. Хотя ST-Synteny кажется разумным подходом к идентификации блоков синтении, он никогда не применялся к реальным данным, а только к синтетическим данным. Мы сравниваем ST-Synteny с GRIMM-Synteny на синтетических и реальных данных.

GRIMM-Synteny — это параметрозависимая процедура, которая была разработана для искусственного разделения микроперестроек и макроперестроек, обнаруженных в реальных данных. Он был использован для идентификации блоков синтении в геномных проектах мыши [17], крысы [16,18] и курицы [19,20].Поскольку GRIMM-Synteny был впервые предложен в 2002 г., был опубликован ряд других подходов к идентификации блоков синтений, и недавнее исследование показало, что они в значительной степени совпадают [18]. Поскольку GRIMM-Synteny был протестирован на многих наборах данных и согласован с другими подходами, мы утверждаем, что в настоящее время он представляет собой консенсус в отношении подходов к идентификации блоков synteny.

Ниже мы покажем, что ST-Synteny дает несколько иные результаты, чем GRIMM-Synteny. Поскольку ST-Synteny дает результаты, которые не согласуются с существующими консенсусными взглядами на сравнительные геномные архитектуры, мы утверждаем, что их статья [10] выявила недостатки их собственного алгоритма ST-Synteny, а не недостаток в [9].

Аргументы Санкоффа и Трина [10] включали моделирование случайных перестановок в сочетании с их алгоритмом идентификации блока синтении (который мы называем ST-синтенией). Этот процесс следует модели случайной поломки, но несколько неожиданно приводит к высокой частоте повторного использования точек останова. Таким образом, они утверждали, что результат Певзнера-Теслера не имеет ничего общего с повторным использованием точки останова, а является просто артефактом идентификации блока синтении.

Для сравнения ST-Synteny с GRIMM-Synteny мы сначала воспроизвели процедуру, описанную в [10].Хотя Санкофф и Трин представили ее как единую процедуру, мы разбили ее на две фазы: (1) моделирование для создания синтетических реаранжированных геномов, которое мы приводим в разделе 4, и (2) алгоритм идентификации блоков синтении, который мы представляем. здесь.

Пусть π будет перестановкой со знаком на n элементов (представляющих гены, якоря или маркеры). Это представляет геном, который реаранжирован по сравнению с эталонным геномом 1, …, n . Пусть w, Δ — натуральные числа; w представляет максимальный размах микроперестройки, а Δ обозначает минимальное количество элементов в синтеническом блоке.

СТ-Синтении(π, w, Δ).

Шаг 1: Определите каждый элемент π как блок и итеративно объедините полученные блоки следующим образом: два соседних блока π объединяются, если они содержат элементы i и j, , где i или − i находится в одном блоке, а j или − j находится в другом блоке и | и и | ≤ w . Знаки элементов и блоков записываются, но игнорируются при объединении.

Шаг 2: Удалите любой «короткий» блок, содержащий менее Δ элементов (Δ = 3 в [10]).

Шаг 3: Санкофф и Трин [10] не указали, как определяются знаки блоков из составляющих их элементов. Знаки блока необходимы и важны для расчета расстояния перестановки. Например, переназначение «случайных» знаков (или присвоение всех положительных знаков) перестановке с низкой частотой повторного использования точки останова приведет (с высокой вероятностью) к перестановке с высокой частотой повторного использования точки останова, тем самым эмулируя артефакт повторного использования точки останова.

Эта реализация присваивала знаки синтеническим блокам в соответствии с двумя разными правилами: правилом мажоритарного знака, где блоку присваивается мажоритарный знак всех его элементов; и правило сепарабельной перестановки, описанное в [15]. Похоже, что правило знака большинства использовалось в [10] (подтверждено в частном сообщении от Санкоффа).

Раздел 3. Недостатки СТ-Синтены

Мы покажем, что ST-Synteny дает противоречивые результаты даже на небольших игрушечных примерах, а затем проанализируем проблемы, возникающие при масштабировании до более крупных синтетических или реальных наборов данных.

Пример на рисунке 1 представляет геномную точечную диаграмму для двух вымышленных геномов и иллюстрирует один из недостатков ST-Synteny. Поиск блоков синтении для этой перестановки является тривиальной задачей, и все другие алгоритмы идентификации блоков синтении будут выводить пять блоков синтений, но ST-Synteny сформирует один блок синтений для любой настройки параметров . Более того, при минимальной настройке w = 1 (см. ниже) ST-Synteny выдает один блок для 75% всех знаковых перестановок 5-го порядка! При других настройках параметра w, процент случаев, когда ST-Synteny не выявляет правильные блоки синтении, еще больше увеличивается.

Рисунок 1. Вложенные инверсии всегда объединяются с помощью ST-Synteny

Показан точечный график подписанной перестановки якорей (зеленый) между двумя геномами. Поскольку привязки подписаны, они представлены в виде сегментов с углом ± 45 градусов. Блоки построены фирмами СТ-Синтены (красный) и ГРИММ-Синтены (синий). ST-Synteny объединяет все в один блок. ГРИММ-Синтены производит правильные блоки. Если геном по горизонтальной оси принимается за перестановку идентичности 1 2 3 4 5, то геном по вертикальной оси представляет собой перестановку со знаком −3 2 −1 −5 4.

https://doi.org/10.1371/journal.pcbi.0020014.g001

Подробно опишем вопросы детализации форм блоков ST-Synteny. Дана одна инверсия

должно быть три блока и две точки останова. Однако нет такой настройки параметров ST-Synteny, которая позволяла бы это сделать. Если w = 0, остается 300 отдельных элементов (которые затем удаляются из-за того, что они слишком малы, если ∆ > 1). Если w ≥ 1, ST-Synteny образует один большой блок следующим образом.Во-первых, он выполняет ряд шагов объединения, в результате чего получаются ожидаемые 3 блока: Но итеративное объединение на этом не останавливается. Поскольку 100 и −101 теперь находятся в соседних блоках, а |101 − 100| = 1 ≤ w, объединяет первый и средний блоки. Поскольку −200 и 201 находятся в соседних блоках, они также объединены. В результате получается единый блок На самом деле перестановка со знаком, полученная путем применения любой серии вложенных инверсий к идентичности, будет повторно объединена в единый блок ST-Synteny всякий раз, когда w ≥ 1.(Для невложенных инверсий также могут происходить повторные объединения, что приводит к меньшему количеству блоков, чем необходимо. Для w = 1 и больших n, это происходит в ST-Synteny для более чем 77% подписанных перестановок длины n , которые были бы не иметь никакого повторного объединения, если знаки были должным образом учтены. Статья находится в подготовке.) Инверсии являются вложенными , когда две точки останова каждой инверсии лежат в пределах какой-либо одной существующей полосы (как определено предыдущими инверсиями) i, i + 1, i + 2, … , j или − j, − ( j − 1), … , − i ; «Лежать внутри» включает повторное использование одной или обеих конечных точек полосы. Например, рассмотрим эту серию инверсий:

При вводе последней строки ST-Synteny сначала объединяет -5 и 6 в блок (-5 6). Этот блок объединяется с -4 в (-5 6 -4). Затем 3, −2, 1 последовательно объединяются в него, в результате чего получается один блок (1 3 −5 6 −4 −2).

В дополнение к вышеперечисленным проблемам, если произошли микроперестановки или присутствует шум в виде ложных элементов, ST-Synteny имеет тенденцию вычислять несколько меньших блоков, а не более крупный блок с микроперестановками.ST-Synteny предполагает, что все маркеры (ортологичные гены или якоря последовательности) являются прямыми потомками самого последнего общего предка двух сравниваемых организмов. Это может быть разумным предположением при сравнении митохондриальных, хлоропластных или вирусных геномов, но между свободноживущими организмами ложные ортологи неизбежны, независимо от того, насколько тщательно составлены аннотации. Поскольку вычисляемые блоки меньше, это увеличивает вероятность их удаления из-за того, что они слишком короткие. Тем не менее, он увеличивает количество сообщаемых блоков, уменьшает их размер и увеличивает длину областей точек останова по сравнению с GRIMM-Synteny, что приводит к увеличению количества повторных использований точек останова даже для «случайных» перестановок.Можно возразить, что эту чрезмерную степень детализации можно исправить, просто изменив параметры ST-Synteny, но, как мы показали выше, часто нет выбора параметров, который решает проблему.

Причиной являются ложные элементы (которые показаны черными точками на иллюстрации Х-хромосомы далее в этой статье в разделе 5). Если ST-Synteny задана перестановка с блуждающими точками 200 и 300 затем (при малых w и Δ = 3) сначала образует блоки

Затем он удаляет маленькие блоки (100 101), (200), (300), оставляя два блока: (102 103 104) и (105 106 107).(Однако между этими двумя блоками нет точки останова перестановки.)

В отличие от этого, GRIMM-Synteny не требует, чтобы элементы в блоке были смежными для всех видов во входных данных. Сначала он образует блоки а затем удаляет маленькие блоки (200) и (300), оставляя один большой блок.

Еще одна проблема заключается в том, что алгоритм идентификации блоков синтении должен создавать одни и те же блоки, когда два генома меняются местами. Однако ST-Synteny не всегда симметричен в двух геномах, когда w ≥ 2.Например, рассмотрим следующую перестановку и ее обратную перестановку: При w = 2 блоки, выдаваемые ST-Synteny для π, равны в то время как выходные блоки для π −1 равны Это показано на рисунке 2.

Рисунок 2. Асимметричная обработка геномов с помощью ST-Synteny

При сравнении двух геномов ST-Synteny может производить разные блоки синтении в зависимости от того, какой из них выбран в качестве эталонного генома. Блоки синтении, произведенные ST-Synteny, показаны красными рамками вокруг анкеров.

(A) Геном, показанный на оси y , является эталонным геномом 1, …, 10, а геном, показанный на оси x , представлен как перестановка π этого.

(B) Показано точно такое же расположение якоря, но ось x принята за эталонный геном 1, …, 10, а ось y представляет собой перестановку π -1 . Хотя расположение якорей идентично, ST-Synteny с параметрами w = 2, Δ = 1 производит разные блоки в зависимости от того, какой геном является эталонным геномом.

https://doi.org/10.1371/journal.pcbi.0020014.g002

Раздел 4. ГРИММ-Синтены в сравнении с СТ-Синтены

В предыдущих разделах мы описали ST-Synteny, алгоритм идентификации блоков synteny в симуляциях Sankoff и Trinh. Они создали синтетические геномы для ввода в него следующим образом:

Моделирование
(n, m, k, w) .

Шаг 1: Создать m = 150 случайных инверсий эталонного генома 1, 2, …, n с n = 5000 «генов» (элементов).

Шаг 2: Создать 90 411 k 90 412 микроинверсий ровно 90 411 w 90 412 элементов, каждый случайным образом размещенных в геноме.

Шаг 3: Выведите полученную перестановку со знаком π из n элементов.

Затем они применяют ST-Synteny(π, w, Δ) для идентификации блоков synteny. Наконец, они применяют алгоритм GRIMM [21,22] к полученным блокам синтении, чтобы вычислить расстояние перестановки и частоту повторного использования точки останова.

Мы воспроизвели случайные симуляции Санкоффа-Тринха с помощью GRIMM-Synteny вместо ST-Synteny, чтобы проверить, сохраняется ли повторное использование точек останова в модели случайных поломок.Чтобы сравнить ST-Synteny с GRIMM-Synteny на одних и тех же смоделированных перестановках, нам нужно было определить параметры, которые лучше всего соответствуют параметрам, используемым в Sankoff и Trinh [10]. Это нетривиальная задача, поскольку ST-Synteny сильно отличается от всех других алгоритмов идентификации блоков synteny. Отметим также, что в описании ST-Synteny отсутствуют некоторые важные детали. Например, в то время как Певзнер и Теслер [15] подчеркивали важность признаков в анализе блоков синтении, Санкофф и Трин [10] даже не затрагивают этот важный вопрос.

GRIMM-Synteny(π, G, C ) имеет параметр максимального размера зазора G (который по духу аналогичен w в ST-Synteny) и параметр минимального размера кластера C (который по духу аналогичен на Δ в ST-Synteny). Для сравнения, ST-Synteny(π, w, Δ) был заменен на GRIMM-Synteny(π, G, C) с «похожими параметрами», чтобы идентифицировать блоки synteny и вычислить расстояние реверсирования и коэффициенты повторного использования точек останова. Хотя мы старались изо всех сил, чтобы соответствовать параметрам ST-Synteny и GRIMM-Synteny, мы подчеркиваем следующие проблемы.

Первое, что нас беспокоит, это то, что Санкофф и Трин рассматривают элементы (гены или якоря) как отдельные точки длины 1, и хотя ориентации элементов записываются, они не используют их. При этих обстоятельствах пороговое значение разрыва G = w + 3 и минимальный размер блока C = Δ являются наилучшим совпадением.

В наших симуляциях на рисунках 3, S1 и S2 мы использовали минимум Δ = 3 анкера на блок в обеих программах вместо исходного определения GRIMM-Synteny C в качестве минимального размера с точки зрения «пролета». блока; графики (не показаны) при использовании исходного определения C = 3 в GRIMM-Synteny аналогичны графикам, показанным с использованием вместо этого Δ = 3.Это изолирует различия в производительности алгоритмов и методов, используемых для объединения элементов в блоки.

Рисунок 3. Коэффициенты повторного использования точки останова в моделировании

Смоделированное количество микроперестановок равно тыс., и размер микроперестановки равен w. Одни и те же смоделированные перегруппировки были проанализированы тремя способами.

(A) Моделирование ST-Synteny со знаками блоков, определяемыми с использованием правила большинства знаков.

(B) Симуляция ST-Synteny со знаками блоков, определяемыми с помощью правила отделимой перестановки GRIMM-Synteny.

(C) Моделирование ГРИММ-Синтены. Анкеры имеют длину 1 для сравнения с ST-Synteny.

https://doi.org/10.1371/journal.pcbi.0020014.g003

Наша вторая проблема заключается в том, что ST-Synteny не использует знаки или длины элементов или промежутки между элементами; GRIMM-Synteny учитывает их и влияет на необходимость объединения элементов в один блок. Обычно, имея дело с порядками генов с неизвестной длиной гена и неизвестной длиной межгенного промежутка, GRIMM-Synteny присваивает длину 2 каждому гену (элементу), чтобы сделать два конца различимыми.Однако моделирование на рисунках 3, S1 и S2 выполняется с якорями длины 1 в обеих программах для более прямого сравнения.

Частота повторного использования точки останова

как функция количества микроинверсий показана на рисунке 3A (ST-Synteny, правило знаков большинства), 3B (ST-Synteny, правило разделимых знаков перестановки) и 3C (GRIMM-Synteny). Обратите внимание, что при k = 0 микроинверсии нет. Хотя микроинверсия размаха w = 1 меняет знак элемента, она игнорируется ST-Synteny, так что w = 1 служит только порогом для объединения блоков.

Обратите внимание, что по мере увеличения количества микроинверсий и увеличения интервала инверсии частота повторного использования точек останова при моделировании с ST-Synteny увеличивается намного быстрее, чем у GRIMM-Synteny. Санкофф и Трин [10] моделировали промежутки микроинверсии до десяти или 15 элементов, что соответствует примерно 6 и 9 Мб генома человека соответственно; это намного больше, чем средний интервал инверсии микроперестановок между человеком и мышью, рассчитанный GRIMM-Synteny. Поэтому эти нереально большие пролеты исключены из нашего моделирования.Для сравнения: средний размер микроперестроек при сравнении человека и мыши составляет 196 кб, что соответствует « w = 0,33» (хотя w может быть только целым числом), а средний размер микроперестройки составляет приблизительно 7 кб. Это означает, что наиболее реалистичные модели Санкоффа и Трина [10] соответствуют очень малым w (хотя даже w = 1, 2 соответствуют перегруппировкам с более длинным средним размахом, чем в случае сравнения человек/мышь).Для этих параметров и при правильном алгоритме идентификации блоков синтении частота повторного использования точки останова низка для модели случайных поломок, что сводит на нет аргументы Санкоффа-Тринха против модели хрупких поломок.

Чтобы еще больше сопоставить две модели, были рассчитаны проценты областей точки разрыва всего смоделированного генома, обозначенные как bk, , и они показаны на рисунке S1 для ST-Synteny и GRIMM-Synteny. Области точек останова из ST-Synteny намного больше по сравнению с GRIMM-Synteny, что опровергает еще один аргумент Санкоффа-Тринха против явления повторного использования случайных поломок (чем больше области точек останова, тем больше шансов наблюдать повторное использование точек останова, даже в модель случайных поломок).

Количество элементов, хранящихся в каждой модели, показано на рисунке S2. По мере роста количества микроперестановок СТ-Синтения удаляет элементы быстрее, чем ГРИММ-Синтения, за счет удаления небольших блоков. То, что ST-Synteny выдает меньше блоков, чем GRIMM-Synteny, для относительно небольших (хотя все еще нереально больших с точки зрения реальных геномных архитектур человека/мыши) w и больших k (неопубликованные данные) можно объяснить комбинацией удаления маленькие блоки и ошибочное объединение больших.

Раздел 5. Сравнение GRIMM-Synteny и ST-Synteny: точечные диаграммы

Мы иллюстрируем некоторые различия между ST-Synteny и GRIMM-Synteny с помощью синтетического набора данных (рис. 4) и реальных данных человека/мыши (рис. 5).

Рис. 4. GRIMM-Synteny и ST-Synteny на одних и тех же смоделированных данных

Точечный график генома показан жирным зеленым цветом. Блоки синтении, идентифицированные GRIMM-Synteny, показаны синими прямоугольниками, а блоки ST-Synteny — пунктирными красными прямоугольниками.Когда координаты блока совпадают, это отображается пунктиром синего/красного цвета. Знаки блоков показаны диагоналями. Крошечные блоки были искусственно увеличены для видимости и на самом деле не выступают в другие блоки. Смоделированный геном человека имеет якоря от 1 до 5000. Смоделированный геном мыши был сгенерирован как π = Simulation(5000, 15, 500, 5). Блоки идентифицировали с помощью GRIMM-Synteny(π, 8, 3) и ST-Synteny(π, 5, 3).

https://doi. org/10.1371/journal.pcbi.0020014.g004

Рисунок 5. Блоки синтении между X-хромосомами человека и мыши

Блоки для X-хромосом были сконструированы с помощью GRIMM-Synteny (синий) на основе координат якоря и ST-Synteny (красный) на основе только якорных перестановок. Якоря показаны зеленым цветом. Мелкие блоки, удаленные ST-Synteny, показаны черным цветом.

https://doi.org/10.1371/journal.pcbi.0020014.g005

Мы сконструировали синтетический геном π = Simulation(5000, 15, 500, 5). Геномная точечная диаграмма и блоки синтении, полученные ST-Synteny и GRIMM-Synteny для этого генома с одной настройкой параметров обнаружения, показаны на рисунке 4.Коэффициент повторного использования точек останова составляет 1,31 и 1,09 для блоков, выводимых ST-Synteny и GRIMM-Synteny, соответственно. Обратите внимание, что ST-Synteny объединяет блоки, которые должны быть отдельными. Для каждого w от 1 до 5 мы сделали десять смоделированных геномов π = Simulation(5000, 15, 500, w ). Средняя частота повторного использования точки останова в ST-Synteny(π, w, 3) возрастает с 1,07 до 1,30, в то время как в GRIMM-Synteny(π, w + 3, 3) частота повторного использования точки останова увеличивается только с 1,03 до 1.09.

Чтобы дополнительно проиллюстрировать разницу между ST-Synteny и GRIMM-Synteny в идентификации блоков synteny, оба метода были применены к якорям человека/мыши на X-хромосоме (Национальный центр биотехнологической информации [NCBI] Human version 34, Mouse version 30). Имеется 58 930 якорей, а длина Х-хромосомы человека составляет 153 692 391 пару оснований (пн). Использовалась полная версия GRIMM-Synteny, учитывающая координаты, длины и знаки привязки с минимальным порогом размера блока 1 Мб и максимальным порогом разрыва 1 Мб.ST-Synteny был запущен с w = 378 и Δ = 379. Поскольку ST-Synteny использует только перестановку якорей, мы наносим полученные блоки из обеих программ вместе с перестановками привязок. Результаты показаны на рисунке 5 и в таблице 1. GRIMM-Synteny идентифицировала десять блоков с расстоянием микроинверсии 825. ST-Synteny идентифицировала намного больше блоков synteny, чем GRIMM-Synteny. Количество блоков в ST-Synteny не уменьшалось резко при увеличении порога w (данные не показаны).

Если сравнить рисунки 4 и 5, то можно заметить, что ST-Synteny выдает больше блоков, чем GRIMM-Synteny на рисунке 5, но меньше на рисунке 4. Ни разница на порядок в количестве маркеров (5000 генов против 59000 якорей) ни модель случайного или хрупкого разрушения не несет ответственности за эту «перестановку ролей». Как отмечалось в разделе 3, одна из тенденций ST-Synteny заключается в объединении блоков, которые должны быть разделены, а другая — неспособность объединять блоки synteny при наличии коротких «неуместных» инверсий или ложных ортологов.На рисунке 4 количество макроперестроек и микроперестановок было выбрано намного меньшим, чем в предыдущих симуляциях, чтобы блоки синтении были разборчивыми; в этом случае преобладает первый дефицит ST-Synteny, что приводит к меньшему количеству блоков, чем от GRIMM-Synteny. Когда количество перестроек становится большим или когда данные становятся зашумленными (как в случае реальных геномных данных [рис. 5]), преобладает второй дефицит ST-Synteny. В отличие от этого, GRIMM-Synteny был разработан для фильтрации шума, тем самым идентифицируя более реалистичные блоки synteny.

Раздел 6. Улучшенное моделирование, включая якоря различной длины и микроперестановки

В предыдущих симуляциях распределения длин и координат анкеров игнорировались, а перестановки выполнялись на анкерах (элементах) единичной длины. Чтобы лучше моделировать рандомизированные перестройки, GRIMM-Synteny применяли к смоделированным монохромосомным и мультихромосомным геномам с якорями различной длины. В смоделированном геноме рандомизированные сценарии перестроек генерировались на уровне нуклеотидов.Детали моделирования следующие.

Шаг 1: Возьмите человеческие координаты якорей выравнивания человека/мыши, полученные из версии 34 NCBI человека и версии 30 мыши. В моделировании монохромосомного генома использовались якоря из Х-хромосомы. При моделировании мультихромосомного генома использовались все якоря.

Шаг 2: Для однохромосомной симуляции сгенерируйте шесть инверсий в случайных местах. Инверсии в этом геноме представляют собой настоящие инверсии, поскольку «то, что ломается в Х-хромосоме, остается в Х-хромосоме.«Для мультихромосомного моделирования сгенерируйте 150 пар точек разрыва в случайных местах генома. Когда пара точек разрыва лежит на одной хромосоме, производят инверсию, а когда они лежат на разных хромосомах, выполняют транслокацию. Если точка останова находится внутри якоря, она случайным образом перемещается непосредственно слева или справа от якоря; анкеры не разделены.

Шаг 3: Создать k микроинверсий, случайно расположенных в геноме. Промежутки инверсий случайным образом распределены между 1 и W нуклеотидами.Поскольку распределение размахов инверсий неизвестно, равномерное распределение, используемое при моделировании, выбирается несколько произвольно.

Шаг 4: Добавьте шум к смоделированным геномам следующим образом. Случайным образом выберите 0,2% якорей как шумные. Переместите каждый шумный якорь в случайное место в геноме и случайным образом выберите его знак.

Шаг 5: Примените алгоритм GRIMM-Synteny для идентификации блоков synteny и вычислите инверсионное или мультихромосомное расстояние и коэффициент повторного использования точки останова между человеческим и смоделированным геномами.Пороги размера блока и разрыва были установлены на 1 Мб.

Результаты однохромосомного моделирования перечислены в таблице 2, а результаты мультихромосомного моделирования перечислены в таблице 3. Как и в предыдущем разделе, bk представляет собой процент генома в областях точек разрыва. r e — это процент блоков, у которых хотя бы одна из двух концевых точек привязки смоделированного генома вышла из строя по сравнению с таковыми у исходных точек привязки блока человека.

Аналогичное моделирование было также выполнено с якорями выравнивания X-хромосомы мыши/крысы, которые предположительно дают больше сигнала и меньше шума, чем якоря выравнивания человека/мыши. Якоря были получены из мышиного NCBIM33 и крысиного RGSC3.4 с использованием BLASTZ [23]. GRIMM-Synteny идентифицировал 18 блоков синтении с расстоянием микроинверсии 4287. Частота повторного использования точки останова составляет 1,58. Используя эти параметры в качестве эталона, смоделированные геномы начинались с мышиных координат якорей X-хромосомы мыши/крысы, за которыми следовали девять макроинверсий и до 5000 микроинверсий на основе модели случайных поломок.К полученным геномам применяли GRIMM-Synteny. Результаты перечислены в Таблице 4. Обратите внимание, что когда максимальный интервал инверсии составляет W = 1 Мб, частота повторного использования точки останова в основном равна 1,00, что является теоретическим значением для модели случайного прерывания.

Можно заметить, что в таблице 3 коэффициент повторного использования составляет не менее 1,12 при модели случайных поломок, тогда как теоретически он должен быть равен 1,00. Разница объясняется размером блока и пороговыми значениями гэпа, используемыми в GRIMM-Synteny. Чтобы показать влияние порогов на частоту повторного использования точки останова, GRIMM-Synteny был выполнен на смоделированном наборе данных со 150 макроинверсиями и без микроинверсии.Размер блока и порог разрыва уменьшены с 1 Мб до 10 кб. Результирующие показатели повторного использования точек останова показаны в таблице 5. По мере уменьшения порога с 1 МБ до 10 КБ частота повторного использования точек останова уменьшается с 1,12 до 1,02. Однако побочный эффект порогов невелик и сам по себе не объясняет высокую частоту повторного использования точек останова, обнаруженную в реальных данных генома человека/мыши, если предполагается модель случайного разрушения.

Раздел 7. Анализ полногеномных реаранжировок у человека и мыши

Все симуляции, будь то перестановки или последовательности, были основаны на рандомизированных перестановках.Как они соотносятся с перестановками человека/мыши? Применение алгоритма GRIMM-Synteny к реальным данным выравнивания человека/мыши с размером блока и порогом разрыва 1 Мб дало 294 блока synteny и расстояние генома 262. Частота повторного использования точки останова составила 1,67.

Мы дополнительно изучили начальные и конечные якоря в каждом блоке синтении, чтобы получить реалистичные параметры для микроперестановок. В отсутствие микроперестроек конечные якоря каждого блока синтении сохраняются между двумя геномами.Микроперестройки, действующие на концах блоков синтении, разрушают эту консервацию; например, конечный якорь в синтениевом блоке человека может не быть конечным якорем в синтенийном блоке мыши. Процент блоков, у которых хотя бы один из двух конечных анкеров вышел из строя, обозначается как r e . Из 294 блоков синтении человека/мыши 115 имели неупорядоченные якоря на одном или обоих концах; вместе они дают r e 39,1%.

294 блока синтении человека/мыши содержали 10 900 микроперестроек.Из этих микроперестроек средний размах инверсии составил 196 т.п.н., медиана 7 т.п.о., а максимальная 13,9 млн.п.о. По количеству анкеров средний размах инверсии составил 78, медианный — четыре, а максимальный — 7632. Области точки разрыва составили 9,06% генома человека. Для сопоставимой скорости повторного использования точки останова диапазон микроперестановок должен быть нереально большим. Значения k и r e в данных человека/мыши намного выше, а значение bk намного ниже, чем значения из смоделированных геномов, сгенерированных с помощью модели случайного разрушения.Это может указывать на то, что перестройки или точки разрыва не распределены случайным образом по всему геному.

Как показано в моделировании рандомизированных перестроек, повторное использование точки останова увеличивалось с увеличением количества микроперестановок и продолжительности микроинверсий. При анализе перегруппировок человека и мыши, основанном на последовательностях, было обнаружено около 10 000 микроперестроек внутри 294 блоков синтении. Когда сравнение человека и мыши проводилось на основе порядка генов, внутри 373 блоков синтении было обнаружено только 98 микроперестроек. Частота повторного использования микроперестановок в точке останова составляла всего 1,02. Данные сравнения последовательностей и порядка генов приведены в таблице 6.

Раздел 8. Модель межгенного разрыва

Из-за чего одни регионы ломаются, а другие нет? Это биофизическое ограничение или ограничение отбора? Одно наблюдение, которое мы можем сделать, заключается в том, что с меньшей вероятностью происходят разрывы внутри генов (и внутри регуляторных областей), поскольку отбор обычно работает против таких разрывов. Средняя длина межгенных областей генома человека (версия NCBI 34) составляет примерно 80 т.п.н., что намного меньше, чем средняя длина областей точек разрыва.Всего в синтенных блоках насчитывается 21 911 межгенных областей со средней длиной 77 т.п.н., в то время как средняя длина 2116 межгенных областей в областях точек разрыва намного выше 100 т.п.н. Распределение длины межгенных областей человека показано на рисунке 6. В то время как большинство межгенных областей короткие и находятся в пределах блоков синтении (рис. 6A), обратите внимание на рисунок 6B, что из 241 длинной межгенной области с длиной более 1 Мб, 32 находятся в областях точек останова или между областями точек останова и блоками синтении.Если предположить, что точки разрыва случайным образом возникают внутри межгенных областей (и почти запрещены внутри генов), то геноплотные области с малой общей длиной межгенных областей редко будут разрываться просто случайно, таким образом имитируя то, что было названо «сплошными областями». в [9].

Рисунок 6. Распределение межгенных областей человека в блоках синтении или в областях точек разрыва

(A) Области длиной ≤1 Мб и (B) длиной >1 Мб, которые находятся в блоках синтении (синие) и в областях точек разрыва или между точками разрыва области и блоки синтении (красные).Данные получены из NCBI Human версии 34 и Mouse версии 30.

https://doi.org/10.1371/journal.pcbi.0020014.g006

Чтобы исследовать гипотезу о том, что длинные межгенные области могут быть потенциальными горячими точками перестроек, мы провели следующее моделирование. Предположим, что геном состоит из 90 411 G 90 412 + 90 411 I 90 412 нуклеотидов, где 90 411 G 90 412 — общий размер генов, расширенных вышестоящими регуляторными областями, а 90 411 I — общий размер оставшихся межгенных областей.Для учета вышестоящих регуляторных областей (которые также вряд ли будут нарушены) мы искусственно удлинили каждый ген на область длиной R выше по течению, тем самым уменьшив размеры соответствующих межгенных областей на R нуклеотидов. Хотя регуляторные области в геномах млекопитающих часто расположены далеко от начала гена, средний размер таких регуляторных областей остается неизвестным. Мы отмечаем, что исследования перестройки генома могут пролить свет на размер регуляторных областей.Например, если произошла перестройка (или даже микроперестройка) между человеком и шимпанзе R нуклеотидов от старта гена, вероятно, регуляторная область для этого гена короче, чем R (иначе перестройка нарушила бы регион регулирования). Хотя к таким выводам следует относиться с осторожностью (например, они неприменимы, если гены человека и шимпанзе проявляют очень разные регуляторные паттерны), они полезны в качестве первого приближения к сложной в других отношениях проблеме разграничения регуляторных областей.Ниже мы рассмотрим еще более сложную задачу оценки среднего размера регуляторных регионов R на основе анализа перегруппировок.

Заметим, что если длина регуляторных участков установлена ​​равной R, межгенные участки короче R могут исчезнуть (в зависимости от ориентации генов), что приведет к «слиянию» генов, разделенных короткими межгенными участками и поощрение повторного использования точек останова в других местах. В первом приближении мы предполагаем, что вероятность поломки каждого нуклеотида в генах и регуляторных областях равна 0, а вероятность поломки каждого нуклеотида в межгенных областях равна 1/ I (обратите внимание, что I уменьшается по мере того, как R увеличивается). Мы выполнили 240 случайных макроперестановок с точками останова, выбранными этим распределением, и применили GRIMM-Synteny (с использованием минимального порога размера блока 1 МБ и максимального порога промежутка 1 МБ) для вычисления блоков, а затем скорости повторного использования точки останова. Мы сравнили эту модель межгенного разрыва со стандартной моделью случайного разрыва (то же моделирование, за исключением того, что вероятность разрыва одинакова для всех нуклеотидов в геноме). На рисунке 7 показано, как частота повторного использования точки останова изменяется по мере увеличения размера R, областей регулирования.Можно заметить, что коэффициент повторного использования точек останова уже значителен (примерно 1,5) даже для относительно скромных размеров регуляторных регионов. Более того, для R ≈ от 90 до 140 кб частота повторного использования точки останова аналогична скорости повторного использования точки останова человека/мыши, равной 1,65, о которой мы сообщали в [16]. Поэтому мы утверждаем, что длинные регуляторные регионы и неоднородность распределения генов в геномах млекопитающих могут обеспечить, по крайней мере, частичное объяснение модели хрупкого разрушения. Однако более реалистичное объяснение (ввиду того, что оценка R ≈ 90–140 т.п.н. представляется довольно высокой) состоит в том, что сочетание длинных регуляторных районов, неравномерного распределения размеров межгенных регионов и др. до сих пор неизвестны) факторы вызывают повторное использование высокой точки останова.

Рисунок 7. Частота повторного использования в точке останова как функция размера вышестоящей регуляторной области в моделировании межгенных разрывов

Гены из версии 34 NCBI человека были удлинены на длину от 0 до 210 т.п.н. вверх по течению, таким образом укорачивая или удаляя межгенные области. В модели межгенного разрыва моделируемые реверсии выполнялись с точками разрыва, выбранными единообразно среди нуклеотидов, оставшихся в укороченных межгенных областях, тогда как в модели случайного разрыва точки разрыва выбирались единообразно среди всех нуклеотидов в геноме. Затем были получены блоки и вычислена частота повторного использования точки останова.

https://doi.org/10.1371/journal.pcbi.0020014.g007

Обсуждение

Алгоритм GRIMM-Synteny в Певзнере и Теслере [9] представляет собой параметрозависимую процедуру, которая была разработана для несколько искусственного разделения микроперестановок и макроперестроек. Важным вкладом Санкоффа и Трина [10] является привлечение внимания к тому факту, что эти параметры могут влиять на надежность анализа перегруппировок.Нет никаких сомнений в том, что отбрасывание небольших блоков влияет на вывод о перестановке и компенсирует расчеты повторного использования точки останова. В этой статье исследуется вопрос о том, достаточно ли велико это смещение, чтобы создать видимость повторного использования больших точек останова даже в модели случайных поломок. Мы показываем, что это смещение относительно мало по сравнению с вычислительным экспериментом Санкоффа и Трина [10], и объясняем, почему наше моделирование и моделирование Санкоффа и Трина [10] расходятся.

Работа Певзнера и Теслера [9] основана на модели реверсий/транслокаций/слияний/делений геномных перестроек и игнорирует другие типы перестроек, например.г., крупномасштабные транспозиции, которые считаются редкими. Они не связывают явление повторного использования точки останова с определенным типом перестановки и не исключают возможности того, что значительная часть повторного использования точки останова вызвана еще одной операцией перестановки. Например, если предположить, что транспозиции происходят часто, то они могут составлять значительную часть повторного использования точек останова, поскольку каждая транспозиция создает три (а не две) точки останова, что немедленно увеличивает частоту повторного использования точек останова, как мы ее определили.В этом случае может потребоваться анализ гигантских циклов в графе точек останова для оценки параметра скорости повторного использования точек останова (серия транспозиций в случайной модели не привела бы к гигантским циклам, которые мы наблюдали на графике точек останова человека/мыши). .

Эволюционные точки останова часто путают с точками останова рака. Мы подчеркиваем, что хорошо зарекомендовавшие себя повторяющиеся контрольные точки в отношении рака и бесплодия не имеют ничего общего с эволюционными контрольными точками и не предоставляют подтверждающих доказательств хрупкости в эволюционном контексте.Певзнер и Теслер [9] не ответили на вопрос: «Где повторяющиеся точки разрыва в геномах млекопитающих?» и в настоящее время проводятся исследования для определения сравнительных геномных и филогенетических доказательств повторного использования контрольных точек. Например, Мерфи и др. [24] недавно проанализировали геномную архитектуру восьми геномов млекопитающих, полученных либо в результате экспериментов по секвенированию, либо в результате крупномасштабных экспериментов по радиационно-гибридному картированию, и наблюдали повторное использование контрольных точек в независимых линиях.

Еще один открытый вопрос — сколько хрупких участков в геноме человека.Певзнер и Теслер [9] не исключали возможности того, что большинство повторных использований точек останова вызвано очень небольшим количеством уязвимых сайтов. Например, можно представить модель только с одним или двумя хрупкими участками, при этом все перегруппировки имеют один конец в хрупкой области, а другой конец выбирается случайным образом. Такая модель хрупких узлов не противоречит анализу Певзнера и Теслера [9]. Исследования гигантских циклов в графе точек останова могут снова пролить свет на то, верна ли модель хрупких хабов.

Работа Санкоффа и Трина является важным вкладом в исследования эволюции хромосом, которые повысили осведомленность о важности идентификации блоков синтении и анализа микроперестроек.К сожалению, их опровержение феномена повторного использования точки останова было омрачено недостатками их собственного алгоритма идентификации блоков синтении и нереалистичным выбором параметров в их процедуре моделирования. Поэтому мы утверждаем, что феномен повторного использования точки останова реален до тех пор, пока не появится следующий критический аргумент против него.

Идентификация белков с помощью анализа спектральных сетей

Аннотация

Достижения в области тандемной масс-спектрометрии (МС/МС) неуклонно увеличивают скорость получения спектров МС/МС.В результате существующие подходы, которые сравнивают спектры с базами данных, уже сталкиваются с узким местом, особенно при интерпретации спектров модифицированных пептидов. Здесь мы исследуем концепцию, позволяющую выполнять поиск в базе данных МС/МС без сравнения спектра с базой данных. Мы предлагаем воспользоваться спектральными парами, которые представляют собой пары спектров, полученных от перекрывающихся (часто не триптических) пептидов или от немодифицированных и модифицированных версий одного и того же пептида. Наличие спектра модифицированного пептида в паре со спектром немодифицированного пептида позволяет разделить префиксные и суффиксные лестницы, значительно уменьшить количество шумовых пиков и создать небольшое количество реконструкций пептидов, которые, вероятно, будут содержать правильные один.Таким образом, поиск в базе данных МС/МС сводится к чрезвычайно быстрому сопоставлению с образцом (вместо трудоемкого сопоставления спектров с базами данных). В дополнение к скорости наш подход обеспечивает уникальную парадигму для выявления посттрансляционных модификаций с помощью анализа спектральных сетей.

Сегодня большинство идентификаций белков выполняется путем сравнения спектров с базами данных с использованием таких программ, как SEQUEST (1) или Mascot (2). Хотя эти инструменты бесценны, они уже слишком медленны для сопоставления больших наборов данных тандемной масс-спектрометрии (МС/МС) с большими базами данных белков, особенно когда выполняется трудоемкий поиск посттрансляционных модификаций (ПТМ).Мы утверждаем, что необходимы новые решения для работы с потоком данных, производимых проектами протеомики дробовика. Крейг и Бивис (3) и Таннер и др. (4) недавно разработал алгоритмы X!Tandem и InsPecT для сокращения (X!Tandem) и фильтрации (InsPecT) баз данных последовательностей и, таким образом, ускорения поиска. Однако этим инструментам по-прежнему приходится сравнивать каждый спектр с (меньшей) базой данных.

Здесь мы исследуем концепцию, позволяющую выполнять поиск в базе данных МС/МС без сравнения спектра с базой данных.Мы предлагаем использовать спектральных пар , которые представляют собой пары спектров, полученных от перекрывающихся (часто не триптических) пептидов или от немодифицированных и модифицированных версий одного и того же пептида. Большинство современных протоколов пытаются свести к минимуму количество спектральных пар, потому что нетриптические и химически модифицированные пептиды еще больше усложняют спектральную интерпретацию и приводят к увеличению времени анализа. MacCoss и др. (5) первыми осознали потенциал перекрывающихся пептидов для идентификации модифицированных белков и недавно продемонстрировали увеличение производительности модифицированных схем расщепления (6).Кроме того, даже образцы, расщепленные трипсином, обычно содержат много пептидов, которые отличаются друг от друга делецией концевых аминокислот (полутриптические пептиды). Кроме того, существующие экспериментальные протоколы уже непреднамеренно генерируют множество химических модификаций, и было показано, что существующие наборы данных MS/MS часто содержат модифицированные версии для многих пептидов (7, 8).

Хотя спектральные пары кажутся избыточными, они открывают ранее неизведанные вычислительные возможности. Имея пару спектров (один для модифицированного, а другой для немодифицированного пептида), можно ( i ) разделить лестницы ионных масс b (префикс) и y (суффикс), ( ii ) значительно уменьшить количество шумовых пиков и ( iii ) распространить идентификацию модификаций от спектра к спектру, тем самым обнаруживая непредвиденные и множественные модификации.Таким образом, спектральные пары позволяют генерировать небольшое количество реконструкций пептида, которые с большой долей вероятности содержат правильную. Вместо создания покрывающих наборов коротких меток из 3–4 аминокислот (4, 9) этот подход генерирует покрывающий набор пептидов длиной 7–9 аминокислот. Этот набор обычно имеет единственное идеальное совпадение в базе данных, которое может быть мгновенно найдено путем хеширования, что устраняет необходимость когда-либо сравнивать спектр с базой данных. Другие подходы (10–13), которые сравнивают пептидные последовательности de novo с базой данных белковых последовательностей, получают запрашиваемые последовательности из отдельных спектров МС/МС (вместо спектральных пар) и, таким образом, страдают относительно низкой точностью секвенирование пептида de novo (14–16).В дополнение к улучшениям в секвенировании пептидов de novo , шумоподавление спектров и распространение модификаций также улучшают поиск в стандартной базе данных МС/МС.

Пусть S ( P ) и S ( P *) — спектры немодифицированного пептида P и его модифицированной версии P * (спектральная пара). Суть нашей вычислительной идеи заключается в простом наблюдении, что «база данных», состоящая из одного пептида P , — это все, что нужно для интерпретации спектра S ( P *). § Таким образом, если известно P , нет необходимости сканировать S ( P *) по базе данных всех белков. Конечно, на самом деле никто не знает P , а доступен только S ( P ). Ниже мы показываем, что спектр S ( P ) почти так же полезен, как пептид P для интерпретации S ( P *) и, таким образом, может устранить необходимость поиска в базе данных.Это наблюдение открывает возможность замены поиска в базе данных МС/МС поиском спектральных пар и дальнейшей интерпретацией пептидов, которые их произвели. Мы показываем, что эти проблемы можно решить, используя уникальную комбинацию de novo и методов спектрального выравнивания (7, 17) для преобразования любой заданной спектральной пары ( S 1 , С 2 ) в виртуальные спектры S 1,2 и S 2,1 чрезвычайно высокого качества, с почти идеальным разделением ионов b — и y и уменьшением количества шумных пиков в 12 раз.

В дополнение к быстрой идентификации пептидов наш подход также обеспечивает уникальную парадигму для идентификации химических и посттрансляционных модификаций без использования базы данных. Недавно утверждалось (7, 18, 19), что явление модификаций гораздо более распространено, чем считалось ранее, и для выявления этих модификаций выступал за слепой поиск в базе данных. В частности, слепой поиск в базе данных недавно привел к наиболее полному набору PTM, идентифицированных в хрусталиках человека в возрасте (8).Удивительный вывод нашего подхода заключается в том, что мы можем обнаружить почти все модификации катарактных хрусталиков (ранее идентифицированные с помощью слепого поиска в базе данных) и даже обнаружить некоторые ПТМ, пропущенные в исх. 8.

Далее мы объединяем спектральные пары в спектральную сеть , в которой каждая вершина соответствует спектру, а каждое ребро — спектральной паре. На рис. 1 показана спектральная сеть из 945 спектров МС/МС [соответствующих различным пептидам из образца белка β-субъединицы киназы κB ядерного фактора (IKKβ)], иллюстрирующая ключевое преимущество спектральных сетей по сравнению с традиционным поиском по базе данных МС/МС.Традиционные подходы к идентификации пептидов рассматривают каждый из этих спектров отдельно, не пытаясь сопоставить различные спектры родственных пептидов. В результате теряются важные сведения, которые можно извлечь из структуры спектральной сети. Наш подход объединяет все эти спектры в 117 кластеров (вершин сети) и выявляет множество спектральных пар (ребер сети). Это приводит к одновременному анализу всех спектров и, таким образом, повышает достоверность идентификации пептидов, подкрепляет предсказания модификаций с помощью коррелированных спектров и устраняет необходимость заранее «угадывать» модификации.Более того, спектральная сеть даже позволяет собрать эти спектры в неповрежденный 34-аа сегмент белка IKKβ, тем самым открывая дверь для секвенирования белков дробовика (20).

Рисунок 1.

Спектральная сеть, построенная путем сопоставления спектров перекрывающихся пептидов. ( Left ) Спектральная сеть для 945 спектров, представляющих различные пептиды из фрагмента IVDLQRSPMGRKQGGTLDDLEEQARELYRRLREK белка IKKβ человека.Спектральная сеть построена без каких-либо знаний об аннотациях пептидов. Каждая из 117 вершин в спектральной сети соответствует либо одному спектру МС/МС, либо согласованному спектру нескольких спектров МС/МС одного и того же пептида (полученного путем кластеризации). Две вершины соединены ребром, если соответствующие спектры образуют спектральную пару. ( Center ) Подсеть всей спектральной сети, охватывающая фрагмент KQGGTLDDLEEQAREL (показан красными вершинами Left ).( Right ) Парные пептиды, обнаруженные путем анализа спектральной подсети Center с помощью нашей процедуры обнаружения парных спектров.

Результаты

Интерпретация спектральных пар/звезд.

Совокупность всех спектров, совпадающих со спектром S в спектральной сети, называется спектральной звездой . Например, спектральная звезда для спектра, полученного из пептида 3 на рис.1 состоит из множества спектров пяти разных пептидов. Высокое качество спектров виртуальных звезд, полученных из спектральных пар и спектральных звезд, делает интерпретацию этих спектров простой [см. вспомогательную информацию (SI) рис. 4 и таблицу SI 2]. Поскольку спектры звезд характеризуются отличным разделением лестниц ионов b — и y и лишь небольшим количеством шумовых пиков, реконструкция de novo этих спектров дает надежные последовательности (с промежутками), которые обычно содержат длинные правильные теги. В среднем de novo реконструкций наших звездных спектров правильно идентифицируют 72% всех возможных «разрезов» в пептиде [т. y ионов) в пептиде длиной n ]. Это очень большое число, поскольку первое (например, b 1 ) и последний (например, b n−1 ) b ионы редко присутствуют в спектрах МС/МС, что делает почти невозможным объяснение >80% всех разрезов в образце IKKβ.Более того, необъяснимые пики в среднем составляют лишь 5% от общей оценки реконструкции de novo .

Сравнительный анализ в МС по своей природе затруднен из-за нехватки проверенных вручную больших образцов МС/МС, которые представляют собой «золотые стандарты». Хотя набор данных ISB (21) представляет собой такой золотой стандарт для немодифицированных пептидов, в настоящее время нет больших проверенных выборок спектров модифицированных пептидов. В качестве компромисса мы протестировали наш алгоритм, используя набор из 11 760 спектров из набора данных IKKβ, которые были аннотированы с помощью InsPecT и подробно изучены в недавних публикациях (4, 7), включая сравнения с SEQUEST, Mascot и X!Tandem.Весь наш анализ спектральных сетей (начиная с кластеризации и заканчивая интерпретацией) этого набора данных IKKβ занял 9 минут на обычном настольном компьютере (Intel Pentium 4, тактовая частота 2,8 ГГц). Мы сравнили нашу производительность с результатами, полученными с помощью InsPecT, который, как было показано ранее, на 2 порядка быстрее, чем SEQUEST для ограниченного поиска в базе данных (4). Даже при поиске в базе данных среднего размера, такой как набор Swiss-Prot из 13 749 белков человека, время выполнения InsPecT составило 55 минут (полные результаты времени выполнения приведены в СИ Приложение А ).Таким образом, наш метод спектральных сетей (который находит как немодифицированные, так и модифицированные пептиды) в шесть раз быстрее, чем InsPecT (в режиме поиска только немодифицированных пептидов). Ниже мы приводим результаты идентификации как спектральных пар, так и спектральных звезд.

InsPecT идентифицировал 515 немодифицированных пептидов в образце IKKβ, 413 из которых имеют какой-либо другой префикс/суффикс или модифицированный вариант в образце и, таким образом, поддаются спариванию. Нам удалось найти спектральные пары для 386 из этих 413 пептидов.Более того, 339 из этих 386 пептидов имели спектральные пары, происходящие от двух (или более) разных пептидов, т. е. пары ( S 1 , С 2 ) и ( S 1 , С 3 ), так что спектры S 2 и S 3 происходят из разных пептидов.

Среднее количество (с пробелами) реконструкций de novo (объясняющих не менее 85% оптимального результата) для спектров звезд составляло 10.4. Хотя спектры звезд создают небольшое количество реконструкций с пропусками, эти последовательности с пропусками плохо подходят для быстрых запросов на принадлежность к базе данных. Поэтому мы превращаем каждую реконструкцию de novo с пробелами в реконструкцию без пробелов, заменяя каждый пробел всеми возможными комбинациями аминокислот. В среднем этот подход дает 165 последовательностей длиной 9,5 а.о. на спектр; для 86% всех пептидов одна из этих меток является правильной.

Хотя проверка запросов на членство для 165 последовательностей может быть выполнена очень быстро с индексированием базы данных (в лучшем случае ожидается, что одна из этих последовательностей присутствует в базе данных), использование таких сверхдлинных тегов (9.в среднем 5 а.о.) для стандартного поиска в базе данных: тег длиной 6–7 а.о. также обычно имеет уникальное совпадение в базе данных. Однако длинные метки из 9–10 а.о. имеют явные преимущества при сложных нестандартных поисках в базе данных, например, при обнаружении новых вариантов альтернативного сплайсинга с помощью анализа МС/МС. Более того, для стандартного поиска можно сгенерировать меньший набор более коротких (6–7 аа) тегов на основе исходной реконструкции с пропусками и использовать их для запросов на членство. Мы использовали полученную реконструкцию с пробелами для создания таких коротких 6-мерных тегов.В среднем каждый консенсусный спектр генерирует ≈50 6-мерных меток. Оказалось, что 82% спектров, полученных от спектральных звезд, содержат хотя бы одну правильную 6-мерную метку.

Использование спектральных сетей для идентификации PTM.

Наш подход позволяет обнаруживать модификации без обращения к базе данных. Разница в родительских массах в спектральной паре соответствует либо смещению модификации, либо сумме масс аминокислот. Хотя не каждая разница в родительской массе соответствует модификационному смещению (некоторые спектральные пары могут быть артефактами), гистограмма различий родительской массы (рис.2 a ) выявляет модификации, присутствующие в образце IKKβ. Действительно, семь из восьми наиболее частых различий массы родителей на рис. 2 и входят в число восьми наиболее распространенных модификаций в наборе данных IKKβ (7). Подчеркнем, что рис. 2 и были получены без ссылки на базу данных, тогда как Tsur et al. (7) нашел эти модификации поиском по базе данных. Единственная частая модификация, идентифицированная Tsur et al. (7) и не представлен на рис. 2 и представляют собой дезамидирование с небольшим смещением массы в 1 Да, которое трудно отличить от ошибок исходной массы и артефактов изотопных пиков. Интересно, что наш подход показывает смещение +34 (присутствующее в тысячах спектральных пар), о котором не сообщалось в ref. 7.

Инжир.2.

Обнаружение модификаций с помощью спектральных сетей. ( a ) Гистограмма абсолютных разностей родительских масс для всех обнаруженных спектральных пар в наборе данных IKKβ; ось y представляет количество спектральных пар с данной разницей в родительской массе. Для наглядности мы показываем только диапазон масс 1–100 Да. Пики при массах 71, 87 и 99 Да соответствуют массам аминокислот, а пики при массах 14, 16, 18, 22, 28, 32 и 53 Да соответствуют известным модификациям, которые также были обнаружены Tsur et al. . (7) с использованием слепого поиска по базе данных. Пик с массой 34 Да соответствует предполагаемой модификации, которая до сих пор остается необъясненной. ( b ) Сеть модификаций пептида MDVTIQHPWFK из набора данных Lens. Заштрихованный узел был аннотирован как пептид + 42MDVTIQHPWFK путем поиска в базе данных тега VTIQHP; остальные узлы были аннотированы итеративным распространением. При каждом размножении аннотация исходного пептида комбинируется с модификацией, определяемой произведением спектра, для получения новой аннотации пептида (различные модификации показаны ребрами разного цвета).

Кроме того, спектральные сети могут способствовать обнаружению редких модификаций. Эти модификации обычно возникают только на очень небольшом количестве пептидов и, таким образом, вряд ли могут быть обнаружены с помощью частотной матрицы PTM из ссылки. 7. Кроме того, эти модификации могут возникать одновременно с другими более частыми модификациями и, таким образом, полностью ускользать от идентификации. Мы обратились к этим случаям, сосредоточив внимание на сетях модификаций , которые представляют собой подсети спектральной сети, соединяющие несколько состояний модификации одного и того же пептида.

Мы иллюстрируем наш подход модификаций сетей к идентификации PTM с помощью набора данных Lens. Белки хрусталика из-за очень низкого оборота имеют тенденцию накапливать много ПТМ с течением времени и часто приводят к повышенной непрозрачности и катаракте (7, 13). Было обнаружено, что из всех 11 932 спектров 2001 являются парными, в результате чего было идентифицировано 280 немодифицированных пептидов (88% всех немодифицированных пептидов, у которых есть пара в наборе данных).

Хотя на первый взгляд количество аннотаций (280) может показаться небольшим по сравнению с количеством парных спектров (2001), следует отметить, что многие из этих парных спектров получены из модифицированных пептидов и поэтому могут не генерировать достаточно длинные теги для сопоставления правильного пептида в базе данных.Однако большинство спектров модифицированных пептидов были правильно сопоставлены с их немодифицированными аналогами и, таким образом, уже были связаны с правильным пептидом. Кроме того, как показано на рис. 3 e , спектральное выравнивание между любыми двумя спектрами быстро определяет как местоположение, так и массу модификации. Итак, предположим, что идентифицированный спектр S был аннотирован пептидом p 1 p n и в паре с неаннотированным спектром S′ .Используя наш метод спектрального выравнивания, мы можем определить, на какой аминокислоте p i произошла модификация, и легко аннотировать S’ с помощью p . 1 P I-1 P I * P I + 1 P N , где P I * Стенды для модификации P I . Эта операция определяется как распространение аннотации пептида с помощью спектральных пар.Чтобы использовать распространение по любой заданной спектральной сети, нам необходимо учитывать два дополнительных условия: ( i ) некоторые неаннотированные спектры не могут быть напрямую связаны с аннотированным спектром (например, спектры с двумя модификациями) и ( ii ) некоторые неаннотированные спектры могут быть связаны с несколькими аннотированными спектрами (например, различные варианты префикса/суффикса). Поэтому мы используем итеративную процедуру, которая на каждом этапе распространяет пептидные аннотации из каждого аннотированного спектра на все его неаннотированные соседи.Если неаннотированный спектр получает более одной предполагаемой аннотации, то мы просто выбираем ту, которая лучше всего объясняет спектр. Затем соседи помечаются как аннотированные, и им разрешается распространять свои аннотации на следующей итерации. Например, процедура распространения начинается с 58 (из 117) аннотаций немодифицированных пептидов в спектральной сети, показанной на рис. 1, добавляется 53 аннотации с одной модификацией на следующей итерации и, наконец, добавляется 6 аннотаций с двумя модификациями на последней итерации. итерация.На рис. 2 показано это итеративное распространение в наборе данных Lens с сетью модификаций для пептида MDVTIQHPWFK. Мы отмечаем, что существующие инструменты идентификации пептидов имеют трудности в идентификации и проверке пептидов с множественными модификациями. Сети модификаций открывают возможность надежной идентификации таких сильно модифицированных пептидов (которые могут быть обычными для сильно модифицированных белков, участвующих в клеточной передаче сигналов, таких как комплекс IKK) путем перекрестной проверки с другими модифицированными пептидами, как показано на рис.2.

Рис. 3.

Продукция Spectral для оконечных и внутренних модификаций. ( a ) Спектральное произведение теоретических спектров пептидов TETMA и TETMAFR (все точки на пересечении вертикальной и горизонтальной линий). Синие кружки соответствуют совпадающим ионам b в двух спектрах; красные кружки соответствуют соответствующим ионам и .Синие и красные круги расположены на синей и красной диагоналях. ( b ) Спектральный продукт для неинтерпретированных спектров пептидов TETMA и TETMAFR. Две диагонали в матрице спектрального произведения по-прежнему показывают точки, в которых пики спектра сверху совпадают с пиками спектра слева. ( c ) Spectra S 1,2 b и S 1,2 y определяется синей и красной диагоналями.( d ) Спектральный продукт для неинтерпретированных спектров с одной внутренней модификацией. Верхний спектр соответствует немодифицированному пептиду, а левый спектр соответствует модифицированному пептиду. В этих случаях нецелесообразно строить S i,j b / S i,j y , просто выбирая вершины на диагоналях. ( e ) Алгоритм, описанный в тексте, допускает модификации в середине пептида и разделяет перекрывающиеся ряды ионов b и y (синяя и красная диагонали соответственно).Пики, выбранные из каждого спектра синей/красной диагоналями, показаны соответствующим цветом.

В целом анализ спектральных сетей набора данных Lens обнаружил все, кроме одного, типы модификаций, ранее идентифицированные с помощью слепого поиска в базе данных, и предоставил доказательства для шести ранее необнаруженных типов модификаций (см. Таблицу 1). Единственная модификация, указанная Tsur et al. (7) и не обнаруженное здесь снова было дезамидированием N,Q по тем же причинам, которые описаны выше для набора данных IKKβ.

Таблица 1.

Предполагаемые модификации, идентифицированные спектральными сетями в наборе данных Lens

Две из шести предполагаемых модификаций были недавно идентифицированы в катарактных хрусталиках другими группами (22, 23), что подтверждает наши прогнозы. Еще об одной модификации ранее сообщалось как о потере метансульфеновой кислоты на том же участке (24). Обнаруженная N-концевая модификация со смещением 57 Да потенциально интересна: она встречается только на двух семитриптических пептидах, чьи нетриптические концы ранее были описаны как деградированные N-концы βB1-кристаллинов (25), что также подтверждает наши предсказания.Более того, учитывая, что все N-концы белка, как ожидается, будут ацетилированы (как обычно наблюдалось), это может гипотетически соответствовать ранее не обнаруженной модификации in vivo деградированных N-концов. Обратите внимание, что это смещение 57-Да обычно приписывают общему экспериментальному артефакту, вызванному алкилированием цистеина (26). Однако тот факт, что эти 57 Да не наблюдаются ни на каких других пептидах, и отсутствие подтверждающих доказательств фрагментации пептида (т.е., характерная потеря массы предшественника на 57 Да), предполагают, что эта модификация является локализованным событием, которое может потребовать дальнейшего изучения. В качестве дополнительного шага подтверждения мы изменили традиционные параметры поиска в базе данных, чтобы учесть все обнаруженные нами предполагаемые модификации, и наблюдали полное совпадение с предложенными нами аннотациями с большими показателями Xcorr и ΔCn.

Следует отметить, что все эти предполагаемые типы модификаций встречаются в пептидах, которые были идентифицированы ранее в этом наборе данных (7, 8).Однако большинство этих модификаций редки, поскольку они происходят только в определенных местах и, следовательно, имеют тенденцию к низкому спектральному подсчету, что является основной причиной того, что их трудно обнаружить с помощью слепого поиска в базе данных. Путем независимого сравнения каждого спектра МС/МС с базой данных слепой поиск в базе данных генерирует множество ложноположительных результатов, которые обычно фильтруются, требуя минимального количества вхождений каждой модификации. Несмотря на успех в обнаружении модификаций с несколькими сайтами, этот подход приводит к трудностям в обнаружении модификаций с одним сайтом и менее распространенных модификаций.

Подход спектральных сетей устраняет это ограничение слепого поиска в базе данных, будучи более избирательным в назначении модифицированных пептидных аннотаций. Спектральные пары предоставляют дополнительные доказательства того, что два спектра были получены от одного и того же пептида (в виде коррелированных ионных пиков и интенсивностей), и, таким образом, добавляют значимости к иным образом трудным для идентификации спектра. Как показано на рис. 2, эта повышенная чувствительность особенно проявляется в сетях модификаций путем группирования нескольких спектров из разных состояний модификации одного и того же пептида. SI Приложение B содержит подтверждающие данные для всех модификаций, перечисленных в таблице 1, в виде сетей модификаций и аннотированных спектров МС/МС.

Обсуждение

Мы продемонстрировали полезность спектральных сетей для идентификации белков и модификаций. Ключевая идея нашего подхода заключается в том, что корреляции между спектрами МС/МС модифицированных и немодифицированных пептидов позволяют значительно уменьшить шум в отдельных спектрах МС/МС, что делает интерпретации de novo настолько надежными, что они могут заменить трудоемкую сопоставление спектров с базами данных.Мы также показали, как коррелированное спектральное содержимое в сетях модификаций может предоставить последовательные доказательства в поддержку идентификации редких модификаций и сильно модифицированных пептидов. Наше программное обеспечение для спектральных сетей находится в свободном доступе на сайте www-cse.ucsd.edu/groups/bioinformatics/software.html. Текущим ограничением нашего подхода является его ограниченная применимость к спектрам с родительскими зарядами 1 и 2; необходимы две дальнейшие алгоритмические разработки, чтобы обеспечить интеграцию спектров с более высокими родительскими зарядами в спектральные сети.Во-первых, хотя спектральное выравнивание работает для двух спектров заряда-предшественника 3 (или выше), оно обычно не работает для сравнения спектра заряда-предшественника 1 или 2 со спектром заряда-предшественника 3. Основная причина заключается в том, что спектры более высокого заряда предшествующий заряд имеет тенденцию генерировать b и y ионов с более высоким зарядом, которые не совпадают с однозарядными вариантами, преобладающими в спектрах исходного заряда 1 или 2. Во-вторых, даже если два спектра с исходной массой 3 (или выше) согласованные, надежные алгоритмы de novo для интерпретации многозарядных спектров до сих пор неизвестны.

Тандемные масс-спектры

по своей природе зашумлены, и масс-спектрометристы уже давно пытаются уменьшить шум и добиться надежных интерпретаций de novo путем совершенствования как приборов, так и экспериментальных протоколов. В частности, Зубарев и его коллеги (27) недавно продемонстрировали эффективность использования спектров диссоциации, индуцированной столкновениями, и спектров диссоциации с захватом электронов. Подчеркнем, что, в отличие от нашего подхода, этот метод, а также недавний подход, описанный в Frank et al. (28), требуют специального оборудования или высокоточной МС с преобразованием Фурье. Другой подход к уменьшению сложности спектров включает мечение стабильными изотопами (29). Однако влияние этого подхода (для идентификации пептидов) было ограничено отчасти стоимостью изотопа и требуемым высоким разрешением по массе. Альтернативные подходы к химической модификации концевой метки имеют недостатки, такие как низкий выход, сложные условия реакции и непредсказуемые изменения в ионизации и фрагментации.В результате влияние этих важных методов заключается в основном в количественном определении белка, а не в его идентификации (29). Ключевое различие между нашим подходом и методами маркировки заключается в том, что вместо того, чтобы пытаться ввести конкретную модификацию контролируемым образом, мы используем множественные модификации, естественным образом присутствующие в образце. Наш подход к спектральным сетям позволяет декодировать эти модификации (не зная заранее, что они из себя представляют) и, таким образом, обеспечивает вычислительное (а не инструментальное) решение проблемы идентификации спектров МС/МС.

Материалы и методы

Наборы данных.

Мы описываем наш алгоритм, используя спектры МС/МС человеческого IKKβ и белков хрусталика, двух особенно сложных образцов для анализа ПТМ. Набор данных IKKβ состоит из 45 500 спектров, полученных при расщеплении ингибитора белка IKKβ несколькими протеазами с образованием перекрывающихся пептидов. [Спектры получали на масс-спектрометре ThermoFinnigan (Сан-Хосе, Калифорния) LTQ.] Комплекс IKKβ представляет собой идеальный тестовый пример для алгоритмов поиска пептидов PTM. До недавнего времени фосфорилирование было единственным известным PTM в IKK, чего недостаточно для объяснения всех механизмов передачи сигналов и активации/инактивации IKK более чем 200 различными стимулами. Выявление комбинаторного кода, ответственного за PTM-контролируемую передачу сигналов в IKK, остается открытой проблемой. Предыдущий анализ этого набора данных IKKβ привел к 11760 идентифицированным спектрам и 1154 аннотированным пептидам (4, 7).Этот образец IKKβ представляет собой отличный пример для нашего протокола, поскольку 77% всех пептидов в этом образце имеют спектральные пары.

Набор данных Lens (13) состоит из 27 154 МС/МС спектров, полученных при расщеплении трипсином хрусталиков 93-летнего мужчины (спектры были получены на масс-спектрометре ThermoFinnigan LCQ Classic с ионной ловушкой). Этот набор данных был тщательно изучен (7, 8, 13), в результате чего было идентифицировано 416 немодифицированных пептидов и 450 модифицированных пептидов. Кроме того, 318 немодифицированных пептидов имели спектральные пары, а 343 модифицированных пептида имели немодифицированную версию в образце.

Спектральные пары.

Пептиды P 1 и P 2 образуют пару пептидов если либо ( i ) P 1 отличается от P 2 путем одной модификации/мутации или ( ii ) P 1 является либо префиксом, либо суффиксом P 2 . Два спектра образуют спектральную пару, если их соответствующие пептиды спарены. Хотя пептиды, дающие начало спектральной паре, заранее неизвестны, мы покажем ниже, что спектральные пары можно обнаружить с высокой степенью достоверности, используя неинтерпретированные спектры.

Наш подход к обнаружению спектральных пар по духу аналогичен слепому поиску модифицированных пептидов, впервые описанному Pevzner et al. (17) и дальнейшее развитие Tsur et al. (7). Хансен и др. (30) и Tang и др. (31) альтернативно предложили подходы к слепому поиску в базе данных, основанные на перечислении и предварительном индексировании, а Savitski et al. (19) недавно дополнил слепой поиск по базе данных, приняв во внимание время удерживания. Следует отметить, что анализ времени удерживания накладывает ограничение, заключающееся в том, что оба спектра должны исходить от одного и того же образца, в то время как наш подход позволяет беспрепятственно обнаруживать спектральные пары из нескольких прогонов образцов МС/МС (например,г., различные состояния клеток или образцы пораженной/здоровой ткани).

Для двух спектров S 1 и S 2 , спектральный продукт из S 1 и S 2 — набор точек ( x , y ) в 2D для каждых x S 1 и у S 2 (где S 1 и S 2 представлены наборами масс).Рис. 3 и показывает спектральное произведение для теоретических спектров двух пептидов. Сходство между двумя спектрами проявляется в двух диагоналях в спектральном произведении: одна образована сопоставлением ионов b (синие), а другая — сопоставлением ионов y (красные).

Рис. 3 b и d показаны пары неинтерпретированных спектров, обозначенные S 1 и S 2 и их спектральное произведение.Хотя «цвета» пиков неизвестны, в данном случае мы все же позволим себе назвать одну диагональ «синей», а другую — «красной». Можно использовать кружки (соответствующие массы пиков) на синей диагонали для преобразования исходного спектра S 1 в спектр S 1,2 б (рис. 3 c ) с гораздо меньшим количеством пиков (пик в S 1 сохраняется в S 1,2 b только если он создает круг на синей диагонали).Точно так же можно преобразовать S 1 в спектр S 1,2 y с помощью кругов на красной диагонали. Пиковые значения в обоих спектрах S 1,2 b и S 1,2 y унаследованы от спектра S 1 . Точно так же спектр S 2 преобразуется в спектры S 2,1 b и S 2,1 у . ††

Интуитивно понятно, что если два спектра не связаны между собой, синие и красные диагонали представляют собой случайные совпадения, а количество кругов, появляющихся на этих диагоналях, невелико. Парные спектры, наоборот, должны иметь много кружков на этих диагоналях. Хотя этот простой критерий (количество кружков на диагоналях) уже позволил бы грубо отличить парные спектры от несвязанных, ниже мы опишем более точный тест спектрального выравнивания для нахождения спектральных пар.Видеть SI Приложение C и исх. 17 для преимуществ спектрального выравнивания по сравнению с более простыми подходами спектральной свертки , аналогичными кросс-корреляционному анализу БПФ.

Рис. 3 b иллюстрирует случай ( ii ) в определении спектральных пар. Ситуация становится менее прозрачной в случае ( и ), а именно, когда модификация/мутация происходит в середине пептида (рис.3 д ). При этом как детектирование спектральных пар ( S i , S j ), так и дальнейшая их обработка в спектры S i, j b и 50 6 довольно сложно. В SI Приложение D мы описываем антисимметричный алгоритм спектрального выравнивания для получения виртуальных спектров S i, j из спектральных пар, который также охватывает этот случай внутренних модификаций/мутаций.

Для простоты приведенное выше описание скрывает многие детали, которые превращают интерпретацию спектральных пар в довольно сложную алгоритмическую задачу. Оригинальный алгоритм от Pevzner et al. (17) рассмотрел только b b (или y y ) пары совпадающих пиков и не смог рассмотреть все три типа совпадающих пиков ( b b , , y и b y ) при вычислении спектрального выравнивания.Это осложнение было рассмотрено Tsur et al. (7) для случая сравнения «спектр против пептида». В спектральных сетях мы сталкиваемся с более сложным случаем сравнения «спектр против спектра». ‡‡ и учитывать условие антисимметричности пути (15, 33), что еще больше усложняет алгоритм спектрального выравнивания (даже в случае одной внутренней модификации).

Спектральные сети.

показатель корреляции спектров S 1 и S 2 определяется как сумма баллов всех пиков в спектрах S 1,2 b и S 1,2 у : оценка( S 1 , С 2 ) = счет( S 1,2 б ) + оценка( S 1,2 у ).Аналогично, оценка( S 2 , С 1 ) = счет( S 2,1 б ) + оценка( S 2,1 у ). Мы принимаем S 1 и S 2 в качестве предполагаемой спектральной пары, если оба отношения [score( S 1 , С 2 )]/[оценка ( S 1 )] и соотношение [оценка( S 2 , С 1 )]/[оценка ( S 2 )] превышают заданный порог (0.4 в приведенных ниже примерах), где оценка ( S i ) — это суммарная оценка всех пиков в S i . Кроме того, мы предполагаем, что показатель корреляции между заданным спектром S и любым несвязанным спектром S’ приблизительно соответствует распределению Гаусса. Таким образом, показатель корреляции считается значимым только в том случае, если вероятность случайного появления этого показателя <0,05. Суммарная эффективность фильтрации по этим критериям позволила сохранить 78.4% всех правильных спектральных пар при уровне точности 95% и найти несколько различных вариантов для большинства немодифицированных пептидов. Основной причиной того, что остальные спектральные пары не были обнаружены нашей процедурой выравнивания, было изменение характера фрагментации между этими близкородственными пептидами. Спектральные пары, удовлетворяющие приведенным выше тестам, образуют спектральную сеть на множестве всех спектров (см. пример на рис. 1). Спектральная сеть для всего набора данных IKKβ состоит из 43 связанных компонентов с 1021 вершиной и 1569 ребрами.Небольшое количество связанных компонентов неудивительно, потому что перекрывающиеся пептиды в этом наборе данных могут быть собраны в небольшое количество контигов [эффект, ранее исследованный в контексте секвенирования белка дробовиком (20)].

За счет уменьшения количества шумовых пиков в 8 раз пары спектров обеспечивают резкое увеличение отношения сигнал/шум (см. Таблицу SI 2), даже по сравнению с согласованными спектрами, полученными из кластеров (20) (не говоря уже об отдельных спектры).Кроме того, спектральные пары обеспечивают почти идеальное разделение между b — и y -ионными лестницами, что является ключевым условием для успешной реконструкции de novo .

Спектральные звезды.

Хотя для одной спектральной пары ( S 1 , С 2 ) спектры S 1,2 b и S 1,2 y уже имеют высокое отношение сигнал/шум, мы показываем, что спектральные звезды позволяют дополнительно обогатить b — и y -ионные лестницы.Спектральная звезда, состоящая из спектральных пар ( S 1 , С 2 ), ( С 1 , С 3 ), …, ( S 1 , S n ) позволяет увеличить отношение сигнал/шум за счет учета 2( n − 1) спектров S 1, и б и S 1, i y for 2 ≤ i n .Мы объединяем все эти спектры в спектр звезды S . 1 * , как и в нашем подходе к кластеризации (подробности приведены в SI Приложение D ).

Благодарности

Мы благодарим Эбрахима Занди (Университет Южной Калифорнии, Лос-Анджелес, Калифорния) и Брайана Сирла (Университет здоровья и науки Орегона, Портленд, Орегон) за предоставление наборов данных МС/МС, а также Винит Бафна, Стивена Таннера и Филиппа Уилмарта за проницательную информацию. обсуждения.Эта работа была поддержана Национальным институтом здравоохранения Грант NIGMS 1-R01-RR16522.

Сноски

  • Кому следует направлять корреспонденцию. Электронная почта: bandeira{at}cs.ucsd.edu
  • Вклад авторов: Н.Б., Д.Т. и П.А.П. проектное исследование; Н.Б. и А.Ф. провели исследование; NB, DT и AF предоставили новые реагенты/аналитические инструменты; Н.Б. и П.А.П. проанализировал данные; и Н.Б., Д.Т. и П.А.П. написал бумагу.

  • Авторы заявляют об отсутствии конфликта интересов.

  • Эта статья содержит вспомогательную информацию в Интернете по адресу www.pnas.org/cgi/content/full/0701130104/DC1.

  • Использование тегов пептидных последовательностей сокращает количество рассматриваемых пептидов, но не устраняет необходимость сопоставления спектров с отфильтрованной базой данных.

  • § При слепом поиске по базе данных список возможных модификаций заранее не известен, и P достаточно для интерпретации S ( P *) (7). В ограничительном поиске по базе данных также необходим список возможных модификаций для интерпретации S ( P *).

  • ↵ ¶ В отличие от стандартных алгоритмов de novo , мы не настаиваем на реконструкции всего пептида и часто сокращаем найденный путь, удаляя его префикс/суффикс, если путь не объясняет никаких пиков.В результате найденный путь не обязательно начинается/заканчивается в начале/конце пептида.

  • ↵ ‖ Состояние ( ii ) можно рассматривать как вариант состояния ( i ), если рассматривать удлинение пептида на несколько остатков как единственную «мутацию» (такие вариации распространены в образцах МС/МС). В более общем смысле пептиды P 1 и P 2 образуют пару пептидов, если ( i ) P 1 является модифицированной/мутированной версией P . 2 или ( ii ) P 1 и P 2 внахлест.Хотя наши методы также работают для этого обобщения, мы решили ограничить наш анализ простыми парами пептидов, как описано выше. Мы обнаружили, что только такие простые пары позволяют интерпретировать большинство спектров. Добавление пар спектров, которые имеют более тонкое сходство, еще больше увеличивает количество спектральных пар, но замедляет работу алгоритма.

  • ↵ †† Отметим, что отнесение верхних индексов к спектрам S 1, и б и S 1, i y произвольны, и заранее неизвестно, какой из этих спектров соответствует b ионам, а какой y ионам.

  • ↵ ‡‡ В случае зависимости спектра от пептида известны наборы ионов b и y в теоретическом спектре пептида, тогда как в случае зависимости спектра от спектра это разбиение неизвестно. Аналогичная проблема рассматривалась Zhang и McElvain (32) при сравнении спектров MS2 и MS3.

  • Сокращения:
    МС/МС,
    тандемная масс-спектрометрия;
    ПТМ,
    посттрансляционная модификация.
  • © 2007 Национальной академии наук США

Операторы нарушения конформной симметрии для дифференциальных форм на сферах

‘) вар корзинаStepActive = истина var buybox = document.querySelector(«[data-id=id_»+ метка времени +»]»).parentNode ;[].slice.call(buybox.querySelectorAll(«.вариант-покупки»)).forEach(initCollapsibles) функция initCollapsibles(подписка, индекс) { var toggle = подписка.querySelector(«.цена-варианта-покупки») подписка.classList.remove(«расширенный») var form = подписка.querySelector(«.форма-варианта-покупки») если (форма && cartStepActive) { var formAction = форма.получить атрибут («действие») form.setAttribute(«действие», formAction.replace(«/checkout», «/cart»)) document.querySelector(«#ecommerce-scripts»).addEventListener(«load», bindModal(form, formAction, timestamp, index), false) } var priceInfo = подписка.querySelector(«.Информация о цене») var PurchaseOption = toggle.parentElement если (переключить && форма && priceInfo) { переключать.setAttribute(«роль», «кнопка») toggle.setAttribute(«tabindex», «0») toggle.addEventListener («щелчок», функция (событие) { var expand = toggle.getAttribute(«aria-expanded») === «true» || ложный toggle.setAttribute(«aria-expanded», !expanded) form.hidden = расширенный если (! расширено) { покупкаВариант.classList.add («расширенный») } еще { покупкаOption.classList.remove(«расширенный») } priceInfo.hidden = расширенный }, ложный) } } функция bindModal (форма, formAction, метка времени, индекс) { var weHasBrowserSupport = window.fetch && Array.from функция возврата () { var Buybox = EcommScripts ? EcommScripts.Ящик для покупок: ноль var Modal = EcommScripts ? EcommScripts.Modal : ноль if (weHasBrowserSupport && Buybox && Modal) { var modalID = «ecomm-modal_» + метка времени + «_» + индекс var modal = новый модальный (modalID) modal.domEl.addEventListener («закрыть», закрыть) функция закрыть () { форма.querySelector(«кнопка[тип=отправить]»).фокус() } форма.setAttribute( «действие», formAction.replace(«/checkout», «/cart?messageOnly=1») ) form.addEventListener( «Отправить», Buybox.interceptFormSubmit( Буйбокс.fetchFormAction(окно.fetch), Buybox.triggerModalAfterAddToCartSuccess(модальный), консоль.лог, ), ложный ) document.body.appendChild(modal.domEl) } } } функция initKeyControls() { документ.addEventListener(«keydown», функция (событие) { if (document.activeElement.classList.contains(«цена-варианта-покупки») && (event.code === «Пробел» || event.code === «Enter»)) { если (document.activeElement) { событие.preventDefault() документ.activeElement.click() } } }, ложный) } функция InitialStateOpen() { var buyboxWidth = buybox.смещениеШирина ;[].slice.call(buybox.querySelectorAll(«.опция покупки»)).forEach(функция (опция, индекс) { var toggle = option.querySelector(«.цена-варианта-покупки») var form = option.querySelector(«.форма-варианта-покупки») var priceInfo = option.querySelector(«.Информация о цене») если (buyboxWidth > 480) { переключить.щелчок() } еще { если (индекс === 0) { переключать.щелчок() } еще { toggle.setAttribute («ария-расширенная», «ложь») form.hidden = «скрытый» priceInfo.hidden = «скрытый» } } }) } начальное состояниеОткрыть() если (window.buyboxInitialized) вернуть window.buyboxInitialized = истина initKeyControls() })()

Страница не найдена

К сожалению, страница, которую вы искали на веб-сайте AAAI, не находится по URL-адресу, который вы щелкнули или ввели:

https://www.aaai.org/papers/ismb/2000/ismb00-028.pdf

Если URL-адрес, указанный выше, заканчивается на «.html», попробуйте заменить «.html: на «.php» и посмотрите, решит ли это проблему.

Если вы ищете конкретную тему, воспользуйтесь следующими ссылками или введите тему в поле поиска на этой странице:

  • Выберите AI Topics, чтобы узнать больше об искусственном интеллекте.
  • Чтобы присоединиться или узнать больше о членстве в AAAI, выберите «Членство».
  • Выберите «Публикации», чтобы узнать больше об AAAI Press и журналах AAAI.
  • Для рефератов (а иногда и полных текстов) технических статей по ИИ выберите библиотеку
  • .
  • Выберите журнал AI, чтобы узнать больше о флагманском издании AAAI.
  • Чтобы узнать больше о конференциях и встречах AAAI, выберите «Конференции»
  • .
  • Для ссылок на Симпозиумы AAAI выберите Симпозиумы.
  • Чтобы получить информацию об организации AAAI, включая ее должностных лиц и сотрудников, выберите «Организация».

Помогите исправить страницу, вызывающую проблему

Веб-страница

, который направил вас сюда, должен быть обновлен, чтобы он больше не указывал на эту страницу.Вы поможете нам удалить старые ссылки? Пожалуйста, напишите веб-мастеру ссылающейся страницы или используйте их форму для сообщения о неработающих ссылках. Это может не помочь вам найти нужную страницу, но, по крайней мере, вы избавите других людей от проблем. У большинства поисковых систем и каталогов есть простой способ сообщить о битых ссылках.

Если это представляется уместным, мы будем признательны, если вы обратитесь к веб-мастеру AAAI, указав, как вы сюда попали (например, URL-адрес страницы, которую вы искали, и URL-адрес перехода, если он доступен).Спасибо!

Контент сайта

Доступ к основным разделам этого сайта (и некоторым популярным страницам) можно получить по ссылкам на этой странице. Если вы хотите узнать больше об искусственном интеллекте, посетите страницу AI Topics. Чтобы присоединиться или узнать больше о членстве в AAAI, выберите «Членство». Выберите «Публикации», чтобы узнать больше о AAAI Press, AI Magazine, и журналах AAAI. Чтобы получить доступ к цифровой библиотеке AAAI, содержащей более 10 000 технических документов по искусственному интеллекту, выберите «Библиотека».Выберите «Награды», чтобы узнать больше о наградах, наградах и программах стипендий AAAI. Чтобы узнать больше о конференциях и встречах AAAI, выберите «Встречи». Чтобы получить ссылки на программные документы, обращения президента и сторонние ресурсы ИИ, выберите «Ресурсы». Для получения информации об организации AAAI, в том числе о ее должностных лицах и персонале, выберите «О нас» (также «Организация»). Окно поиска, созданное Google, будет возвращать результаты, ограниченные сайтом AAAI.

MS-GF+ приближается к универсальному инструменту поиска в базе данных для протеомики спектр

S и дополнительно вычислить статистическую значимость полученных PSM.В этом исследовании мы используем E -значения для оценки статистической значимости отдельных PSM (называемых спектральными E -значениями) и подход мишень-приманка для оценки частоты ложных открытий (FDR). См. Гупта и др. 24 для получения подробной информации о нашей вероятностной структуре.

Пусть P S будет пептидом, который породил S . Функция оценки является адекватной для S (по отношению к базе данных белков ProteinDB ), если правильный пептид набирает максимальное количество баллов в базе данных, т.е. , S ) = Оценка ( P S , S ).«Хорошая» оценочная функция должна удовлетворять следующим трем условиям. Во-первых, он должен быть адекватным для подавляющего большинства спектров. Во-вторых, алгоритм оценки PSM должен быть быстрым. В-третьих, алгоритм вычисления статистической значимости (например, E -значений) PSM должен быть быстрым и точным.

MS-GF+ использует очень простое скалярное произведение Score( P , S ) = P S * после преобразования пептида P и спектра P и спектра S в вектор 0 * и спектральный вектор S * (спектральный вектор назывался префиксно-остаточным масс-спектром в предыдущих публикациях 12,25 ).Преобразование спектра S в спектральный вектор S * использует вероятностную модель, которая гарантирует, что результирующее скалярное произведение является адекватным 26 (первое условие). В то же время он делает подсчет и вычисление точных E -значений быстрым 15 (второе и третье условие). Эта простая модель оценки «точечного произведения» отличается от многих других инструментов поиска в базе данных 2,4,27,28 и повторной оценки 9,10 , использующих сложные функции оценки, которые часто затрудняют выполнение третьего условия.

Рабочий процесс MS-GF+

MS-GF+ использует набор спектральных данных Spectra и базу данных белков ProteinDB в качестве входных данных и выводит набор оцененных PSM вместе с E -оценками значений. Он использует интерфейсы прикладного программирования с открытым исходным кодом jmzML 29 , jmzReader 30 и jmzIdentML 31 и поддерживает стандартные форматы файлов HUPO Proteomics Standard Initiative — mzML 32 и mzIdentML 33 . Благодаря этим разработкам MS-GF+ уже используется во многих конвейерах протеомики и инструментах постобработки.

Рабочий процесс MS-GF+ включает следующие четыре этапа: создание спектральных векторов, поиск в базе данных белков, вычисление E -значений PSM и оценка FDR. Ниже мы опишем каждый шаг, а также то, как MS-GF+ использует преимущества высокоточных спектров.

Создание спектральных векторов

A (немодифицированный) пептид определяется как строка в алфавите A из 20 стандартных аминокислот. Пусть A + будет расширенным набором аминокислот, содержащим как немодифицированные, так и модифицированные аминокислоты.Для (немодифицированной) аминокислоты a ε A пусть Mod( a )⊂ A + будет набором, содержащим a и все его модифицированные аминокислоты. Например, если T (Thr) и T * (фосфорилированный Thr) находятся в A + , Mod( T )={ T , T *}. Учитывая пептид P = A 1 A K K K , определить PV = PV 1 K в качестве варианта P если i ε Mod( a i ) для всех i (1 ≤ i k 9).

MS-GF+ преобразует спектры в спектральные векторы 12,25 . Спектральный вектор спектра S представляет собой M -мерный вектор с целыми значениями, где M =PrecursorMass( S ) является номинальной массой предшественника S . Здесь мы рассматриваем номинальные массы предшественников, представляя, что сумма номинальных масс аминокислот пептида генерирует спектр. Как и во многих случаях, точная номинальная масса прекурсора неизвестна (например, приборы MS часто выбирают второй или третий изотопный пик вместо моноизотопного пика из спектра MS1), множественные спектральные векторы генерируются отдельно для каждой возможной номинальной массы прекурсора и Оценка пептида с массой M вычисляется из спектрального вектора предшественника с массой M .

Преобразование экспериментального спектра в спектральный вектор происходит следующим образом. Спектр S = {( MZ 1 , Rank 1 ), …, ( MZ L , ring l )} представлен как набор ранжированного пики, где i пик наивысшей интенсивности получает ранг i ( mz j и ранг j представляют m/z 0 j 04 и ранг 3 соответственно).Тип иона представлен в виде триплета целых чисел заряда, смещения и знака, где знак представляет, является ли тип иона префиксным ионом (знак = 1) или суффиксным ионом (знак = -1). Например, однозарядные b-ионы и y-ионы соответствуют типам ионов (1, 1, 1) и (1, 19, -1) соответственно. Нейтральные потери и переносы водорода также рассматриваются как типы ионов, например, однозарядные ионы z· соответствуют (1, 3, −1). Учитывая ионный тип ион = ( заряда , смещение , знак ), можно превратить спектр S на S ION = {( MASS 1 , RS 1 ), …, ( MASS L , R l l )} Использование следующего преобразования:

где [ x ] представляет ближайшее целое число до x и RankScore( ion , rank ) — предварительно вычисленная функция, которая принимает ion типа ion и целочисленный ранг и возвращает вероятностную оценку логарифмического правдоподобия, определенную в ссылках 12, 26.Примечательно, что 0,9995 — это константа масштабирования для минимизации ошибок округления (см. Дополнительную таблицу 1). На практике RankScore ( ion , rank ) также учитывает положение наблюдаемого пика, а также заряд предшественника и массу спектра, которые здесь для упрощения опущены. Типы ионов, влияющие на оценку, выбираются из обучающего набора, как описано в Kim et al. 12 Предположим, что выбран набор типов ионов. Спектральный вектор S (обозначен на S = ( S 1 , …, S M m )) вычисляется следующим образом:

, где RanceScore ( ION , ∞) представляет собой оценку, полученную при отсутствии иона.

Мы также определяем вариант пептидного вектора следующим образом. Пусть Mass( a ) будет номинальной массой (возможно модифицированной) аминокислоты a . Например, Mass( T )=101, а масса фосфорилированного Thr равна Mass( T *)=181. Для варианта PV = 1 k определим массу PV как . Учитывая вариант pv = pv = 1 K K MASS M , мы определяем его пептидный вектор (обозначенный на PV ) в качестве вектора 0-1 ( м 1 , …, м м м ) с ( N -1) 1 с, такие, что м I = 1 если I равна массы ( 1 )+…+Масса( j )(1≤ j k ).

Показатель MS-GF+ PSM ( PV , S ) определяется, как если бы Mass( PV )=PrecursorMass( S ) и −∞ в противном случае. Оценка MS-GF+ представляет собой логарифмическое отношение правдоподобия, описанное в ссылке. 26.

Поиск в базе данных белков

Мы определяем ProteinDB + как набор всех вариантов (относительно расширенного набора аминокислот A + ), полученных из ProteinDB . Целью поиска в базе данных MS-GF+ является решение следующей задачи: по набору спектральных данных Spectra и базе данных белков ProteinDB для каждого спектра S ε Spectra найти вариант PV S , ProteinDB таким образом, что

В отличие от традиционного подхода поиска в базе данных МС/МС на основе спектра, который сравнивает каждый спектр со всеми пептидами, MS-GF+ использует альтернативный подход на основе пептидов, который вычисляет массив суффиксов для сравнения каждого пептид против всех спектров с той же массой предшественника.Подробную информацию о подходе MS-GF+ к поиску в базе данных см. в дополнительном примечании 1.

Вычисления

E -значения PSM

Оценки PSM, сообщаемые существующими инструментами поиска в базе данных MS/MS, часто плохо коррелируют с их E -значениями 34 . Важно ранжировать PSM на основе их значений E , потому что такое ранжирование (а не ранжирование на основе «необработанных оценок») часто значительно увеличивает количество идентифицированных спектров при заданном FDR 15,35 .Многие инструменты поиска в базе данных оценивают значение E PSM на основе аппроксимации хвоста распределения баллов, характерного для спектра, с использованием пептидов в базе данных 27,28 . Поскольку известно, что этот подход приводит к смещенным оценкам E -значений 15 , MS-GF+ применил подход производящей функции для строгого вычисления E -значений PSM с использованием распределения баллов всех пептидов 15 . Наша скоринговая модель важна здесь, потому что подход с производящей функцией легко применим к скоринговым функциям, которые могут быть представлены в виде скалярного произведения векторов 24 .Принятие подхода с использованием производящей функции повышает точность оценок значений E и увеличивает количество идентифицированных пептидов, что недавно было подтверждено независимой работой по применению этого подхода к показателю XCorr в SEQUEST 35 .

Учитывая спектр S , пороговое значение t , расширенный набор аминокислот A + и размер базы данных N , мы определяем E -значение ( S

3 A

S 9
+ , T , N ) Как ожидаемое количество вариантов PV (как определено A + ) с MSGFSCORE ( PV , S ) ≥ T в случайная база данных белков размером N .Для вычисления E -Value ( S , A + , T , N ), мы первым вычисляем Spectral E-значение E -Value ( S , A + , t ), ожидаемое количество вариантов PV с MSGFScore ( PV , S ) ≥ t для одного случайного пептида. Один случайный пептид моделирует случайный пептид, начиная с фиксированной позиции в базе данных случайных белков.

Рассмотрим набор всех возможных (немодифицированных) пептидов длиной k (где k — большое число) и равномерно выберем случайный пептид из этого набора (то есть вероятность выбора пептида равна ). На практике, чтобы отразить разные частоты встречаемости аминокислот в базе данных (например, Leu обычно встречается чаще, чем Trp), мы определяем вероятность пептида P = a 1 a k as , где Prob(a) — частота встречаемости аминокислот и в базе данных белков.Обратите внимание, что это не меняет алгоритм вычисления спектральных значений E . Мы говорим, что пептид P производит вариант PV , если PV является вариантом префикса P . Например, PEPT * и PEPTI производятся из PEPTIDE . Для спектра S пусть V ( t ) будет набором всех вариантов PV с MSGFScore( PV , S )≥ t .Для каждого варианта PV имеется 20 k −| ПВ | пептидов длиной k , образующих вариант PV (| PV | обозначает количество аминокислот в PV ). Таким образом, ожидаемое количество вариантов на случайный пептид со значением, равным или превышающим t , равно

Поскольку вариант представляет собой строку в алфавитном порядке A + , это выражение можно вычислить, используя метод производящей функции 15 .Учитывая спектр S с S = S 1 S м м , рассмотреть направленный ациклический график под названием аминокислотный граф G ( V , E , A + ) с V = {0, …, M } и E = {( i , j )| j I ε Масса ( I ε ( A ) для A ε A + }, где оценка вершины I определяется как S I , вероятность ребра определяется как , оценка пути определяется как сумма оценок его вершин, а вероятность пути определяется как произведение вероятностей его ребер.Путь в графе аминокислот представляет собой вариант. Следовательно, E -value( S , A + , t ) равно сумме вероятностей всех путей от 0 до M с оценками, равными или лучшими, чем t 900 вычисляться с помощью параметрического динамического программирования 15,26,36 .

Хотя спектральные E -значения полезны для оценки статистической значимости отдельных PSM (независимо от базы данных), их необходимо преобразовать в E -value( S , A + , t , N ), чтобы принять во внимание тот факт, что поиск в базе данных представляет собой «множественное тестирование», когда множественные варианты (возникающие из разных пептидов базы данных) оцениваются по спектру 37 . E -значения могут быть аппроксимированы следующим образом:

где N размер базы данных. Следует отметить, что поскольку базы данных белков содержат много повторяющихся пептидов, важно отразить эффективный размер базы данных, который оценивается как количество уникальных пептидов определенной длины.

Оценка FDR

MS-GF+ оценивает FDR с использованием метода ложной цели 38,39 . Подробности см. в дополнительном примечании 2.

Спектры МС/МС от низкоточных к высокоточным

Масс-спектрометры принято делить на высокоточные (обозначается H) и низкоточные (обозначаются L) приборы.В зависимости от того, с низкой или высокой точностью измеряются ионы-предшественники и продукты, спектры делятся на спектры LL, LH, HL и HH (спектры LH почти никогда не используются в протеомных исследованиях). Хотя может показаться, что расширение подхода производящей функции от LL (как определено в ссылке 15) до спектров HL и HH является простым вопросом настройки параметров, которые контролируют устойчивость к ошибкам, ситуация является более сложной. Здесь мы объясняем, как MS-GF+ использует преимущества высокоточных пиков ионов-продуктов.

Пусть RMass( a ) будет реальной массой аминокислоты a . Для варианта PV = 1 k , пусть и RPprecursorMass( S ) — реальный спектр 90 массы прекурсора0. Ранее мы предположили, что масса ( PV ) и предшественнее ( pv ) являются целыми числами и определенными MSGFSCORE ( PV , S ) = PV · S , если масса ( PV ) = предшественнее ( S ) и −∞ в противном случае.Примечательно, что это условие, хотя и применимое для спектров ЛЛ, является слабым для спектров ГЛ и ГВ, поскольку может выполняться даже при значительном отклонении реальной массы RMass( PV ) (например, до 0,5 Да) от RPrecursorMass ( С ). Обозначим условие | а б |<Δ. Чтобы воспользоваться преимуществами точных масс прекурсоров в спектрах HL и HH, условие Mass( PV )=PrecursorMass( S ) должно быть переопределено на , где Δ — допуск массы прекурсора.Задача поиска в базе данных с этим модифицированным определением MSGFScore теперь описывается следующим уравнением:

где Spectra RMass( PV ) представляет набор спектров S ε Spectra удовлетворяющих .

Ключевой частью подхода с производящей функцией является предположение, что аминокислоты имеют целочисленные массы (в противном случае параметрическое динамическое программирование трудно реализовать). Однако округление масс аминокислот до целых приводит к ошибкам.Эти ошибки округления уменьшаются после масштабирования на 0,9995, что делает их подходящими для спектров LL и HL. Однако для спектров HH ошибки округления остаются слишком большими даже после масштабирования, что не позволяет MS-GF+ использовать точные пики ионов-продуктов. Большая константа масштабирования может лучше соответствовать точности массы, например, константа масштабирования 274,335215 позволяет моделировать спектры с 2,5 млн. точность 40 . Однако, поскольку временная сложность алгоритма производящей функции пропорциональна константе масштабирования, это масштабирование делает вычисление E -значений чрезмерно медленным.

Здесь мы представляем новый алгоритм оценки, использующий преимущества точных масс ионов-продуктов без существенного увеличения времени работы MS-GF+. В исх. В разделе 26 мы ввели абстрактную модель (по-видимому, не имеющую отношения к МС), описывающую вероятностный процесс преобразования булевой строки (пептидного вектора) в другую булеву строку (спектральный вектор). Эта модель, хотя и подходит для спектров низкой точности, нуждается в модификации для спектров высокой точности. Здесь мы моделируем пептид как логическую строку (как и раньше), но моделируем спектр как направленный ациклический граф (DAG) и далее применяем преобразование логической строки в DAG для подсчета реальных PSM (подробности см. в разделе «Методы»).

Наша новая идея моделирования DAG заключается в следующем. Рассмотрим пики с массами 100,01 и 157,4, которые будут преобразованы в целочисленные ячейки 100 и 157 в булевом строковом представлении спектра. После этого преобразования мы теряем информацию о точной разнице между этими двумя массами. Однако в нашей новой спектральной модели DAG эта информация сохраняется на краях спектральной DAG и используется при оценке.

Наборы данных

Всего было использовано 19 наборов данных (≈2.83 миллиона спектров человека, дрожжей, мышей и Schizosaccharomyces pombe ), отражающих разнообразие данных МС, соответствующих 17 различным спектральным типам, показанным на рис. 1 (подробности о наборах данных см. в разделе «Методы»). Для всех этих наборов данных мы сравнили MS-GF+ с популярными инструментами для идентификации пептидов, такими как Mascot+Percolator.

Сравнение MS-GF+ с Mascot+Percolator

Мы сравнили количество идентифицированных PSM при 1% FDR для MS-GF+ и Mascot+Percolator (то есть PSM, зарегистрированные Mascot и повторно оцененные Percolator).Для сравнения использовался Mascot+Percolator (версия Mascot 2.3.02, интегрирующая Percolator), поскольку он представляет собой популярный выбор для идентификации пептидов. Мы также протестировали несколько других инструментов, таких как SEQUEST, InsPecT 25 и OMSSA, но не сообщаем их результаты, поскольку они выявили значительно меньше PSM по сравнению с Mascot+Percolator. См. дополнительную таблицу S2 для параметров поиска в базе данных.

Для всех 19 наборов данных MS-GF+ идентифицировал значительно больше PSM по сравнению с Mascot+Percolator (рис.2). На рис. 3а показаны результаты сравнительного анализа для пяти наборов данных о людях, сгенерированных с различной фрагментацией и инструментами 20 . Percolator значительно увеличил количество идентификаций по сравнению с Mascot, но для всех этих наборов данных MS-GF+ идентифицировал значительно больше PSM (17–38%), чем Mascot+Percolator (см. Дополнительный рисунок S1 для диаграмм Венна MS-GF+ и Mascot). +Идентификация перколятора). Мы также сравнили количество идентификаций, о которых сообщалось в исходном исследовании 20 , в котором также использовался Mascot+Percolator вместе с собственными инструментами предварительной и постобработки.В этом сравнении MS-GF+ также показал улучшенную производительность (определение на 16-55% больше PSM).

Рис. 2. Сравнение MS-GF+ с Mascot+Percolator.

Процентное увеличение числа идентифицированных PSM для MS-GF+ по сравнению с Mascot+Percolator для всех 19 наборов данных. Каждая полоса представляет набор спектральных данных определенного спектрального типа. Для (CID, Низкий, Стандартный, Трипсин) и (ETD, Низкий, Стандартный, Трипсин) есть два соответствующих набора данных, один для человека, а другой для дрожжей.Мы различаем их, добавляя «*» к наборам данных дрожжей. Для наборов данных (CID, низкий уровень, фосфорилирование, трипсин) и (CID, низкий уровень, убиквитинирование, трипсин) подсчитывали количество фосфорилированных и убиквитинированных PSM вместо количества всех идентифицированных PSM. Для набора данных (ETD, Low, Standard, αLP) Mascot+Percolator не выявил PSM.

Рисунок 3: Сравнение MS-GF+ и других инструментов для различных спектральных типов.

Показаны количества идентифицированных PSM ( a c ) или пептидов ( d ) при 1% FDR.Цифры над столбцами представляют собой процент увеличения количества идентификаций для MS-GF+ по сравнению с другими инструментами. ( a ) Результаты для наборов данных человека с различной фрагментацией и инструментами. Результаты MS-GF+, Mascot+Percolator и Mascot показаны вместе с результатами в исх. 20. Percolator значительно увеличил количество идентификаций по сравнению с Mascot, но MS-GF+ превзошел Mascot+Percolator для всех наборов данных. ( b ) Увеличение количества идентификаций благодаря наличию высокоточных пиков продуктов ионов.Для трех наборов данных человека, представляющих спектры HH, MS-GF+, Mascot+Percolator и Mascot запускали с использованием параметров поиска для спектров HL. Результаты этих поисков (обозначенных HL) сравниваются с количеством идентификаций для обычных поисков (обозначенных HH). Поиски HH выявили больше PSM, чем поиски HL для каждого инструмента и каждого набора данных. Разница была больше для CID и HCD, чем для спектров ETD. ( c ) Результаты для наборов данных о дрожжах с различной фрагментацией и ферментами.Показаны результаты MS-GF+ и Mascot+Percolator. MS-GF+ превзошел Mascot+Percolator для всех этих наборов данных. ( d ) Сравнение MS-GF+ и результатов в исх. 1, который использовал OMSSA вместе с собственными инструментами постобработки наборов данных о дрожжах. Показаны количества (уникальных) пептидов на уровне пептидов 1%. В исх. 1, подсчитывали только количество идентифицированных пептидов, совпадающих с белками, идентифицированными при 1% FDR на уровне белка, в то время как для MS-GF+ подсчитывали количество идентифицированных пептидов независимо от их совпадающих белков.

Чтобы выяснить, как каждый инструмент получает преимущества от высокоточных пиков ионов-продуктов, для трех из пяти наборов данных человека, представляющих спектры HH, мы запустили MS-GF+, Mascot+Percolator и Mascot, используя параметры для спектров HL, то есть , используя допуск по массе фрагмента 0,6 Da для Mascot и Mascot+Percolator и используя модель оценки для спектров низкой точности для MS-GF+. Для каждого инструмента количество идентификаций было выше при использовании параметров для спектров ГГ, но разница варьировалась в зависимости от набора данных (рис.3б) и пренебрежимо мал для спектров ETD.

На рис. 3c показано сравнение десяти наборов данных о дрожжах, полученных с различной фрагментацией (CID или ETD) и ферментами (трипсин, LysC, ArgC, GluC или AspN) 1 . Опять же, для всех этих наборов данных MS-GF + идентифицировал значительно больше PSM (34–168%), чем Mascot + Percolator (рис. 3c). В исх. 1, используя OMSSA (и собственные инструменты для предварительной и последующей обработки), авторы сообщили о количестве идентифицированных пептидов при 1% FDR на уровне пептидов, которые соответствуют белкам, идентифицированным при 1% FDR на уровне белков.Мы сравнили эти цифры с количеством идентифицированных пептидов при 1% FDR на уровне пептидов с использованием MS-GF+ (рис. 3d). Обратите внимание, что это сравнение несправедливо, поскольку идентификация пептидов с помощью MS-GF+ не была отфильтрована в соответствии с белком, с которым они совпадают. Однако даже с учетом этого результаты показывают, что для большинства наборов данных MS-GF+ идентифицировал гораздо больше пептидов, чем в исходном отчете.

Чтобы увидеть, может ли наша модель оценки учитывать склонность к фрагментации, специфичную для фосфопептидов, мы создали набор параметров оценки для (CID, Low, Phosphorylation, Trypsin).Для набора данных мыши, соответствующего (CID, Low, Phosphorylation, Trypsin), мы сравнили количество идентифицированных PSM для MS-GF+ с использованием и без использования набора параметров, специфичного для фосфорилирования, Mascot+Percolator и InsPecT, оснащенных специальной моделью оценки. для (CID, низкий уровень, фосфорилирование, трипсин) 41 (дополнительный рисунок S2a). Интересно, что без специфических для фосфорилирования параметров оценки MS-GF+ превзошел оба инструмента, выявляя на 37% и 44% больше PSM, чем Mascot+Percolator и InsPecT соответственно.С параметрами, специфичными для фосфорилирования, MS-GF + идентифицировал на 9% больше PSM (и на 12% больше PSM фосфопептидов), подтверждая, что наша модель оценки успешно фиксирует склонность к фрагментации, специфичную для фосфорилирования.

Аналогичный результат был получен для набора данных (CID, Low, Ubiquitination, Trypsin) (дополнительный рисунок S3). Подчеркнем, что MS-GF+ ничего не «знает» об особенностях фосфорилирования или убиквитинирования, а просто тренирует скоринговые параметры точно так же, как и для других спектральных типов.Эта возможность легко обучать параметры оценки, специфичные для модификации, для любой модификации будет очень полезна исследователям MS, изучающим PTM.

MS-GF+ для идентификации пептидов, продуцируемых новой протеазой. MS-GF+ применяли для изучения αLP с использованием двух наборов данных

S. pombe , соответствующих (CID, Low, Standard, αLP) и (ETD, Low, Standard, αLP). Мы запустили Mascot+Percolator, OMSSA и MS-GF+, указав «Нет» в качестве фермента.Поскольку αLP продуцирует пептиды с иной склонностью к фрагментации, чем триптические пептиды, Mascot+Percolator и OMSSA показали очень плохие результаты для этого нового спектрального типа. Напротив, MS-GF+ идентифицировал 3535 и 2829 PSM из наборов данных (CID, Low, Standard, αLP) и (ETD, Low, Standard, αLP) с использованием параметров оценки для (CID, Low, Standard, Trypsin) и (ETD). , Низкий, Стандартный, Трипсин) соответственно (дополнительный рисунок S2b). Превосходство MS-GF+ над Mascot+Percolator и OMSSA связано с тем, что его функция оценки адекватна для пептидов αLP (правильный пептид получает максимальное количество баллов) для большей части спектров, даже когда пространство поиска велико (т. указан фермент).Фактически, для набора данных человека, соответствующего (ETD, Low, Standard, Trypsin), когда фермент не был указан и использовалась допуск по массе предшественника 2,5 Da, MS-GF+ идентифицировал 10 937 PSM, всего на 34% меньше по сравнению с полностью поиск трипсина с 7 ppm толерантность к массе прекурсора.

Используя идентифицированные с помощью MS-GF+ PSM, мы обучили параметры оценки для (CID, Низкий, Стандартный, αLP) и (ETD, Низкий, Стандартный, αLP). При использовании этих специфических для αLP параметров оценки количество идентифицированных PSM дополнительно увеличилось до 4788 (+35%) и 3313 (+17%) для (CID, Low, Standard, αLP) и (ETD, Low, Standard, αLP).

Добавить комментарий

Ваш адрес email не будет опубликован.