Инструмент на основе ИИ выявляет мутации, вызывающие заболевания03.07.2025 ![]() Используя геномные данные десятков тысяч человек, учёные разработали глубокую нейронную сеть, которая может предсказывать, как изменения в последовательностях промоторов повлияют на экспрессию генов. Каждая клетка в организме похожа на крошечную миску с генетическим супом, содержащим РНК из тысяч генов. Но в отличие от настоящей миски с супом, которая может простить избыток или недостаток некоторых ингредиентов, отклонения от нормального уровня экспрессии генов могут иметь пагубные последствия для клеток. Эти изменения в экспрессии генов могут привести к таким заболеваниям, как рак, диабет, аутоиммунные и сердечно-сосудистые заболевания. Различные регуляторные элементы ДНК работают вместе, обеспечивая соответствие экспрессии генов потребностям клетки, и ключевым из них является промотор гена. Ранее учёные показали, что промоторы могут кардинально изменять экспрессию генов, что позволяет предположить, что мутации в этих некодирующих участках ДНК могут быть основной причиной редких генетических заболеваний и рака. Однако выявить такие патогенные варианты промоторов сложно.
![]() Не хватало инструментов, необходимых для выявления проблемных вариантов. Чтобы восполнить этот пробел, Фарх и его команда разработали глубокую нейронную сеть PromoterAI, которая точно определяет варианты промоторов, нарушающие экспрессию генов. Согласно модели, опубликованной в Science, на мутации промоторов приходится шесть процентов генетических заболеваний. «Связь с генетикой редких заболеваний очень впечатляющая и убедительная, — сказал Фабиан Тейс, биолог-вычислитель из Мюнхенского технического университета, который не принимал участия в исследовании. — Именно там эти мутации часто оказывают сильное влияние». Фарх уже много лет увлечённо изучает некодирующий геном и разработал инструменты на основе искусственного интеллекта для понимания последствий вариантов сплайсинга и миссенс-мутаций. Вдохновлённый работой этих моделей, он решил создать PromoterAI. Введя в модель последовательности ДНК вокруг промоторов, Фарх и его команда сначала обучили сеть предсказывать, как вариант повлияет на доступность ДНК, модификации гистонов и взаимодействие ферментов с ДНК — всё это влияет на экспрессию генов. Чтобы сделать модель более надёжной, исследователи использовали данные из когорты Genotype-Tissue Expression v8 (GTEx) — хранилища, содержащего информацию о редких некодирующих вариантах промоторов, которые в крайних случаях влияют на экспрессию генов. База данных содержала парные последовательности всего генома и уровни РНК более чем у 800 человек, что помогло модели научиться прогнозировать, повлияет ли вариант промотора на экспрессию генов. Затем Фарх захотел проверить, насколько хорошо PromoterAI работает с когортами, с которыми он никогда не сталкивался. Он представил информацию из Британского биобанка, которая включает в себя последовательности всего генома и уровни белков в плазме крови более чем 50 000 участников. Модель точно определяла варианты промоторов в геноме, которые кардинально изменяли экспрессию белков. При тестировании на когорте с редкими вариантами прогнозы PromoterAI подтвердились. Чтобы сделать этот инструмент более пригодным для медицинских целей, Фарх и его команда протестировали его на наборах данных, включающих парную информацию об уровнях экспрессии генов и клинических результатах. Они обнаружили, что он может идентифицировать варианты промоторов, которые влияют на распространённые биомаркеры, такие как ферменты печени и уровень холестерина. Одной из главных целей Фарха и его команды было немного лучше понять причины редких генетических заболеваний. «Сейчас мы диагностируем около трети случаев редких заболеваний, анализируя только кодирующую последовательность белка. Значит, должно быть объяснение для тех случаев, которые мы упускаем из виду, — сказал он. — Мы подозреваем, что многие из них можно объяснить некодирующими мутациями». Когда команда применила PromoterAI к группе пациентов с редкими заболеваниями или раком, они обнаружили, что на долю вариантов промотора приходится шесть процентов бремени болезни. В сочетании с вариантами сплайсинга распространённость увеличивается до 20 процентов. Фарх уже изучает другие некодирующие элементы, такие как энхансеры и сайты-мишени микроРНК, и их влияние на здоровье человека. «Они также очень хорошо сохраняются, что убедительно свидетельствует о том, что мутации в этих областях могут определённо приводить к тяжёлым редким заболеваниям или раку», — сказал он. По словам Тэйса, это отправная точка для понимания языка ДНК. «Зачем просто смотреть на варианты промоторов? — сказал он. — Теперь люди могут легко получить доступ к этим моделям и начать объединять их, чтобы задавать более сложные вопросы». Источник: TheScientist
Комментарии:Пока комментариев нет. Станьте первым! |