Исследователи создают нейронную сеть для геномики, которая объясняет, как она позволяет получать точные прогнозы

27.10.2023

Команда компьютерщиков из Нью-Йоркского университета создала нейронную сеть, которая может объяснить, как она достигает своих прогнозов. Работа раскрывает, чем обусловлена функциональность нейронных сетей — движков, которые управляют искусственным интеллектом и машинным обучением, — тем самым освещая процесс, который в значительной степени был скрыт от пользователей.

Прорыв сосредоточен на конкретном использовании нейронных сетей, которое стало популярным в последние годы, — решении сложных биологических вопросов. Среди них изучение тонкостей сплайсинга РНК — центрального элемента исследования, который играет важную роль в передаче информации от ДНК к функциональной РНК и белковым продуктам.

“Многие нейронные сети являются черными ящиками — эти алгоритмы не могут объяснить, как они работают, что вызывает опасения по поводу их надежности и сдерживает прогресс в понимании биологических процессов, лежащих в основе кодирования генома”, – говорит Одед Регев, профессор компьютерных наук в Институте математических наук Куранта Нью-Йоркского университета и старший автор статьи, которая была опубликована в журнале Proceedings of the National Academy of Sciences.

“Используя новый подход, который улучшает как количество, так и качество данных для обучения машинному обучению, мы разработали интерпретируемую нейронную сеть, которая может точно предсказывать сложные результаты и объяснять, как она приходит к своим прогнозам”.

Регев и другие авторы статьи, Сьюзан Ляо, научный сотрудник Института Куранта, и Мукунд Сударшан, докторант Куранта на момент проведения исследования, создали нейронную сеть, основанную на том, что уже известно о сплайсинге РНК.

В частности, они разработали модель — управляемый данными эквивалент мощного микроскопа, — которая позволяет ученым отслеживать и количественно оценивать процесс сплайсинга РНК, от входной последовательности до прогнозирования сплайсинга на выходе.

“Используя подход “интерпретируемый по замыслу”, мы разработали модель нейронной сети, которая дает представление о сплайсинге РНК – фундаментальном процессе передачи геномной информации”, – отмечает Регев. “Наша модель показала, что небольшая, похожая на шпильку структура в РНК может уменьшать сплайсинг”.

Исследователи подтвердили выводы, которые дает их модель, с помощью серии экспериментов. Эти результаты показали совпадение с открытием модели: всякий раз, когда молекула РНК сворачивалась в конфигурацию шпильки, сплайсинг останавливался, и в тот момент, когда исследователи нарушали эту структуру шпильки, сплайсинг восстанавливался.