Новая методика, основанная на математике 18-го века, показывает, что более простые модели искусственного интеллекта не нуждаются в глубоком обучении

10.10.2023

Исследователи из Университета Ювяскюля смогли упростить самую популярную технику искусственного интеллекта – глубокое обучение, используя математику 18 века. Они также обнаружили, что классические алгоритмы обучения, которым уже 50 лет, работают лучше, чем популярные в последнее время методы. Их более простой подход способствует экологизации информационных технологий и является более простым в использовании и понимании.

Недавний успех искусственного интеллекта в значительной степени основан на использовании одного ключевого метода: глубокого обучения. Глубокое обучение относится к методам искусственного интеллекта, при которых сети с большим количеством уровней обработки данных обучаются с использованием массивных наборов данных и значительного объема вычислительных ресурсов.

Глубокое обучение позволяет компьютерам выполнять сложные задачи, такие как анализ и генерация изображений и музыки, воспроизведение оцифрованных игр и, совсем недавно в связи с ChatGPT и другими методами генеративного искусственного интеллекта, выступать в качестве диалогового агента на естественном языке, который предоставляет высококачественные резюме существующих знаний.

Шесть лет назад профессор Томми Кярккяйнен и докторант Ян Ханнинен провели предварительные исследования по сокращению объема данных. Результаты оказались неожиданными: если объединить простые сетевые структуры новым способом, то глубина не нужна. Аналогичные или даже лучшие результаты могут быть получены с помощью неглубоких моделей.

“Использование методов глубокого обучения – сложная и подверженная ошибкам работа, а результирующие модели трудно поддерживать и интерпретировать”, – говорит Кярккяйнен. “Наша новая модель в ее упрощенной форме более выразительна и может надежно сокращать большие наборы данных, сохраняя в них всю необходимую информацию”.

Структура новой технологии искусственного интеллекта восходит к математике 18-го века. Кярккяйнен и Ханнинен также обнаружили, что традиционные методы оптимизации 1970-х годов лучше работают при подготовке их модели по сравнению с методами 21-го века, используемыми в глубоком обучении.

“Наши результаты гарантируют, что использование нейронных сетей в различных приложениях стало проще и надежнее, чем раньше”, – предполагает Ханнинен. Исследование опубликовано в журнале Neurocomputing.

Более простые модели приводят к более экологичному и этичному ИИ

Искусственный интеллект играет все более значительную роль в современных технологиях, и поэтому все более важно понимать, как ИИ делает то, что он делает.

“Чем прозрачнее и проще искусственный интеллект, тем легче рассматривать его этичное использование”, – говорит Кярккяйнен. “Например, в медицинских приложениях методы глубокого обучения настолько сложны, что их простое использование может поставить под угрозу безопасность пациентов из-за неожиданного, скрытого поведения”.

Исследователи отмечают, что более простые модели могут помочь в разработке “зеленых” ИТ и являются более экологичными, поскольку они экономят вычислительные ресурсы и потребляют значительно меньше энергии.

Результаты, которые бросают вызов общепринятым представлениям и популярным в настоящее время представлениям о методах глубокого обучения, было трудно опубликовать.

“Глубокое обучение играет такую важную роль в исследованиях, разработках и бизнесе искусственного интеллекта, что, даже если наука всегда прогрессирует и отражает последние данные, само сообщество может сопротивляться изменениям”.

“Нам очень интересно посмотреть, как эти результаты будут восприняты научным и деловым сообществом”, – говорит Кярккяйнен. “Наш новый искусственный интеллект имеет широкий спектр применений в наших собственных исследованиях, от нанотехнологий для получения более качественных материалов в устойчивой экономике до улучшения цифровой среды обучения и повышения надежности и прозрачности медицинских технологий и технологий обеспечения благополучия”.