Компания Google представила новый инструмент для автоматизации разработки моделей машинного обучения. Разработка получила название MLE-STAR и, по словам авторов, уже показывает выдающиеся результаты в профессиональных тестах. Современные системы, использующие технологии машинного обучения, активно применяются в самых разных сферах - от медицины и логистики до обработки изображений и анализа табличных данных.
Однако процесс создания таких систем требует значительных усилий: специалисты вынуждены вручную настраивать код, подбирать архитектуры, обрабатывать данные и проводить десятки экспериментов. Это не только затратно по времени, но и требует высокой квалификации. Именно на эту проблему и нацелен MLE-STAR - цифровой помощник, который самостоятельно выполняет большую часть инженерной работы. Система умеет анализировать поставленную задачу, искать в интернете подходящие примеры кода, адаптировать их под конкретные данные, выявлять наиболее важные части алгоритма и поэтапно улучшать решение. На выходе получается рабочий скрипт, готовый к использованию в реальной задаче.
Ключевым отличием нового решения стало то, как именно оно справляется с улучшением кода. Если другие похожие системы сразу меняют весь скрипт, что часто приводит к ошибкам и упрощённым подходам, MLE-STAR работает иначе. Она фокусируется на отдельных фрагментах - например, только на этапе обработки признаков или объединении моделей - и доводит их до совершенства с помощью повторных улучшений. Система сама выбирает, какую часть кода стоит переработать, а затем запускает серию тестов, чтобы убедиться, что изменения действительно полезны.
Ещё одна интересная особенность - механизм объединения разных вариантов решений. Вместо того чтобы выбирать один лучший вариант, MLE-STAR объединяет несколько подходов в одно более эффективное решение. Такой подход оказался особенно успешным: в специализированных тестах Kaggle новый инструмент продемонстрировал почти в два с половиной раза лучшие результаты, чем предыдущие методы, и занял призовые места в большинстве соревнований. Отдельно разработчики подчёркивают, что система справляется и с типичными ошибками, которые часто допускают крупные языковые модели. Например, она умеет находить случаи, когда при обучении используются данные, которые не должны были использоваться - это может серьёзно искажать результаты. Также MLE-STAR следит за тем, чтобы все доступные источники информации действительно применялись в работе модели, а не игнорировались.
Ещё одно преимущество - гибкость. Система адаптируется под новые подходы без необходимости ручного вмешательства. Однако если возникает потребность, специалисты могут легко добавить собственные элементы: достаточно указать название новой модели, и инструмент сам найдёт способ встроить её в общее решение. В итоге MLE-STAR - это не просто ещё один алгоритм, а полноценный помощник для тех, кто работает с машинным обучением. Он уже сегодня способен сократить время и усилия на создание качественных решений, а благодаря открытому исходному коду может использоваться как в исследовательских, так и в прикладных проектах.