Создатели GuppyLM показали, как может выглядеть простая модель ИИ без сложной инфраструктуры. Проект ориентирован на наглядное объяснение принципов работы таких систем.
Изображение: Notebookcheck
GuppyLM — это небольшая модель ИИ с 8,7 миллионами параметров. Разработчики выложили проект с открытым кодом и упростили запуск. Пользователь может работать с ним через Google Colab или локально.
Модель ИИ обучили на 60 тысячах синтетических диалогов. Она отвечает короткими фразами и придерживается заданного стиля, что делает ее поведение предсказуемым. В предобученной версии это приветствия и вопросы о еде, воде, свете, сне или смысле жизни — всегда с точки зрения рыбки.
GitHub предлагает браузерную демонстрацию, где модель запускается локально. Также можно запустить предварительно обученную версию через Colab или с помощью Python. Желающие могут обучить свою собственную мини-модель через подготовленный блокнот Colab.
Процесс обучения работает так. Модель получает пары примеров: входные данные и соответствующий ответ. На каждом шаге модель сравнивает своё предсказание с желаемым ответом и корректирует свои внутренние настройки. Так GuppyLM постепенно учится, как должна говорить рыбка.