Платим блогерам
Блоги
kosmos_news
Современные модели ИИ требуют больших вычислительных мощностей. Однако модели меньшего размера могут работать на старых системах: это доказали программисты, которым удалось запустить версию Llama на старом компьютере с Windows 98.

В последние годы многие компании, работающие в сфере искусственного интеллекта, такие как OpenAI и Google, масштабируют свои модели. Запуск больших языковых моделей с миллиардами параметров и предоставление их всем пользователям одновременно требуют огромной вычислительной мощности. Но что, если бы таких вычислительных мощностей вообще не было и разработчики продолжали использовать старые технологии?
Модели ИИ также можно запускать на старом ПК
Программисты EXO Labs также задавали себе этот вопрос. Они приобрели старый компьютер с Windows 98, чтобы запустить на нём ИИ-модель. Согласно сообщению в блоге, оборудованию более 25 лет. Программисты заплатили за него около 119 британских фунтов. У компьютера был процессор Intel Pentium II и 128 мегабайт оперативной памяти.

По сравнению с сегодняшними домашними компьютерами это, конечно, ничтожно малая производительность. Если сравнить все это с центрами обработки данных ИИ, энергопотребление которых продолжает стремительно расти, то проект кажется практически невыполнимым. Но на самом деле, выполнив всего несколько простых шагов, на компьютере можно запустить небольшую версию Llama 2 с общим количеством параметров 260 000.

Может быть интересно

В число необходимых шагов входило подключение старого оборудования к порту PS/2, поскольку имеющиеся порты USB не работали. Затем Llama 2 была перенесена на ПК через FTP. Это было лишь временным решением, поскольку ПК не распознавал диски, а имеющийся жесткий диск с четырьмя терабайтами памяти был слишком большим для файловой системы FAT32 под Windows 98.

Результат: в старой версии Windows 98 модель с 260 000 параметрами может генерировать около 40 токенов в секунду (токены представляют собой наименьшие единицы данных, которые обрабатывает модель, такие как слова или символы при обработке естественного языка).

Программисты также использовали старое оборудование с языковой моделью с 15 миллионами параметров. В этом случае оборудование начало тормозить и генерировать только один токен в секунду.

Используя тест производительности, программисты подсчитали, как долго ПК с Windows 98 сможет работать с моделью Llama 3.2 и, следовательно, с миллиардом параметров. Однако результат в 0,0093 токена в секунду непригоден для нормального использования ИИ.



Источник: blog.exolabs.net
+
Написать комментарий (0)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают