OpenAI выпускает бесплатные ИИ-модели, которые можно обучить для своих задач

Компания OpenAI выпустила две новые языковые модели с открытыми весами gpt-oss-120b и gpt-oss-20b, которые пользователи могут свободно загружать и модифицировать. Эксперты оценивают этот шаг OpenAI как попытку противостояния американским и китайским конкурентам в области открытых моделей искусственного интеллекта.
Владимир Губайловский
Владимир Губайловский
OpenAI выпускает бесплатные ИИ-модели, которые можно обучить для своих задач
Unsplash
Выпуск открытых моделей OpenAI происходит в условиях, когда китайский стартап DeepSeek встряхнул индустрию своей низкозатратной высокопроизводительной моделью с открытыми весами. CEO OpenAI Сэм Альтман ранее в этом году признал, что его компания оказалась «на неправильной стороне истории» в вопросе открытости своих технологий. Теперь OpenAI решила исправиться.

Компания OpenAI анонсировала выход двух новых моделей искусственного интеллекта, которые можно бесплатно загрузить и изменить. Это решение направлено на конкуренцию с аналогичными предложениями американских и китайских разработчиков. Релиз моделей gpt-oss-120b и gpt-oss-20b происходит на фоне давления на компанию с требованием поделиться внутренними механизмами своего программного обеспечения в духе ее изначальной некоммерческой миссии.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Unsplash

Каждая модель представляет собой Transformer, использующий архитектуру архитектуру Mixture-of-Experts (MoE), которая позволяет активировать относительно небольшое число параметров на каждый токен для сокращения количества активных параметров, необходимых для обработки входных данных. GPT-oss-120b активирует 5,1 миллиарда параметров на токен (общее количество 117 миллиардов), а gpt-oss-20b — 3,6 миллиарда (общее количество 21 миллиард). Общее количество параметров составляет 117 и 21 миллиард соответственно.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Возвращение OpenAI к открытому ПО

Unsplash

CEO OpenAI Сэм Альтман подчеркнул, что миссия компании с момента ее основания в 2015 году заключается в обеспечении того, чтобы искусственный общий интеллект приносил пользу всему человечеству. Модели с открытыми весами позволяют пользователям получить доступ к обученным параметрам и настроить их под свои потребности.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Новые текстовые модели обеспечивают высокую производительность при низкой стоимости. Они подходят для задач поиска в интернете или выполнения компьютерного кода и спроектированы для легкого запуска на локальных компьютерных системах. Модель gpt-oss-20b показывает результаты, сопоставимые с o3-mini OpenAI на общих бенчмарках, и может работать на периферийных устройствах всего с 16 ГБ памяти.

Компания рассказала технические подробности тестирования моделей и выложила подробное описание загрузки и запуска.