Microsoft представила свои первые внутренние модели искусственного интеллекта

Microsoft запустила новые модели искусственного интеллекта, которые могут конкурировать с GPT-5 и другими передовыми системами. Конкурент OpenAi? Страшный сон Apple Intelligence? Может быть.
Юлия Мискевич
Юлия Мискевич
Редакция
Microsoft представила свои первые внутренние модели искусственного интеллекта
www.theverge.com

В мире больших технологий тишина — это роскошь. Пока мы пытались научиться отключать уведомления, Microsoft поставила себе противоположную задачу: заставить наши устройства говорить еще больше, еще быстрее и... еще убедительнее.

Компания из Редмонда представила свои первые собственные модели искусственного интеллекта — MAI-Voice-1 и MAI-1-preview, — и, кажется, они решили, что если уж звучать, то со скоростью света и пафосом диктора федерального канала.

Главный герой этой истории — MAI-Voice-1, речевая модель, которая генерирует минуту аудио меньше чем за секунду. Да, вы не ослышались. Пока вы произносите слово «привет», этот ИИ уже успеет озвучить прогноз погоды, прорекламировать вам зубную пасту и начать запись подкаста о квантовой физике. Все это — на одном-единственном GPU, что делает его идеальным собеседником для тех, кто терпеть не может пауз в разговоре.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Tech Edition
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Уже сейчас MAI-Voice-1 работает в Copilot Daily, где рассказывает главные новости. А еще он уже генерирует подкасты — вероятно, чтобы мы наконец перестали чувствовать себя одиноко в пробке.

Хотите попробовать? Добро пожаловать в Copilot Labs! Там можно ввести любой текст — например, сонет Шекспира или список покупок — и выбрать голос и стиль речи. Хриплый баритон, рассказывающий о необходимости купить туалетную бумагу? Запросто! Microsoft дает нам в руки инструмент, о котором мы не просили, но который, возможно, тайно хотели.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Но и это не все. Пока MAI-Voice-1 развлекает публику, его старший брат — MAI-1-preview — учится на 15 000 GPU Nvidia H100. Руководитель Microsoft AI Мустафа Сулейман скромно заметил, что их модели ориентированы не на корпоративные нужды, а на простых пользователей. То есть скоро ваш ноутбук будет не только показывать рекламу, но и зачитывать ее вслух в манере театрального актера.

Freepik
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Планы у Microsoft, как водится, грандиозные. MAI-1-preview скоро начнет помогать Copilot в текстовых задачах — пока на подхвате у моделей OpenAI, но уже явно метя на главную роль. А еще модель уже тестируют на платформе LMArena, где она, наверное, сдает экзамен по мимикрии под человека.

«У нас большие амбиции», — пишет Microsoft в своем блоге. И мы верим. Скорее всего, скоро нас ждет мир, в котором наши телефоны, холодильники и кофеварки будут вести оживленные беседы без нашего участия. Осталось только научиться их вовремя останавливать... или просто смириться с тем, что тишина стала цифровой роскошью.