В мире больших технологий тишина — это роскошь. Пока мы пытались научиться отключать уведомления, Microsoft поставила себе противоположную задачу: заставить наши устройства говорить еще больше, еще быстрее и... еще убедительнее.
Microsoft представила свои первые внутренние модели искусственного интеллекта

Главный герой этой истории — MAI-Voice-1, речевая модель, которая генерирует минуту аудио меньше чем за секунду. Да, вы не ослышались. Пока вы произносите слово «привет», этот ИИ уже успеет озвучить прогноз погоды, прорекламировать вам зубную пасту и начать запись подкаста о квантовой физике. Все это — на одном-единственном GPU, что делает его идеальным собеседником для тех, кто терпеть не может пауз в разговоре.

Уже сейчас MAI-Voice-1 работает в Copilot Daily, где рассказывает главные новости. А еще он уже генерирует подкасты — вероятно, чтобы мы наконец перестали чувствовать себя одиноко в пробке.
Хотите попробовать? Добро пожаловать в Copilot Labs! Там можно ввести любой текст — например, сонет Шекспира или список покупок — и выбрать голос и стиль речи. Хриплый баритон, рассказывающий о необходимости купить туалетную бумагу? Запросто! Microsoft дает нам в руки инструмент, о котором мы не просили, но который, возможно, тайно хотели.
Но и это не все. Пока MAI-Voice-1 развлекает публику, его старший брат — MAI-1-preview — учится на 15 000 GPU Nvidia H100. Руководитель Microsoft AI Мустафа Сулейман скромно заметил, что их модели ориентированы не на корпоративные нужды, а на простых пользователей. То есть скоро ваш ноутбук будет не только показывать рекламу, но и зачитывать ее вслух в манере театрального актера.

Планы у Microsoft, как водится, грандиозные. MAI-1-preview скоро начнет помогать Copilot в текстовых задачах — пока на подхвате у моделей OpenAI, но уже явно метя на главную роль. А еще модель уже тестируют на платформе LMArena, где она, наверное, сдает экзамен по мимикрии под человека.