Аналог ChatGPT: нейросеть Claude

Возможно, в будущем Claude будет даже лучше ChatGPT. Он уже умеет больше

Компания Anthropic представила Claude 2, большую языковую модель (LLM), похожую на ChatGPT, которая может создавать код, анализировать текст и файлы. В отличие от оригинальной версии Claude, выпущенной в марте, пользователи могут бесплатно попробовать Claude 2 на новом веб-сайте. Нейросеть также доступна в виде коммерческого API для разработчиков.

Аналог ChatGPT

Anthropic говорит, что Claude разработан для имитации разговора с услужливым коллегой или личным помощником и что новая версия учитывает отзывы пользователей предыдущей модели: «Мы слышали от наших пользователей, что с Claude легко общаться, он четко объясняет ход своих мыслей, с меньшей вероятностью выдает вредные результаты и обладает более длинной памятью».

Anthropic утверждает, что Claude 2 демонстрирует достижения в трех ключевых областях: кодировании, математике и рассуждениях. «Наша последняя модель набрала 76,5% баллов в разделе "множественный выбор" экзамена Bar, по сравнению с 73,0% у Claude 1.3», — пишут они. «По сравнению со студентами колледжей, поступающими в аспирантуру, Claude 2 набрал более 90-го процентиля на экзаменах GRE по чтению и письму, и аналогично среднему кандидату по количественному мышлению».

Одним из основных улучшений Claude 2 является увеличенная длина ввода и вывода. Anthropic экспериментирует с обработкой подсказок объемом до 100 000 токенов (фрагментов слов), что позволяет модели искусственного интеллекта анализировать длинные документы, такие как технические руководства или целые книги. Увеличенный объем также распространяется на его выходные данные, позволяя создавать более длинные документы.

Что касается возможностей кодирования, Claude 2 продемонстрировал заметный рост мастерства. Его оценка в Codex HumanEval, тесте по программированию на Python, выросла с 56 процентов до 71,2 процента. Аналогичным образом, в GSM8k, тесте, включающем математические задачи для начальной школы, он улучшился с 85,2 до 88 процентов.

Одной из основных задач Anthropic было сделать так, чтобы его языковая модель с меньшей вероятностью генерировала «вредные» или «оскорбительные» выходные данные при определенных запросах, хотя измерение этих качеств является крайне субъективным и сложным. Согласно внутренней оценке разработчиков, «Claude 2 в 2 раза лучше давал безвредные ответы по сравнению с Claude 1.3».