DeepSeek R1-0528 прибывает в мощный вызов с открытым исходным кодом в Openai O3 и Google Gemini 2.5 Pro

admin

Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше


Кит вернулся.

After rocking the global AI and business community early this year with the January 20 initial release of its hit open source reasoning AI model R1, the Chinese startup DeepSeek — a spinoff of formerly only locally well-known Hong Kong quantitative analysis firm High-Flyer Capital Management — has released DeepSeek-R1-0528, a significant update that brings DeepSeek’s free and open model near parity in reasoning capabilities with proprietary paid models such as OpenAI’s o3 and Google Gemini 2.5 Pro

Это обновление предназначено для обеспечения более высокой производительности в сложных рассуждающих задачах по математике, науке, бизнесу и программированию, а также расширенные функции для разработчиков и исследователей.

Как и его предшественник, DeepSeek-R1-0528 доступен по разрешающей и открытой лицензии MIT, поддерживая коммерческое использование и позволяет разработчикам настроить модель в соответствии с их потребностями.

Веса модели с открытым исходным кодом доступны с помощью сообщества, обнимающего сообщество, обнимающегося сообщества, а также подробная документация для тех, кто развертывается локально или интегрируется через API DeepSeek.

Существующие пользователи DeepSeek API автоматически будут обновляться их выводы модели до R1-0528 без дополнительных затрат. Текущая стоимость API DeepSeek составляет 0,14 долл. США за 1 миллион входных токенов в течение обычных часов с 8:30 до 12:30 (падает до 0,035 долл. В часы скидки). Выход для 1 миллиона токенов постоянно стоит 2,19 долл. США.

Для тех, кто хочет запустить модель локально, DeepSeek опубликовал подробные инструкции по своему репозиторию GitHub. Компания также поощряет сообщество предоставлять обратную связь и вопросы по электронной почте.

Отдельные пользователи могут попробовать его бесплатно через веб -сайт DeepSeek здесь, хотя вам нужно предоставить номер телефона или доступ к учетной записи Google, чтобы войти в систему.

Усовершенствованные рассуждения и эталонная производительность

В основе обновления лежат значительные улучшения в способности модели справляться с сложными задачами.

DeepSeek объясняет в своей новой модельной карте на Huggingface, что эти усовершенствования связаны с использованием повышенных вычислительных ресурсов и применения алгоритмических оптимизаций в пост-тренировке. Этот подход привел к заметным улучшениям по различным критериям.

Например, в тесте AIME 2025 точность DeepSeek-R1-0528 поднялась с 70% до 87,5%, что указывает на более глубокие процессы рассуждений, которые сейчас в среднем 23 000 токенов на вопрос по сравнению с 12 000 в предыдущей версии.

Производительность кодирования также показала повышение, с точностью в наборе данных LiveCodeBench, увеличивающемся с 63,5% до 73,3%. На требовательном «Последнем экзамене человечества» производительность более чем удвоилась, достигнув 17,7% с 8,5%.

Эти достижения приближают DeepSeek-R1-0528 к производительности установленных моделей, таких как Openai O3 и Gemini 2.5 Pro, в соответствии с внутренними оценками-обе эти модели либо имеют ограничения по ставке и/или требуют оплачиваемых подписок для доступа.

UX обновления и новые функции

Помимо улучшений производительности, DeepSeek-R1-0528 представляет несколько новых функций, направленных на улучшение пользовательского опыта.

Обновление добавляет поддержку вызова вывода и функций JSON, функции, которые должны упростить разработчикам интеграцию возможностей модели в свои приложения и рабочие процессы.

Возможности фронта также были уточнены, и Deepseek говорит, что эти изменения создадут более плавное, более эффективное взаимодействие для пользователей.

Кроме того, скорость галлюцинации модели была снижена, что способствует более надежной и последовательной производительности.

Одним из заметных обновлений является введение системных подсказок. В отличие от предыдущей версии, которая требовала специального токена в начале вывода для активации режима «мышления», это обновление удаляет эту необходимость, оптимизируя развертывание для разработчиков.

Меньшие варианты для тех, у кого более ограниченные вычислительные бюджеты

Наряду с этим релизом DeepSeek переработал свои рассуждения о цепочке мыслей в меньший вариант, DeepSeek-R1-0528-QWEN3-8B, что должно помочь этим принимающим решениям и разработчикам предприятия, у которых нет аппаратного обеспечения, необходимого для выполнения полного.

Эта дистиллированная версия, как сообщается, достигает современной производительности среди моделей с открытым исходным кодом в таких задачах, как AIME 2024, превосходя QWEN3-8B ​​на 10% и соответствует QWEN3-235B-CINDICE.

Согласно Modal, запуск крупной языковой модели на 8 миллиардов параметра (LLM) в полуоперации (FP16) требует приблизительно 16 ГБ памяти графического процессора, что примерно 2 ГБ на параметры на миллиард.

Следовательно, единого высококачественного графического процессора с не менее 16 ГБ VRAM, такого как NVIDIA RTX 3090 или 4090, достаточно, чтобы запустить 8B LLM по точке FP16. Для дальнейших квантовых моделей можно использовать графические процессоры с 8–12 ГБ VRAM, как RTX 3060.

DeepSeek считает, что эта дистиллированная модель окажется полезной для академических исследований и промышленных приложений, требующих меньших моделей.

Начальные реакции разработчика ИИ и влияния

Обновление уже привлекло внимание и похвалу от разработчиков и энтузиастов в социальных сетях.

Haider aka «@slow_developer» поделился на x, что Deepseek-R1-0528 «просто невероятна в кодировании», описывая, как он сгенерировал чистый код и рабочие тесты для задания системы оценки слова, оба из которых идеально работали с первой попытки. По его словам, только O3 ранее сумел соответствовать этой производительности.

Тем временем Лисан Аль Гайб опубликовал, что «DeepSeek стремится к King: O3 и Gemini 2.5 Pro», отражая консенсус, который новое обновление приближает модель Deepseek к этим лучшим исполнителям.

Другой влиятельный человек и слухи, пухлый, прокомментировал, что «DeepSeek готовила!» и выделил, как новая версия почти наравне с O3 и Gemini 2.5 Pro.

Пухлый даже предположил, что последнее обновление R1 может указывать на то, что DeepSeek готовится выпустить свою долгожданную и предполагаемую пограничную модель «R2».

Глядя в будущее

Выпуск DeepSeek-R1-0528 подчеркивает приверженность Deepseek предоставлять высокопроизводительные модели с открытым исходным кодом, которые приоритет рассуждениям и удобству использования. Объединяя измеримые базовые выгоды с практическими функциями и разрешительную лицензию с открытым исходным кодом, DeepSeek-R1-0528 позиционируется в качестве ценного инструмента для разработчиков, исследователей и энтузиастов, стремящихся использовать новейшие в языковой модели.



Источник

Рекомендуем

Оставить комментарий