Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше
Хорошо финансируемый французский производитель моделей ИИ Мистраль последовательно пробивал свой вес с момента своего дебюта своей собственной мощной модели Фонда с открытым исходным кодом осенью 2023 года, но в последнее время он потребовал некоторую критику, которую разработчики на X недавно стали последним выпуском собственной крупной языковой модели (LLM), называемой Medium 3, который, как некоторые рассматривали как предательство своего открытого исходного модели.
(Напомним, что модели с открытым исходным кодом могут быть взяты и адаптированы любым любым, в то время как запатентованные модели должны быть оплачены, а их параметры настройки более ограничены и контролируются производителем моделей.)
Но сегодня Мистраль вернулся и возвращается в сообщество ИИ с открытым исходным кодом, в частности, разработка программного обеспечения с AI, в частности. Компания объединилась с стартапом с открытым исходным кодом All Hands AI, создателями Open Devin для выпуска Devstral, новой языковой модели с открытым исходным кодом с параметрами 24 миллиарда-гораздо меньше, чем многие конкуренты, чьи модели и, таким образом, требуя гораздо меньшей вычислительной мощности, так что ее можно запускать на ноутбуке-специально построенный для развития агента.
В отличие от традиционных LLMS, предназначенных для завершения короткой формы кода или генерации изолированных функций, Devstral оптимизирован, чтобы выступить в качестве полного агента по разработке программного обеспечения, способного понимать контекст в разных файлах, навигации по крупным кодовым базам и решить проблемы реального мира.
В настоящее время модель свободно доступна по разрешающей лицензии Apache 2.0, что позволяет разработчикам и организациям развертывать, изменять и коммерциализовать ее без ограничений.
«Мы хотели выпустить что -то открытое для разработчика и сообщества энтузиастов — то, что они могут работать на местном уровне, в частном порядке и изменить, как они хотят», — сказал Баптист Розьера, научный сотрудник Mistral AI. «Он выпущен под Apache 2.0, поэтому люди могут делать с ним в основном все, что они хотят».
Опираясь на Codestral
Devstral представляет следующий шаг в растущем портфеле Mistral, ориентированных на код, после его более раннего успеха в серии Codestral.
Впервые запущенный в мае 2024 года, Кодестал был первоначальным набером Мистрала в специализированные кодирующие LLMS. Это была модель на 22 миллиарда параметра, обученную для обработки более 80 языков программирования, и стала уважаемой за его эффективность в задачах генерации кода и завершения.
Популярность и технические силы модели привели к быстрым итерациям, в том числе запуск Codestral-Mamba-улучшенной версии, построенной на архитектуре Mamba,-и совсем недавно, Codestral 25.01, которая обнаружила внедрение среди разработчиков плагинов IDE и пользователей предприятия, которые ищут высокочастотные модели с низким содержанием латентий.
Импульс вокруг Codestral помог установить Мистраль в качестве ключевого игрока в экосистеме модели кодирования и заложил основу для разработки Devstral-от быстрых завершений до полного выполнения задач.
Превосходит более крупные модели на вершине SWE Benchmarks
Devstral достигает оценки 46,8% по проверке Swe-Bench, набор данных из 500 реальных выпусков GitHub, подтвержденных вручную для правильной.

Это ставит его впереди всех ранее выпущенных моделей с открытым исходным кодом и опередить несколько закрытых моделей, в том числе GPT-4,1-Mini, которые он превосходит более 20 процентных пунктов.
«Прямо сейчас, это довольно лучшая открытая модель для проверки Swe-Bench и для кодовых агентов»,-сказал Розьер. «И это также очень небольшая модель — всего 24 миллиарда параметров — что вы можете работать локально, даже на MacBook».
«Сравните Devstral с закрытыми и открытыми моделями, оцениваемыми под любым каркасом-мы находим, что Devstral достигает значительно лучшей производительности, чем ряд альтернатив с закрытым исходным кодом»,-пишет София Ян, доктор философии, руководитель отдела разработчиков в Mistral AI, в социальную сеть X. «Например, Devstral превосходит недавние GPT-4,1-миними на 20%».
Модель создана из Mistral Small 3.1 с использованием методов обучения подкреплению и выравнивания безопасности.
«Мы начали с очень хорошей базовой модели с небольшим контролем деревьев Мистрала, которая уже работает хорошо», — сказал Розьер. «Затем мы специализируем его, используя методы безопасности и подкрепления, чтобы улучшить его производительность на Swe-Bench».
Построен для агентской эпохи
Devstral-это не просто модель генерации кода-она оптимизирована для интеграции в агентские рамки, такие как OpenHands, Swe-Agent и OpenDevin.
Эти каркасы позволяют Devstral взаимодействовать с тестовыми случаями, ориентироваться в исходных файлах и выполнять многоэтапные задачи в разных проектах.
«Мы выпускаем его с Opendevin, который является лесом для кодовых агентов», — сказал Розьер. «Мы строим модель, и они создают леса — набор подсказок и инструментов, которые модель может использовать, например, бэкэнд для модели разработчика».
Чтобы обеспечить надежность, модель была протестирована в разных репозиториях и внутренних рабочих процессах.
«Мы были очень осторожны, чтобы не переполняться в Swe-Bench»,-объяснил Розьер. «Мы обучались только данным из репозиториев, которые не клонированы из набора SWE-Bench, и проверили модель в разных структурах».
Он добавил, что Devstral Mistral Devstral внутренне, чтобы обеспечить хорошо обобщать его на новые, невидимые задачи.
Эффективное развертывание с разрешающей открытой лицензией — даже для предприятия и коммерческих проектов
Компактная архитектура Devstral 24B делает практическим для разработчиков локально, будь то на одном графическом процессоре RTX 4090 или Mac с 32 ГБ оперативной памяти. Это делает его привлекательным для чувствительных к конфиденциальности вариантов использования и развертывания преимуществ.
«Эта модель нацелена на энтузиастов и людей, которые заботятся о том, чтобы запустить что -то на месте и в частном порядке — то, что они могут использовать даже в самолете без интернета», — сказал Розьер.
Помимо производительности и переносимости, его лицензия Apache 2.0 предлагает убедительное предложение для коммерческих приложений. Лицензия разрешает неограниченное использование, адаптация и распределение-даже для проприетарных продуктов-создание Devstral вариант с низким содержанием фарцирования для принятия предприятий.
Подробные спецификации и инструкции по использованию доступны на модельной карте Devstral-Small-2505 для обнимающего лица.
Модель имеет окно контекста токена 128 000 и использует токенизатор Tekken с 131 000 словарным запасом.
Он поддерживает развертывание через все основные платформы с открытым исходным кодом, включая обнимающееся лицо, Ollama, Kaggle, LM Studio и Unsloth, и хорошо работает с такими библиотеками, как VLLM, Transformers и вывод Mistral.
Доступно через API или на местном уровне
DevStral доступен через API API Platforme API API API Applecke Application) под именем модели Devstral-Small-2505, причем ценообразование в размере 0,10 долл. США за миллион входных токенов и 0,30 долл. США за токены на миллион.
Для тех, кто развертывается локально, поддержка фреймворков, таких как OpenHands, позволяет интеграции с кодовыми базами и агентскими рабочими процессами из коробки.
Розьери поделился тем, как он включает Devstral в свой собственный поток разработки: «Я использую его сам. Вы можете попросить его выполнять небольшие задачи, например, обновление версии пакета или изменение сценария токенизации. Он находит правильное место в вашем коде и вносит изменения. Это очень приятно использовать».
Больше впереди
В то время как Devstral в настоящее время выпускается в качестве исследовательского предварительного просмотра, Mistral и All Hands Ai уже работают над более крупной последующей моделью с расширенными возможностями. «Всегда будет разрыв между меньшими и более крупными моделями, — отметил Розьер, — но мы проработали долгий путь в том, чтобы преодолеть это. Эти модели уже работают очень сильно, даже по сравнению с некоторыми более крупными конкурентами».
Благодаря своему показателям производительности, разрешительной лицензии и агентским дизайном, Devstral позиционирует себя не только как инструмент генерации кода, но и как основополагающая модель для создания автономных систем разработки программного обеспечения.
Источник
