OpenAI запускает исследовательский предварительный просмотр агента разработчиков программного обеспечения Codex AI для разработчиков — с параллельными задачами

Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше

Удивительно! Спустя всего несколько дней после того, как появились сообщения о том, что Openai покупала стартап с белым кодированием Windsurf, бывшая компания, по-видимому, запускает свой собственный сервис конкурентов в качестве предварительного просмотра исследования под его брендом Codex, и он встречает Windsurf, Cursor и растущий список инструментов кодирования AI, предлагаемых стартапами и крупными технологическими компаниями, включая Microsoft и Amazon.

В отличие от предыдущей модели AI Code Code Code Openai, новая версия представляет собой полный облачный агент по разработке программного обеспечения AI (SWE), созданный на тонкой настройке модели рассуждения O3 Operai, который может выполнять несколько задач разработки параллельно.

Начиная с сегодняшнего дня, он будет доступен для Chatgpt Pro, Enterprise и пользователей команды, при поддержке пользователей Plus и EDU ожидается в ближайшее время.

Эволюция Codex: от модели до автономного агента кодирования ИИ

Этот выпуск знаменует собой значительный шаг вперед в разработке Кодекса. Оригинальный Codex дебютировал в 2021 году в качестве модели для перевода естественного языка в код, доступный через зарождающийся интерфейс программирования приложений OpenAI.

Это был двигатель, стоящий за Github Copilot, популярным помощником по кодированию в стиле автозаполнения, предназначенным для работы в рамках IDE, таких как Visual Studio Code.

Эта первоначальная итерация была сосредоточена на генерации и завершении кода, обученной миллиардам линий общедоступного исходного кода.

Тем не менее, ранняя версия пришла с ограничениями. Он был подвержен синтаксическим ошибкам, небезопасным предложениям кода и смещениям, встроенным в его обучающие данные. Кодекс иногда предложил поверхностно правильный код, который не выполнял функционально, а в некоторых случаях делал проблемные ассоциации на основе подсказок.

Несмотря на эти недостатки, это показало достаточно перспектив, чтобы установить инструменты кодирования ИИ в качестве быстро растущей категории продуктов. По словам представителя Openai, эта оригинальная модель установилась и превращена в название нового набора продуктов.

Github Copilot официально перешел из модели Codex Openai в марте 2023 года, приняв GPT-4 в рамках своего обновления Copilot X, чтобы обеспечить более глубокую интеграцию IDE, возможности чата и более широкие предложения по контексту.

Агентские видения

Новый кодекс выходит далеко за рамки своего предшественника. Теперь Codex, созданный для управления автономно более длительными, Codex может писать функции, исправлять ошибки, отвечать на вопросы, специфичные для базы, запускать тесты и предлагать запросы на привлечение-начнут выполнять задачу в безопасной изолированной облачной песочнице.

Дизайн отражает более широкие амбиции Openai, чтобы выходить за рамки быстрых ответов и в совместную работу.

Джош Тобин, который возглавляет исследовательскую группу агентов в Openai, сказал во время недавнего брифинга: «Мы думаем о агентах как о системах ИИ, которые могут работать от вашего имени в течение более длительного периода времени, чтобы выполнить большие куски работы, взаимодействуя с реальным миром». Кодекс вписывается прямо в это определение. «Наше видение состоит в том, что CHATGPT станет почти как виртуальная коллега — не просто отвечая на быстрые вопросы, но сотрудничает с существенной работой по ряду задач», — добавил он.

Цифры, выпущенные Openai, показывают, что новый агент SWE Codex-1 превосходит все последние модели рассуждений Openai во внутренних задачах SWE.

Новые возможности, новый интерфейс, новые рабочие процессы

Задачи Codex инициируются через интерфейс боковой панели в CHATGPT, что позволяет пользователям запрашивать агента с задачами или вопросами.

Агент обрабатывает каждый запрос в воздушной среде, загруженной хранилищем пользователя, и настроенный для зеркала настройки разработки. Он регистрирует свои действия, ссылается на тестовые выходы и суммирует изменения, создавая свою работу, прослеживаемую и пересмотренную.

Александр Embiricos, глава команды Openai’s Desktop & Agents (и бывший генеральный директор и соучредитель Screenshare Collaboration Startup Multi, который Openai приобрел за нераскрытую сумму в прошлом году), сказал на брифинге с журналистами, что «агент Codex является облачным агентом по разработке программного обеспечения, который может работать на многочисленных паралгах, с его собственным компьютером, чтобы работать с безопасным и независимым».

Внутренне, по его словам, инженеры уже используют его «как утренний список дел-отключить задачи в Кодекс и вернуться к партии черновых решений, готовых к просмотру или слиянию».

Codex также поддерживает конфигурацию через файлы Agents.md-руководства на уровне проекта, которые обучают агента, как ориентироваться в кодовой базе, запускать конкретные тесты и следить за стилями кодирования дома.

«Мы обучили нашу модель читать код и выводить стиль — например, использовать или нет, чтобы использовать оксфордскую запятую — потому что стиль кода имеет столько же, сколько и правильность», — сказал Embiricos.

Безопасность и практическое использование

Codex выполняет задачи без доступа в Интернет, рисуя только на предоставленный пользователем код и зависимости. Эта конструкция обеспечивает безопасную работу и сводит к минимуму потенциальное неправильное использование.

«Это больше, чем просто модельный API», — сказал Embiricos. «Поскольку он работает в воздушной среде с человеческим обзором, мы можем безопасно предоставить модели гораздо большую свободу».

OpenAI также сообщает о ранних вариантах использования. Cisco оценивает Codex для ускорения инженерных работ в своих продуктах. Временный использует его для выполнения фоновых задач, таких как отладка и написание тестов. SuperHuman использует Codex для улучшения тестового покрытия и позволяет не инженерам предлагать легкие изменения кода. Kodiak, автономная транспортная фирма, применяет его для повышения надежности кода и получить представление о незнакомых компонентах стека.

OpenAI также развертывает обновления в Codex CLI, его легкий агент терминала для локальной разработки. В CLI теперь используется меньшая модель-кодекс-минина-салатная-оптимизированная для редактирования с низкой задержкой и вопросами и ответами.

Цены устанавливаются в размере 1,50 долл. США за миллион входных токенов и 6 долл. США на токены на миллион, с 75% скидкой кэширования. В настоящее время Codex может использоваться в течение периода развертывания, с запланированными ограничениями по ценам и вариантам ценообразования по требованию.

Значит ли это, что Openai не покупает Windsurf? Мыслительное лицо эмодзи

Выпуск Codex происходит на фоне повышенной конкуренции в пространстве инструментов кодирования искусственного интеллекта — и сигнализирует о том, что OpenAI намеревается создавать, а не покупать, его следующий этап продуктов.

Согласно недавним данным, от аналогичных Wheb, за последние 12 недель трафик для разработчиков, ориентированных на разработчиков, вырос на 75%, подчеркнув растущий спрос на ассистентов кодирования как важную инфраструктуру, а не экспериментальные дополнения.

Отчеты от TechCrunch и Bloomberg предполагают, что Openai проводили переговоры о приобретении с быстрорастущими стартапами инструмента AI Dev Cursor и Windsurf. Курсор якобы ушел от стола; Windsurf, как сообщается, в принципе согласился приобрести Openai по цене 3 миллиарда долларов, хотя Openai или Windsurf официально не подтвердил.

Буквально вчера, на самом деле, Windsurf дебютировал с собственным семейством моделей Foundation, ориентированных на кодирование, SWE-1, специально предназначенная для поддержки полного жизненного цикла разработки программного обеспечения, от отладки до долгосрочного обслуживания проектов. Модели SWE-1 были изготовлены изготовлены на заказ, обученные полностью собственными силами, используя новую последовательную модель данных, адаптированную для реальных рабочих процессов разработки.

Многие вещи могут происходить за кулисами между двумя компаниями, но для меня время Windsurf запускает свою собственную модель кодирования-вместо своей стратегии, на сегодняшний день использование вариантов Llama и предоставления пользователям возможность пропустить в Openai и антропические модели-через один день в ближайшее время не выровняются.

Но с другой стороны, тот факт, что этот новый агент SWE Codex AI находится в «исследовательском предварительном просмотре», чтобы начать, может стать формой давления на Windsurf или Cursor или кого -либо еще, чтобы прийти к столу и заключить сделку. Отвечая на вопрос о потенциале для приобретения Виндсурфа и сообщений об одном из них, представитель Openai сказал VentureBeat, что им нечего поделиться на этом фронте.

В любом случае, Embiricos создает Codex как простые инструменты кода или помощник.

«Мы собираемся претерпевать сейсмический сдвиг в том, как разработчики работают с агентами — не просто сочетать с ними в режиме реального времени, но и полностью делегировать задачи», — сказал он. «Первыми экспериментами были просто рассуждать модели с доступом к терминалу. Опыт был волшебным — они начали делать что -то для нас».

Построенный для команд разработчиков, а не просто сольные разработчики

Codex разработан с учетом профессиональных разработчиков, но Embiricos отметил, что даже менеджеры по продуктам обнаружили, что это полезным для предложения или проверки изменений, прежде чем втягивать человеческий SWE. Эта универсальность отражает стратегию Openai по созданию инструментов, которые повышают производительность в технических командах.

Трини, инженерный лидер в проекте, суммировал более широкие амбиции, стоящие за Codex: «Это преобразующее изменение в том, как программные инженеры взаимодействуют с ИИ и компьютерами в целом. Он усиливает потенциал каждого человека».

OpenAI представляет Codex центральным элементом нового рабочего процесса разработки, где инженеры назначают задачи высокого уровня агентам и сотрудничают с ними асинхронно. Компания создает более глубокие интеграции через GitHub, Catgpt Desktop, Trackers и CI Systems. Долгосрочная цель состоит в том, чтобы объединить спаривание в реальном времени и делегирование задач с длинным хоризоном в бесшовный опыт разработки.

Как сказал Джош Тобин, «кодирование лежит в основе столько полезных вещей по всей экономике. Ускорение кодирования-это особенно высокий способ распределить преимущества ИИ для человечества, включая себя».

Независимо от того, закрывает ли OpenAI сделки для конкурентов, сообщение ясное: Codex здесь, и Openai делает ставки на своих агентов, чтобы возглавить следующую главу в производительности разработчика.

Источник

OpenAI запускает исследовательский предварительный просмотр агента разработчиков программного обеспечения Codex AI для разработчиков — с параллельными задачами

Эволюция Codex: от модели до автономного агента кодирования ИИ

Агентские видения

Новые возможности, новый интерфейс, новые рабочие процессы

Безопасность и практическое использование

Значит ли это, что Openai не покупает Windsurf? *Мыслительное лицо эмодзи*

Построенный для команд разработчиков, а не просто сольные разработчики

Google Alphaevolve: агент AI, который восстановил 0,7% вычислений Google — и как его скопировать

Азбука киберустойчивости

Рекомендуем

Оставить комментарий Cancel Reply

Значит ли это, что Openai не покупает Windsurf? Мыслительное лицо эмодзи