Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше
OpenAI разворачивает набор значительных обновлений для своих новых API ответов, стремясь упростить разработчикам и предприятиям создание интеллектуальных, ориентированных на действия агентских приложений.
Эти усовершенствования включают в себя поддержку серверов удаленной модели протокола контекста (MCP), интеграцию генерации изображений и инструментов интерпретатора кода, а также обновления для возможностей поиска файлов — все это доступно на сегодняшний день, 21 мая.
Впервые выпущенный в марте 2025 года, API ответов служит инструментом Openai для сторонних разработчиков для создания агентских приложений на некоторых основных функциональных функциях своих HIT Services CathGPT и его первых агентов искусственного интеллекта Deep Research и Operator.
В течение нескольких месяцев, прошедших после его дебюта, он обработал триллионы жетонов и поддержал широкий спектр вариантов использования, от исследования рынка и образования до разработки программного обеспечения и финансового анализа.
Популярные приложения, построенные в API, включают агента по кодированию Zencoder, ассистент по разведке Revi и образовательную платформу Magicschool.
Основание и цель ответов API
Ответы API дебютировали вместе с агентами Openai с открытым исходным кодом SDK в марте 2025 года в рамках инициативы, направленной на предоставление сторонним разработчикам к тем же технологиям, приводящим на пользу собственных агентов AI Openai, таких как Deep Research и Operator.
Таким образом, стартапы и компании за пределами Openai могут интегрировать ту же технологию, что и она, предлагая CATGPT в свои продукты и услуги, будь то внутренние для использования сотрудников или внешние для клиентов и партнеров.
Первоначально, API объединил элементы от завершения чата и API Assistants-передавая встроенные инструменты для поиска в Интернете и файла, а также использование компьютера-создание разработчиков для создания автономных рабочих процессов без сложной логики оркестровки. В то время Openai сказал, что API завершения чата будет устарел до середины 2026 года.
API ответов обеспечивает видимость в модельных решениях, доступе к данным в реальном времени и возможностям интеграции, которые позволяли агентам извлекать, разум и действовать в соответствии с информацией.
Этот запуск ознаменовал сдвиг в направлении предоставления разработчикам унифицированный инструментарий для создания готовых к производству, специфическим для домена агентов искусственного интеллекта с минимальным трением.
Удаленная поддержка сервера MCP расширяет потенциал интеграции
Ключевым дополнением в этом обновлении является поддержка удаленных серверов MCP. Теперь разработчики могут подключать модели Openai к внешним инструментам и услугам, таким как Stripe, Shopify и Twilio, используя только несколько строк кода. Эта возможность позволяет создавать агенты, которые могут предпринять действия и взаимодействовать с системными пользователями, уже зависящими. Чтобы поддержать эту развивающуюся экосистему, OpenAI присоединился к руководящему комитету MCP.
Доступ к новым инструментам: нативное изображение Gen и интерпретатор кода
Обновление привносит новые встроенные инструменты для API ответов, которые улучшают то, что агенты могут делать в одном вызове API.
Вариант популярной модели «Студий-ghibli» в стиле «Studio ghibli» в стиле «Студия Гибли» в стиле «Студия Гибли» нативных ими, которые, очевидно, могут создать много других стилей изображений, теперь доступны через API под модельным названием «GPT-Image-1». Он включает в себя потенциально полезные и довольно впечатляющие новые функции, такие как предварительные просмотры потоковой передачи в режиме реального времени и уточнение с несколькими оборотами.
Это позволяет разработчикам создавать приложения, которые могут создавать и редактировать изображения динамически в ответ на пользовательский ввод.
Кроме того, инструмент интерпретатора кода теперь интегрирован в API ответов, позволяя моделям обрабатывать анализ данных, сложные математики и задачи на основе логики в рамках их процессов рассуждения.
Этот инструмент помогает улучшить производительность модели в различных технических показателях и обеспечивает более сложное поведение агента.
Улучшенный поиск файлов и обработка контекста
Функциональность поиска файлов также была обновлена. Разработчики теперь могут выполнять поиск в нескольких векторных магазинах и применять фильтрацию на основе атрибутов для извлечения только наиболее релевантного контента.
Это повышает точность использования информационных агентов, улучшая их способность отвечать на сложные вопросы и работать в больших областях знаний.
Надежность новых предприятий, функции прозрачности
Несколько функций разработаны специально для удовлетворения потребностей предприятия. Фоновый режим обеспечивает длительные асинхронные задачи, решая проблемы тайм-аутов или перерывов сети во время интенсивных рассуждений.
Сводка рассуждений, новое дополнение, предлагает естественные объяснения внутреннего мыслительного процесса модели, помогая с отладкой и прозрачностью.
Зашифрованные аргументированные элементы предоставляют дополнительный уровень конфиденциальности для клиентов с нулевым содержанием данных.
Они позволяют моделям повторно использовать предыдущие шаги рассуждения без хранения каких -либо данных на серверах OpenAI, повышения как безопасности, так и эффективности.
Последние возможности поддерживаются в серии GPT-4O от OpenAI, серии GPT-4.1 и моделях O-серии, включая O3 и O4-Mini. В настоящее время эти модели поддерживают состояние рассуждений по нескольким инструментальным вызовам и запросам, что приводит к более точным ответам при более низких затратах и задержке.
Вчерашняя цена сегодняшняя цена!
Несмотря на расширенный набор функций, OpenAI подтвердил, что цены на новые инструменты и возможности в рамках API ответов останутся в соответствии с существующими ставками.
Например, инструмент интерпретатора кода составляет 0,03 долл. США за сеанс, а использование поиска файлов выставляется в размере 2,50 долл. США за 1000 звонков, а стоимость хранения составляет 0,10 долл. США за ГБ в день после первого бесплатного гигабайта.
Цены на поиск в Интернете варьируются в зависимости от размера модели и контекста поиска, в диапазоне от 25 до 50 долларов за 1000 звонков. Генерация изображений через инструмент GPT-Image-1 также взимается в соответствии с уровнем разрешения и качества, начиная с 0,011 долл. США за изображение.
Все использование инструмента выставлено по показателям выбранной модели за ток, без дополнительной разметки для вновь добавленных возможностей.
Что дальше для ответов API?
С этими обновлениями Openai продолжает расширять то, что возможно с помощью API ответов. Разработчики получают доступ к более богатым набору инструментов и готовых предприятий, в то время как предприятия теперь могут создавать более интегрированные, способные и безопасные приложения, управляемые AI.
Все функции являются вживую по состоянию на 21 мая, с деталями цены и реализации, доступными через документацию OpenAI.
Источник
