OpenAI обновляет свои новые ответы API быстро с поддержкой MCP, GPT-4O Native Image Gen и большим количеством предприятий

Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше

OpenAI разворачивает набор значительных обновлений для своих новых API ответов, стремясь упростить разработчикам и предприятиям создание интеллектуальных, ориентированных на действия агентских приложений.

Эти усовершенствования включают в себя поддержку серверов удаленной модели протокола контекста (MCP), интеграцию генерации изображений и инструментов интерпретатора кода, а также обновления для возможностей поиска файлов — все это доступно на сегодняшний день, 21 мая.

Впервые выпущенный в марте 2025 года, API ответов служит инструментом Openai для сторонних разработчиков для создания агентских приложений на некоторых основных функциональных функциях своих HIT Services CathGPT и его первых агентов искусственного интеллекта Deep Research и Operator.

В течение нескольких месяцев, прошедших после его дебюта, он обработал триллионы жетонов и поддержал широкий спектр вариантов использования, от исследования рынка и образования до разработки программного обеспечения и финансового анализа.

Популярные приложения, построенные в API, включают агента по кодированию Zencoder, ассистент по разведке Revi и образовательную платформу Magicschool.

Основание и цель ответов API

Ответы API дебютировали вместе с агентами Openai с открытым исходным кодом SDK в марте 2025 года в рамках инициативы, направленной на предоставление сторонним разработчикам к тем же технологиям, приводящим на пользу собственных агентов AI Openai, таких как Deep Research и Operator.

Таким образом, стартапы и компании за пределами Openai могут интегрировать ту же технологию, что и она, предлагая CATGPT в свои продукты и услуги, будь то внутренние для использования сотрудников или внешние для клиентов и партнеров.

Первоначально, API объединил элементы от завершения чата и API Assistants-передавая встроенные инструменты для поиска в Интернете и файла, а также использование компьютера-создание разработчиков для создания автономных рабочих процессов без сложной логики оркестровки. В то время Openai сказал, что API завершения чата будет устарел до середины 2026 года.

API ответов обеспечивает видимость в модельных решениях, доступе к данным в реальном времени и возможностям интеграции, которые позволяли агентам извлекать, разум и действовать в соответствии с информацией.

Этот запуск ознаменовал сдвиг в направлении предоставления разработчикам унифицированный инструментарий для создания готовых к производству, специфическим для домена агентов искусственного интеллекта с минимальным трением.

Удаленная поддержка сервера MCP расширяет потенциал интеграции

Ключевым дополнением в этом обновлении является поддержка удаленных серверов MCP. Теперь разработчики могут подключать модели Openai к внешним инструментам и услугам, таким как Stripe, Shopify и Twilio, используя только несколько строк кода. Эта возможность позволяет создавать агенты, которые могут предпринять действия и взаимодействовать с системными пользователями, уже зависящими. Чтобы поддержать эту развивающуюся экосистему, OpenAI присоединился к руководящему комитету MCP.

Доступ к новым инструментам: нативное изображение Gen и интерпретатор кода

Обновление привносит новые встроенные инструменты для API ответов, которые улучшают то, что агенты могут делать в одном вызове API.

Вариант популярной модели «Студий-ghibli» в стиле «Studio ghibli» в стиле «Студия Гибли» в стиле «Студия Гибли» нативных ими, которые, очевидно, могут создать много других стилей изображений, теперь доступны через API под модельным названием «GPT-Image-1». Он включает в себя потенциально полезные и довольно впечатляющие новые функции, такие как предварительные просмотры потоковой передачи в режиме реального времени и уточнение с несколькими оборотами.

Это позволяет разработчикам создавать приложения, которые могут создавать и редактировать изображения динамически в ответ на пользовательский ввод.

Кроме того, инструмент интерпретатора кода теперь интегрирован в API ответов, позволяя моделям обрабатывать анализ данных, сложные математики и задачи на основе логики в рамках их процессов рассуждения.

Этот инструмент помогает улучшить производительность модели в различных технических показателях и обеспечивает более сложное поведение агента.

Улучшенный поиск файлов и обработка контекста

Функциональность поиска файлов также была обновлена. Разработчики теперь могут выполнять поиск в нескольких векторных магазинах и применять фильтрацию на основе атрибутов для извлечения только наиболее релевантного контента.

Это повышает точность использования информационных агентов, улучшая их способность отвечать на сложные вопросы и работать в больших областях знаний.

Надежность новых предприятий, функции прозрачности

Несколько функций разработаны специально для удовлетворения потребностей предприятия. Фоновый режим обеспечивает длительные асинхронные задачи, решая проблемы тайм-аутов или перерывов сети во время интенсивных рассуждений.

Сводка рассуждений, новое дополнение, предлагает естественные объяснения внутреннего мыслительного процесса модели, помогая с отладкой и прозрачностью.

Зашифрованные аргументированные элементы предоставляют дополнительный уровень конфиденциальности для клиентов с нулевым содержанием данных.

Они позволяют моделям повторно использовать предыдущие шаги рассуждения без хранения каких -либо данных на серверах OpenAI, повышения как безопасности, так и эффективности.

Последние возможности поддерживаются в серии GPT-4O от OpenAI, серии GPT-4.1 и моделях O-серии, включая O3 и O4-Mini. В настоящее время эти модели поддерживают состояние рассуждений по нескольким инструментальным вызовам и запросам, что приводит к более точным ответам при более низких затратах и задержке.

Вчерашняя цена сегодняшняя цена!

Несмотря на расширенный набор функций, OpenAI подтвердил, что цены на новые инструменты и возможности в рамках API ответов останутся в соответствии с существующими ставками.

Например, инструмент интерпретатора кода составляет 0,03 долл. США за сеанс, а использование поиска файлов выставляется в размере 2,50 долл. США за 1000 звонков, а стоимость хранения составляет 0,10 долл. США за ГБ в день после первого бесплатного гигабайта.

Цены на поиск в Интернете варьируются в зависимости от размера модели и контекста поиска, в диапазоне от 25 до 50 долларов за 1000 звонков. Генерация изображений через инструмент GPT-Image-1 также взимается в соответствии с уровнем разрешения и качества, начиная с 0,011 долл. США за изображение.

Все использование инструмента выставлено по показателям выбранной модели за ток, без дополнительной разметки для вновь добавленных возможностей.

Что дальше для ответов API?

С этими обновлениями Openai продолжает расширять то, что возможно с помощью API ответов. Разработчики получают доступ к более богатым набору инструментов и готовых предприятий, в то время как предприятия теперь могут создавать более интегрированные, способные и безопасные приложения, управляемые AI.

Все функции являются вживую по состоянию на 21 мая, с деталями цены и реализации, доступными через документацию OpenAI.

Источник

OpenAI обновляет свои новые ответы API быстро с поддержкой MCP, GPT-4O Native Image Gen и большим количеством предприятий

Основание и цель ответов API

Удаленная поддержка сервера MCP расширяет потенциал интеграции

Доступ к новым инструментам: нативное изображение Gen и интерпретатор кода

Улучшенный поиск файлов и обработка контекста

Надежность новых предприятий, функции прозрачности

Вчерашняя цена сегодняшняя цена!

Что дальше для ответов API?

Не слишком умный дом

Magentic-UI

Рекомендуем

Оставить комментарий Cancel Reply