Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше
В последнем отчете POE используется OpenAI, а Google укрепляют свои позиции в ключевых категориях ИИ, в то время как Антрический теряет позиции, а специализированные возможности рассуждения становятся важным конкурентным полем битвы.
Согласно данным, опубликованным сегодня POE, платформой, предлагающей доступ к более чем 100 моделям искусственного интеллекта, значительные сдвиги рынка произошли во всех основных категориях ИИ в период с января по май 2025 года. Данные, взятые из подписчиков POE, обеспечивают редкую видимость в фактических предпочтениях пользователей за пределами отрасли.
«Как универсальные ворота на более 100 моделей AI, POE имеет уникальное представление о тенденциях использования в экосистеме», — сказал Ник Хубер, экосистема AI, в эксклюзивном интервью VentureBeat. «Наиболее удивительные вещи, происходящие сейчас,-это быстрое инновации (в 3 раза число выпусков января-мая 2025 года против того же периода в 2024 году), все более разнообразные конкурентные ландшафты, а модели рассуждений являются ясной историей успеха в начале 2025 года».

GPT-4O поддерживает доминирование, в то время как новые модели быстро захватывают долю рынка
В основном генерации текста GPT-4O Openai сохранила свою командную позицию с 35,8% доли сообщений, в то время как более новая семья компании GPT-4.1 быстро захватила 9,4% использования в течение нескольких недель после запуска. Google Gemini 2.5 Pro аналогично достиг приблизительно 5% доли сообщений вскоре после его введения.
Эти выгоды в основном достигли затрат моделей Claude Antropic, которые привели к абсолютному снижению доли на 10% в течение отчетного периода. В отчете отмечается, что Sonnet Claude 3.7 в настоящее время существенно заменил более ранний сонет Claude 3.5 в предпочтениях пользователя, хотя последний по -прежнему сохраняет заметную долю использования на 12%.
DeepSeek, который испытал вирусный рост в начале этого года, показал свой импульс медленно, поскольку конкуренты выпустили свои собственные доступные, многословные модели рассуждений. Доля сообщений DeepSeek R1 снизилась с пика 7% в середине февраля до 3% к концу апреля.
Сложные возможности для решения проблем становятся ключевыми дифференциаторами на рынке искусственного интеллекта
Возможно, наиболее значимой тенденцией, определенной в отчете, является резкий рост в специализированных моделях рассуждений, которые расширились с приблизительно 2% до 10% всех текстовых сообщений, отправленных на POE с начала 2025 года.
«Модели рассуждений, даже в первые дни, продемонстрировали замечательную способность выполнять сложные задачи с повышенной точностью», — сказал Хубер VentureBeat. «Ранние последователи явно находят ценность в этом и готовы взять на себя компромисс в сфере затрат и обработки для лучших результатов».
В этом сегменте высокого роста Gemini 2.5 Pro быстро зарекомендовал себя как лидер, захватив приблизительно 31% использования модели рассуждений всего за шесть недель после запуска. Теперь он возглавляет категорию, опередив модели, специфичные Клода.
OpenAI продолжает быстро вводить новшества в этом пространстве, высвобождая несколько моделей рассуждений (O1-Pro, O3-Mini, O3-Mini-High, O3 и O4-Mini) только в первые четыре месяца 2025 года. В отчете указывается, что пользователи POE быстро применяют новейшие предложения Openai, переходя от старых моделей, таких как O1, к более новым альтернативам, таким как O3.
В отчете также отмечалось появление моделей гибридных рассуждений, таких как предварительный просмотр Gemini 2.5 Flash и QWEN 3, которые могут динамически регулировать уровень их рассуждений в рамках разговоров. Тем не менее, эти модели в настоящее время представляют собой только около 1% использования модели рассуждений.
Отраслевые аналитики предполагают, что этот сдвиг в сторону специализированных возможностей рассуждений сигнализирует о созревающем рынке ИИ, где генерация необработанного текста становится коммодитизированным, заставляя поставщиков дифференцироваться через более высокую стоимость, которые могут командовать ценообразованием премиум-класса.
Google Imagen 3 Challenge создали игроки на визуальной арене искусственного интеллекта
Рынок генерации изображений кажется все более конкурентоспособным, поскольку семейство Google Imagen 3 неуклонно растет с примерно 10% до 30% доли в течение 2025 года, в настоящее время конкурируя с семейством моделей Flux Labs ‘Flux Labs категории.
GPT-Image-1 OpenAI, введенный в API в конце апреля, быстро достиг 17% использования генерации изображений всего за две недели, отражая его вирусное принятие в приложении CHATGPT в течение марта и начала апреля.
В отчете указывается, что модели потока поддерживали свою общую долю множества в генерации изображений на POE, но в течение отчетного периода наблюдались умеренное снижение с приблизительно 45% до 35%.
Эта трехсторонняя конкуренция между Google, Openai и Brandest Labs знаменует собой значительный сдвиг с начала 2024 года, когда в этом пространстве доминировали варианты диффузии Midjourney и стабильной диффузии. Быстрое улучшение качества изображения, приверженность подсказкам и скорость рендеринга превратило эту категорию в одно из самых яростных оспариваемых поля боевых действий ИИ.
Согласно дополнительным отраслевым данным, принятие предприятия генерации изображений значительно ускорилось за последние шесть месяцев, поскольку маркетинговые отделы и креативные агентства все чаще интегрируют эти инструменты в свои рабочие процессы.
Китайская выскочка Kling нарушает видео AI, бросая вызов раннему лидерству взлетно -посадочной полосы
В Generation Generation, недавно выпущенная семейство моделей Kling Lab Kuaishou, быстро нарушила рынок, в совокупности приобретает около 30% доли использования. В частности, к концу апреля Kling-2.0 Master достиг 21% всего поколения видео на POE, всего через три недели после его выпуска.
Google Veo 2 сохранил сильную позицию с приблизительно 20% доли после ее февральского запуска, в то время как Pioneer Pioneer Category Prunway показал, что его доля использования значительно снизилась с 60% до 20% в течение отчетного периода.
Скорость проникновения рынка Kling подчеркивает, насколько быстро конкурентная среда может измениться в появляющихся категориях ИИ, где устоявшиеся игроки могут не поддерживать свои ранние преимущества, поскольку новички быстро итерации и улучшаются.
Генерация видео остается наиболее интенсивным приложением AI, ориентированной на потребитель, с моделями, требующими значительной мощности обработки для создания даже коротких клипов. Это сохранило использование более ограниченным, чем генерация текста или изображений, но ожидается, что быстро падение затрат и улучшение качества будут способствовать более широкому принятию до 2025 года.
Ранние приемники предприятия включают рекламные агентства, создатели контента в социальных сетях и образовательные платформы, которые начали интегрировать видео, сгенерированное ИИ, в свои стратегии контента, несмотря на текущие ограничения технологии.
ElevenLabs доминирует в Voice AI, в то время как новые участники нацелены на специализированные варианты использования
ElevenLabs продолжает возглавлять категорию генерации звука, выполняя приблизительно 80% запросов текста в речь всех подписчиков в течение отчетного периода. Тем не менее, в отчете подчеркивается развивающаяся конкуренция со стороны новичков Cartesia, Unreal Speech, Playai и Orpheus, которые предлагают дифференцированные варианты голоса, эффекты и модели ценообразования.
Это доминирование на рынке одним игроком резко контрастирует с более фрагментированной конкуренцией в других категориях искусственного интеллекта. Отраслевые эксперты приписывают постоянное лидерство ElevenLabs своему раннему выходу на рынок, обширной голосовой библиотеке и последовательным улучшениям качества, которые сохранили техническое преимущество над конкурентами.
Новые участники находят успех, ориентируясь на конкретные рыночные ниши. Нереальная речь получила повышение с продюсерами подкастов и издателей аудиокниги, предлагая специализированные актеры голоса и эмоциональные возможности. Между тем, Cartesia сосредоточилась на многоязычных голосах с подлинными акцентами, выявляя интерес мировых предприятий и образовательных платформ.
Предполагается, что рынок Audio AI значительно расти в течение 2025 года, поскольку возможности для текста в речь подходят к качеству, подобному человеку и найдут приложения в обслуживании клиентов, решения для доступности и создание контента. Относительно низкие вычислительные требования по сравнению с генерацией видео допускают более широкое развертывание и эксперименты.
Стратегические последствия для предприятий, ориентирующихся на постоянно изменяющуюся ландшафт ИИ
Динамический характер модельного ландшафта ИИ представляет как возможности, так и проблемы для предприятий, интегрирующих эти технологии.
«Может быть сложно не отставать от последних в ИИ, и темп лишь набирает скорость», — сказал Хубер VentureBeat. «Если вы являетесь бизнесом, уже управляющим ИИ в масштабе, инвестируя в надежные, агрессические поставщики, агрессические оценочные трубопроводы, имеет решающее значение, потому что модель, которая лучше всего в этом месяце может быть вторым лучшим в следующем месяце».
Эта волатильность в модельных предпочтениях подчеркивает значение таких платформ, как POE, которые предлагают доступ к нескольким моделям через один интерфейс, что позволяет пользователям сравнивать выходы и адаптироваться к изменяющейся экосистеме ИИ.
Отраслевые аналитики предполагают, что растущая важность возможностей рассуждений может сигнализировать о сдвиге в том, как предприятия оценивают и развертывают модели искусственного интеллекта, с растущей вниманием к точности и надежности для сложных задач, а не только на скорости или эффективности затрат.
Поскольку Frontier Labs продолжают выпускать более способные модели в ускоряющемся темпе, предприятия сталкиваются с трудными решениями о том, когда стандартизировать конкретные платформы по сравнению с поддержанием гибкости. Многие лидеры ИИ предприятия используют портфельный подход, используя различные модели для различных задач, сохраняя при этом возможность переключения поставщиков по мере развития возможностей.
«Это будет важное пространство для наблюдения, особенно среди пограничных поставщиков, поскольку оно представляет собой лучшее из того, что ИИ может в настоящее время достигнуть», — отметил Хубер относительно моделей рассуждений.
В отчете указывается, что мультимедийные возможности также становятся все более конкурентоспособными, что позволяет предположить, что генерация текста, долгое время, основное внимание развитию ИИ, может уступить место более сбалансированной экосистеме, где играет изображение, видео и генерация звука одинаково важные роли.
Предприятия, которые успешно ориентируются в этом сложном ландшафте, вероятно, будут те, которые поддерживают рамки оценки, ориентированные на конкретные варианты использования, а не преследование последних выпусков моделей, одновременно создавая техническую инфраструктуру, которая позволяет быстро внедрить, когда возникают значимые улучшения.
Поскольку модели искусственного интеллекта продолжают свою игру в музыкальных креслах на вершине рейтинга, одна вещь становится ясной: на сегодняшнем рынке Корона редко остается на одной голове надолго-и компании ставят свое будущее на вчерашнем чемпионе ИИ, могут оказаться в соответствии с завтрашними также завтрашними.
Источник
