Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше
На престоле моделей кодирования AI появился новый король: сегодня Google DeepMind AI Research Fitor представила Gemini 2.5 Pro «I/O», новая версия своего хита Gemini 2.5 Pro MultiModal Lazing Model (LLM), выпущенная в марте, которую генеральный директор DeepMind Demis Hassabis сказал, что на X — «Лучшая модель кодирования, которую мы когда -либо строили!»!
Действительно, первоначальные тесты, выпущенные компанией, указывают на то, что Google взял на себя лидерство — впервые с тех пор, как генеративная гонка ИИ началась всерьез, с запуска CHATGPT в конце 2022 года — прежде всего других моделей, по крайней мере, на одном важном эталоне кодирования.
Новая версия, помеченная «Gemini-2,5-Pro-Preview-05-06», заменяет предыдущий выпуск 03-25 и теперь доступен для инди-разработчиков в Google AI Studio и для предприятий в облачной платформе Vertex AI, а также для отдельных пользователей в приложении Gemini. В сообщении в блоге Google говорится, что в нем также способствует холст мобильного приложения Gemini и другие функции.
Новая версия Powers Development для разработки в приложениях, таких как Gemini 95, где модель помогает автоматически совпадать с визуальными стилями между компонентами. Это также позволяет рабочим процессам, таким как преобразование видео на YouTube в полнофункциональные учебные приложения и создание компонентов с высоким уровнем стиля, таких как отзывчивые видеопроглетики или Animated Dictation UIS-практически без ручного редактирования CSS.
Это проприетарная модель, означающая, что предприятия должны будут платить Google, чтобы использовать ее и получить доступ к ней только через веб -сервисы Google. Тем не менее, это не изменяет цены или ограничения по цене; Текущие пользователи Gemini 2.5 Pro будут автоматически маршрутизироваться на обновленную модель, которая стоит 1,25 долл. США/10 долл. США за токены в/OUT (для длины контекста 200 000 токенов) по сравнению с Claude 3,7 Sonnet 3/15 долл. США.
Компания создает этот шаг-в преддверии ежегодной конференции разработчиков ввода/вывода (вход/вывод) в конце этого месяца в Маунтин-Вью и онлайн, 20-21 мая-в качестве ответа на сильные отзывы сообщества вокруг практической утилиты Gemini в области генерации кода реального мира и дизайна интерфейса.
Логан Килпатрик, старший менеджер по продуктам для Gemini API и Google AI Studio, подтвердил в сообщении в блоге разработчика, что обновление также обращается к отзывам разработчика ключевых разработчиков вокруг вызова функций, с улучшением снижения ошибок и надежностью триггера.
Лучшие оценки от людей при создании веб -приложений
В таблице лидеров WebDev Arena, сторонней метрике, которая оценивает модели по человеческим предпочтениям, основанную на их способности генерировать визуально привлекательные и функциональные веб-приложения, предварительный просмотр Gemini 2.5 Pro (05-06) теперь обогнал Sonnet Antropic Claude 3.7 на месте первого места.
Новая версия набрала 1499,95 в таблице лидеров, поставив ее намного впереди сонета 3.7 1377.10. Предыдущая модель Gemini 2.5 Pro (03-25) занимала третье место с оценкой 1278,96, что означает, что издание ввода/вывода представляет собой прыжок с 221 пунктом.

Как отметил пользователь AI Power «Lisan Al Gaib» на X, даже Openai’s GPT-4O («O3») не смог вытеснить сонет 3.7, подчеркнув значение продвижения Gemini.
Повышение производительности Gemini отражает повышенную надежность, эстетику и удобство использования в своих результатах.
Уже выигрывает восторженные отзывы
Несколько разработчиков и лидеров платформ подчеркнули улучшенную надежность и применение модели в сценариях производства.
Сайлас Альберти из Cognition отметил, что Gemini 2.5 Pro был первой моделью, которая успешно завершила сложный рефакторинг системы маршрутизации бэкэнд, демонстрируя тот вид принятия решений, которые можно ожидать от старшего разработчика.
Майкл Труэлл, генеральный директор курсора инструмента кодирования AI, сказал, что внутреннее тестирование показывает заметное снижение сбоев инструментальных вызовов, ранее отмеченную проблему. Он ожидает, что пользователи найдут последнюю версию значительно более эффективной в практических средах. Cursor уже интегрировал Gemini 2.5 Pro в свой собственный кодовый агент, отражая, как разработчики используют модель в качестве ключевого компонента в более интеллектуальных рабочих процессах разработчика.
Мишель Катаста, президент Repit, описал Gemini 2.5 Pro как лучшую пограничную модель для балансировки с задержкой. Его комментарии предполагают, что Repit рассматривает интеграцию модели в свои собственные инструменты, особенно для задач, где высокая отзывчивость и надежность имеют решающее значение.
Аналогичным образом, педагог ИИ и основатель Blueshell Private AI Chatbot Пол Куверт отметили в X, что «его возможности кода и генерации пользовательского интерфейса впечатляют». »» »» »» »» »» »» »» »» »» »» »» »» »» »» »» »» »» »» »» »» »
И, как отметил Пьетро Ширано, генеральный директор AI Art Tool Art Everart, новое издание Gemini 2.5 Pro Pro было в состоянии генерировать интерактивное моделирование мема «1 горилла против 100 человек», который распространялся в социальных сетях в ближайшее время из одного подсказки.
Показ другой интерактивной Тетрис-Стиль -головоломка с рабочими звуковыми эффектами, по сообщениям, создан менее чем за минуту, x пользователь «Рамешр» (@rezmeram) написал, что «случайная игровая индустрия мертва !!»
Эти одобрения добавляют вес к утверждениям DeepMind о практических улучшениях и могут поощрять более широкое принятие на платформах разработчиков.
Полные приложения и программы из одной текстовой подсказки
Одной из выдающихся функций обновления является его способность создавать полные интерактивные веб -приложения или симуляции из одной подсказки.
Это согласуется с видением DeepMind упростить прототипирование и процесс разработки.
Демонстрации в приложении Gemini демонстрируют, как пользователи могут преобразовать визуальные шаблоны или тематические подсказки в полезный код, снижая барьер для входа для разработчиков, ориентированных на дизайн, и команд, экспериментирующих с новыми идеями.
Несмотря на то, что архитектура и изменения Gemini 2.5 Pro не были подробны публично, акцент остается на том, чтобы обеспечить более быстрый, более интуитивно понятный опыт развития.
Склоняясь к своим сильным сторонам генерации кода и мультимодальных входов, Gemini 2.5 Pro позиционируется меньше как новизна исследования и больше как практический инструмент для реальных задач кодирования. Ранний релиз отражает четкое намерение Google DeepMind, чтобы удовлетворить спрос разработчиков и поддерживать импульс в преддверии своих основных объявлений о конференции.
Источник
