Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас
В понедельник Google DeepMind объявил, что передовая версия модели искусственного интеллекта Gemini официально достигла показателей на уровне золота на Международной математической олимпиаде, решив пять из шести исключительно сложных проблем и получая признание в качестве первой системы искусственного интеллекта, получившего официальные оценки на уровне золота от организаторов конкуренции.
Победа продвигает область рассуждений с ИИ и ставит Google вперед в усиливающуюся битву между техническими гигантами, строящими искусственный интеллект следующего поколения. Что еще более важно, это демонстрирует, что ИИ теперь может решать сложные математические проблемы с использованием понимания естественного языка, а не требует специализированных языков программирования.
«Официальные результаты-Близнецы достигли уровня золотой медали в международной математической олимпиаде!» Демис Хассабис, генеральный директор Google DeepMind, написал на платформе социальных сетей X в понедельник утром. «Усовершенствованная версия смогла решить 5 из 6 проблем. Невероятный прогресс».
Официальные результаты-Близнецы достигли уровня золотой медали в международной математической олимпиаде! ? Усовершенствованная версия смогла решить 5 из 6 задач. Невероятный прогресс — огромный поздравление @lmthang И команда! https://t.co/pp9bxf7rvj
— Демис Хассабис (@demishassabis) 21 июля 2025 года
Международная математическая олимпиада, проводимая ежегодно с 1959 года, широко считается самым престижным в мире конкурсом по математике для студентов до юниверса. Каждая участвующая страна посылает шесть элитных молодых математиков, чтобы конкурировать в решении шести исключительно сложных проблем, охватывающих алгебру, комбинаторию, геометрию и теорию чисел. Только около 8% участников человека обычно зарабатывают золотые медали.
Как Google DeepMind’s Gemini Deep Think Trucked Cracked Math по самым сложным проблемам математики
Последний успех Google намного превышает свою производительность 2024 года, когда комбинированные системы Alphaproof и Alphageometry Systems заработали статус серебряной медали, заработавшие четыре из шести задач. Эта более ранняя система требовала, чтобы люди-эксперты сначала превзошли проблемы естественного языка в языки программирования, специфичные для домена, а затем интерпретировали математический результат ИИ.
Прорыв этого года произошел благодаря Deep Gemini Deep Think, расширенной системе рассуждений, в которой используется то, что исследователи называют «параллельным мышлением». В отличие от традиционных моделей искусственного интеллекта, которые следуют за одной цепочкой рассуждений, глубокие мышления одновременно исследуют несколько возможных решений, прежде чем получить окончательный ответ.
«Наша модель управляла сквозной на естественном языке, создавая строгие математические доказательства непосредственно из официальных описаний проблем»,-объяснил Хассабис в последующем посте на сайте социальной сети X, подчеркнув, что система завершила свою работу в рамках стандартного 4.5-часового ограничения конкурса.
Мы достигли впечатляющего результата этого года, используя расширенную версию Gemini Deep Think (улучшенный режим рассуждения для сложных проблем). Наша модель управляла сквозной на естественном языке, создавая строгие математические доказательства непосредственно из официальных описаний проблем-…
— Демис Хассабис (@demishassabis) 21 июля 2025 года
Модель достигла 35 из возможных 42 баллов, комфортно превышая порог золотой медаль. По словам президента IMO профессора д -ра Грегора Долинара, решения были «удивительными во многих отношениях» и признаны «ясными, точными и большинством из них легко следовать» со стороны соревновательных грейдеров.
OpenAI сталкивается с негативной реакцией для обхода официальных правил конкуренции
Объявление происходит на фоне растущей напряженности в индустрии искусственного интеллекта в отношении конкурентной практики и прозрачности. Измеренный подход Google DeepMind к освобождению его результатов получил похвалу от сообщества ИИ, особенно в отличие от конкурента Openai, обработки аналогичных достижений.
«Мы не объявили в пятницу, потому что мы уважали первоначальную просьбу совета директоров IMO о том, что все лаборатории искусственного интеллекта разделяют свои результаты только после того, как официальные результаты были проверены независимыми экспертами, и студенты справедливо получили охватывание, которое они заслужили», — написал Хассабис, появившиеся на рассмотрении ранее объявления Openai о своем собственном выступлении олимпиада.
Кстати, в сторону, мы не объявили в пятницу, потому что мы уважали первоначальную просьбу совета директоров IMO о том, что все лаборатории искусственного интеллекта разделяют свои результаты только после того, как официальные результаты были подтверждены независимыми экспертами, и студенты справедливо получили аккламацию, которую они заслужили
— Демис Хассабис (@demishassabis) 21 июля 2025 года
Пользователи социальных сетей быстро отметили различие. «Видите ли? Openai проигнорировал запрос IMO. Позор. Никакого класса. Прямо неуважение», — написал один пользователь. «Google Deepmind действовал с целостностью, согласованной с человечеством».
Критика проистекает из решения Openai объявить о своих собственных результатах математической олимпиады без участия в официальном процессе оценки IMO. Вместо этого у Openai была группа бывших участников IMO, которые оценивают свою производительность ИИ, подход, который некоторые считают в сообществе, не хватает доверия.
«OpenAI, возможно, сейчас самая худшая компания на планете», — написал один критик, в то время как другие предложили компании «серьезно относиться к вещам» и «быть более заслуживающим доверия».
Понимаете?
— Ник (@ns123abc) 21 июля 2025 года
Openai проигнорировал запрос IMO. Стыд. Нет класса. Прямо неуважение.
Google DeepMind действовал с целостностью, согласованной с человечеством.
Trvthnuke pic.twitter.com/8laoak6xue
Внутри методов обучения, которые обеспечивали математическое мастерство Близнецов
Успех Google DeepMind, по -видимому, проистекает из новых методов обучения, которые выходят за рамки традиционных подходов. Команда использовала расширенные методы обучения подкрепления, предназначенные для использования многоэтапных рассуждений, решения проблем и данных по обеспечению теоремы. Модель также была предоставлена доступ к кураторской коллекции высококачественных математических решений и получила конкретное руководство по подходу к проблемам в стиле IMO.
Техническое достижение впечатлило исследователей ИИ, которые отметили его более широкие последствия. «Не только решение математики… но понимание языковых проблем и применение абстрактной логики к новым случаям»,-написал AI Observer Elyss Wren. «Это не заброшенная память — это возникающее познание в движении».
Этан Моллик, профессор школы Уортон, который изучает ИИ, подчеркнул значение использования модели общего назначения, а не специализированных инструментов. «Увеличивающиеся доказательства способности LLMS обобщать новое решение проблем», — написал он, подчеркивая, как это отличается от предыдущих подходов, которые требовали специализированного математического программного обеспечения.
Это был не просто открытый.
— Итан Моллик (@emollick) 21 июля 2025 года
Google также использовал модель общего назначения для решения очень сложных математических проблем Международной математической олимпиады на простом языке. В прошлом году они использовали специализированное использование инструмента
Растущие доказательства способности LLMS обобщать новое решение проблем https://t.co/ve72ffmx2b
Модель продемонстрировала особенно впечатляющие рассуждения в одной проблеме, когда многие человеческие конкуренты применяли математические концепции уровня выпускника. По словам исследователя DeepMind Джунхюк Юнг, Близнецы «сделали блестящее наблюдение и использовали только теорию элементарных чисел для создания автономного доказательства», обнаружив более элегантное решение, чем многие участники человека.
Что означает победа Google DeepMind для гонки AI за 200 миллиардов долларов
Прорыв наступает в критический момент в индустрии искусственного интеллекта, где компании участвуют в гонках, чтобы продемонстрировать превосходные возможности рассуждений. Успех имеет непосредственные практические последствия: Google планирует сделать версию этой глубокой модели, доступной для математиков для тестирования, прежде чем отправлять ее в подписчики Google AI Ultra, которые платят 250 долларов в месяц за доступ к самым продвинутым моделям ИИ компании.
Время также подчеркивает усиливающую конкуренцию между крупными лабораториями ИИ. В то время как Google отметил свой методичный, официально подтвержденный подход, противоречие, связанное с объявлением Openai, отражает более широкую напряженность в отношении прозрачности и доверия в разработке ИИ.
Эта конкурентная динамика выходит за рамки только математических рассуждений. В последние недели различные компании по искусственному искусству объявляют о прорывных возможностях, хотя не все были получены положительно. Xai из Elon Musk недавно запустил Grok 4, который, как утверждала компания, был «самым умным искусственным искусством в мире», хотя результаты таблицы лидеров показали, что он отстает от моделей от Google и Openai. Кроме того, Грок столкнулся с критикой за спорные черты, включая сексуализированные компаньоны ИИ и эпизоды генерации антисемитского содержания.
Рассвет ИИ, который думает как люди-с реальными последствиями
Победа математической олимпиады выходит за рамки конкурентоспособных прав на хвастовство. Производительность Gemini демонстрирует, что системы искусственного интеллекта теперь могут соответствовать рассуждениям на уровне человека в сложных задачах, требующих творчества, абстрактного мышления и способности синтезировать идеи по нескольким областям.
«Это значительный прогресс по сравнению с прошлогодним результатом прорыва», — отметила команда DeepMind в своем техническом объявлении. Перемещение от требования специализированных формальных языков до работы полностью на естественном языке позволяет предположить, что системы ИИ становятся более интуитивными и доступными.
Для предприятий это развитие сигнализирует о том, что ИИ может вскоре решать сложные аналитические проблемы в различных отраслях, не требуя специализированного программирования или опыта домена. Способность рассуждать через сложные проблемы с использованием повседневного языка может демократизировать сложные аналитические возможности между организациями.
Тем не менее, сохраняются вопросы о том, будут ли эти возможности рассуждений эффективно привести к проблемам в реальном мире. Математическая олимпиада обеспечивает четко определенные проблемы с явными критериями успеха-далеко от неоднозначных, многогранных решений, которые определяют большинство бизнес-и научных усилий.
Google DeepMind планирует вернуться на конкурс в следующем году «в поисках идеального счета». Компания считает, что системы искусственного интеллекта сочетают в себе беглость естественного языка с строгими рассуждениями «станут бесценными инструментами для математиков, ученых, инженеров и исследователей, помогая нам продвигать человеческие знания по пути к AGI».
Но, пожалуй, самая заявленная деталь появилась из самого соревнований: когда столкнулся с самой сложной проблемой конкурса, Близнецы начались с неправильной гипотезы и никогда не восстановились. Только пять человек решили эту проблему правильно. В конце концов, кажется, даже AI, завоевавшему золотую медали, все еще есть чему поучиться у подростковых математиков.
Источник
