avva | ИИ и наука, новости последних двух дней

AI-модели и наука, новости последних двух дней:

1. OpenAI заявила, что GPT-5.2 открыла новый результат в теоретической физике: https://x.com/OpenAI/status/2022390096625078389

При определенном виде столкновения элементарных частиц считалось, что определенный способ оценки их амплитуды рассеяния дает ответ 0. Оказалось, что если эти частицы не случайным образом летят, а их импульсы связаны друг с другом особым образом, все еще дающим много степеней свободы, то рассеяние может быть ненулевым, и это открывает некоторое пространство для дальнейшей интересной работы теоретиков (с экспериментами это напрямую не связано, если я верно понял).

После того, как соавторы-люди придумали такую возможность, но смогли получить только очень сложные и непонятные вычисления амплитуды, ИИ-модель предсказала простую формулу для n частиц, а потом внутренняя для OpenAI продвинутая версия смогла после 12 часов работы доказать ее истинность.

Возможное возражение: Зоар Комаргодский считает, что главным открытием тут является сама идея смотреть на определенные конфигурации импульсов, и в этом, а не в конкретной формуле, 90% пользы от статьи: https://x.com/ZoharKo/status/2022597971167318294

2. "First Proof" это вызов, брошенный математиками ИИ-моделям: десять математиков в разных областях сформулировали вопросы, находящиеся на самом переднем краю их исследований. На эти десять вопросов нет известных ответов, они вполне нетривиальны, но сами математики на них уже ответили в процессе своей работы. Эти ответы скрываются от публики на неделю, и дается шанс ИИ-моделям соревноваться с экспертами.

Неделя кончилась вчера, за час до конца срока OpenAI объявила, что их внутренняя модель, с ограниченной помощью людей, скорее всего нашла шесть или больше правильных ответов из 10:https://x.com/merettm/status/2022517085193277874

Окончательное подтверждение ожидается от самих математиков, видимо сегодня. Предварительные комментарии от Дэниэля Литта: https://x.com/littmath/status/2022529725176897665

Возможное возражение: работа ИИ не была полностью автономной, в некоторых случаях эксперты-математики (не в этих конкретных областях) помогали ему вопросами о первых попытках, или выбрали лучшую из нескольких попыток.

3. Экономист из Цюриха Дэвид Йонагизава-Дротт показывает, как с помощью Claude Code он с нуля создает новую статью в макроэкономике (в которой он мало что понимает): https://x.com/YanagizawaD/status/2022034194507915265

Если я верно уловил, ИИ-модель почти все делает сама, только задает ему уточняющие вопросы насчет стратегии, типа какой это вид статьи, хочешь больше графиков или меньше, итп. Конечный продукт выглядит убедительно. Насколько это полезная или интересная статья, трудно судить - скорее всего не полезная и не интересная, но смысл этого упражнения скорее не "ИИ делает научные открытия", а "поток ИИ-статей в ближайшее время захлестнет академическое сообщество".

Прогресс последних 2-3 месяцев опять выглядит экспоненциальным. И да, мне от этого не по себе.

Flat | Top-Level Comments Only

From:

k_uao

1 ,2 -- страшненько, к сожалению, недостаточно специалист по 1.
3 -- еще страшнее, потока правдоподобного ИИ-бреда видимо не избежать, точнее он уже идет.

При этом собственные попытки задавать first-proof вопросы Claude Code и Chat GPT пока исключительно бесполезны. Я был бы рад, если бы оно подсказывало куда смотреть, но публично доступные модели этого мне ни разу не смогли, совершенно безыдейны. Возможно, в загашнике у них что-то радикально сильнее. Хотя непонятно, почему GPT 5 оказался сравнительно небольшим улучшением GPT 4.

Upd

Собственно, в оригинальном препринте и написано, что LLM не помогает. Но видимо у них есть не только llm

Edited Date: 2026-02-14 04:09 pm (UTC)

panzerbaer

>амплитуды рассеяния

в технической физике 'AI' сАсет как дышит. Вон, я пЕшу про расчеты подкалиберных, если кому интересно, можно почетать в моем журнале.. не-безизвестная программа ANSYS.

mr_numeraire

We have found that AlphaEvolve excels at discovering constructions that were already within reach of current mathematics, but had not yet been discovered due to the amount of time and effort required to find the right combination of standard ideas that works well for a particular problem. On the other hand, for problems where genuinely new, deep insights are required to make progress, AlphaEvolve is likely not the right tool to use. In the future, we envision that tools like AlphaEvolve could be used to systematically assess the difficulty of large classes of mathematical bounds or conjectures. This could lead to a new type of classification, allowing researchers to semi-automatically label certain inequalities as “AlphaEvolve-hard”, indicating their resistance to AlphaEvolve-based methods. Conversely, other problems could be flagged as being amenable to further attacks by both theoretical and computer-assisted techniques, thereby directing future research efforts more effectively.

Если от академии еще что-то останется,то я бы добавил в некоторых дисциплинах неофициальное требование к приличному PhD, чтобы решенные (ну, или формулируемые на этапе начала PhD ) задачи не решались AI

Edited Date: 2026-02-14 04:31 pm (UTC)

xaxam

Ого! Задачи впечатляют: до сих пор ИИ вроде бы отмечался либо в специально сконструированных головоломках типа задач на ММО, либо в комбинаторных задачах Эрдёш-стиля. В данном эксперименте минимум три-четыре задачи - совершенно другого типа, выглядят, как "настоящая" математика.

Чтоб было что поставить на кон: я имел в виду задачи 1, 7, 8 и, возможно, 4. Интересно будет посмотреть именно на успех в отношении этих задач.

cohenj

Ура! Ждём на следующей неделе всю правду-матку про дзета функцию. А ещё через неделю ABC-гипотеза падёт под могучими ударами ИИ.

Ни о какой безапелляционности в моих высказываниях не может быть и речи!

(...)

ИИ и наука, новости последних двух дней

ИИ и наука, новости последних двух дней

no subject

no subject

Наверное, уже видели: https://arxiv.org/abs/2511.02864

Re: Наверное, уже видели: https://arxiv.org/abs/2511.02864

no subject

no subject

Profile

February 2026

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags