Нейросети теперь прогнозируют успех стартапов точнее венчурных инвесторов
Компьютеры давно сильнее человека в задачах, где нужно быстро считать и обрабатывать огромные массивы чисел. Высокочастотная торговля стала понятным примером: алгоритмы мгновенно реагируют на рынок, не устают и не отвлекаются. Стратегия всегда казалась другой областью. Там нужно читать описания проектов, понимать рынок, оценивать команду, продукт, спрос и риск. Новое исследование показывает, что даже в такой работе преимущество человека уже не выглядит бесспорным.
Профессор стратегии Фелипе Часар из Школы бизнеса Росса при Мичиганском университете вместе с Атикусом Петерсоном из Нью-Йоркского университета и Дэниелом Уайлдом из Индианского университета проверил, насколько точно большие языковые модели предсказывают успех новых технологических проектов. Работа опубликована как препринт на arXiv, поэтому выводы ещё не прошли полноценную научную рецензию.
Авторы выбрали задачу, где искусственный интеллект (ИИ) не мог опереться на уже известные итоги. В эксперимент вошли 30 действующих краудфандинговых проектов в сфере технологий. Кампании запустили после дат, на которых заканчивалось обучение изучаемых моделей. Значит, модель не могла заранее знать, сколько денег соберёт каждый проект, и оценивала их по описанию, идее, рыночным признакам и связям между этими данными.
Исследователи устроили турнир прогнозов. Разные большие языковые модели выполнили 870 попарных сравнений: в каждом случае нужно было выбрать, какой из двух проектов соберёт больше денег или окажется успешнее по итогам кампании. Затем прогнозы ИИ сравнили с оценками 346 менеджеров и трёх инвесторов, обучавшихся по программам MBA.
Лучшие языковые модели в этом эксперименте обошли людей. Самые сильные участники среди людей правильно выбирали победителя примерно в трёх сравнениях из пяти. Gemini 2.5 Pro показала корреляцию 0,74 и почти в четырёх случаях из пяти верно определяла, какой проект окажется успешнее соперника.
Для бизнес-стратегии важна не только сама цифра. Решения о новых продуктах, венчурных ставках и выходе на рынок обычно связывают с опытом, насмотренностью и умением замечать слабые сигналы. Исследование показывает, что языковые модели уже справляются не только с таблицами и финансовыми рядами. Они могут сравнивать описания компаний, оценивать идеи продуктов и работать с ситуациями, где заранее нет очевидного ответа.
Отдельно авторы описали эффект, который назвали augmentation trap. В этом эксперименте термин означает ситуацию, когда человек не усиливает прогноз ИИ, а ухудшает его. Обычно предполагается, что совместная работа должна дать лучший результат: модель делает расчёт, эксперт добавляет опыт, общий прогноз становится точнее. Здесь вышло наоборот. Когда человеческие оценки смешивали с прогнозами ИИ, итоговая точность снижалась по сравнению с работой модели без участия людей.
Дело не в том, что люди плохо разбираются в бизнесе. Человеческое суждение приносило в прогноз лишний шум: личные предпочтения, случайные ошибки, разные представления о рынке, переоценку знакомых признаков и недооценку менее очевидных деталей. В этой задаче дополнительные мнения не улучшили результат, а сбили более точный прогноз модели.
Часар связывает успех ИИ с тем, что модели частично обходят ограниченную рациональность человека. В экономике и менеджменте этим термином называют естественные пределы мышления: нехватку времени, ограниченную память, усталость, неполную концентрацию и разный уровень знаний по смежным темам. Человек не может прочитать всё, запомнить тысячи примеров и одинаково спокойно сравнить сотни проектов.
Большая языковая модель работает иначе. Она обучалась на огромном массиве текстов, быстро находит связи между разными областями и не устаёт от однотипных сравнений. Для стратегического прогноза такая широта особенно важна. Успех нового проекта редко зависит от одного фактора. Приходится одновременно учитывать технологию, рынок, поведение пользователей, конкурентов, бизнес-модель и вероятность того, что идея окажется понятной покупателям или инвесторам.
Исследование также связывает качество стратегических прогнозов с результатами модели на Humanity’s Last Exam. Этот тест проверяет знания ИИ на уровне сложных университетских и экспертных задач из разных дисциплин. Авторы считают эту связь важной подсказкой: для прогноза в бизнесе модели нужно не просто узнавать знакомые шаблоны, а соединять знания из разных сфер.
Поэтому результат нельзя свести к угадыванию по ключевым словам. Модель должна определить, почему один проект сильнее другого, какие признаки говорят о спросе, где команда обещает слишком много, а где идея действительно совпадает с потребностью рынка. Чем шире знания и точнее рассуждение, тем выше шанс дать верный прогноз.
Авторы сравнивают этот момент с 1997 годом, когда Deep Blue победил Гарри Каспарова и показал, что машина может превзойти человека в игре, которую долго связывали с интуицией и мастерством. Но со стратегией всё менее однозначно. В шахматах есть строгие правила, партии и чемпионы мира. У бизнес-прогнозов нет одного Каспарова, победа над которым закрыла бы спор. Рынки меняются, проекты отличаются друг от друга, а успех можно считать по разным показателям.
Часар не утверждает, что для стратегии уже наступил свой момент Deep Blue. Эксперимент проверял одну конкретную задачу: 30 технологических краудфандинговых проектов и прогнозирование успеха сбора средств. Но работа показывает, что возможности ИИ в стратегическом анализе стали заметно шире, чем ещё недавно казалось.
Для компаний вывод получается практичным. Если качественный прогноз перестаёт быть редким и дорогим навыком отдельных экспертов, конкурентное преимущество смещается в другое место. Бизнесу придётся соревноваться не только в умении предсказывать будущее, а в том, как он встроит ИИ-прогнозы в решения, какие собственные данные даст модели и насколько быстро проверит выводы на практике.
Часар сравнивает этот сдвиг с удешевлением физического труда во время промышленной революции и удешевлением доступа к информации после появления интернета. ИИ может снизить стоимость сложного мышления: анализа, сравнения сценариев, оценки неопределённости и выбора между проектами. Если прогнозы станут дешевле и доступнее, стратегия не исчезнет, но изменит центр тяжести. Ценность будет не в красивом экспертном мнении, а в способности быстрее конкурентов превратить прогноз в решение.