Пост #373
Полная карточка кейса с текстом, источниками и полями проверки.
Причина
Сильный синтез и релевантность, но мало конкретных решений для бизнеса и не хватает оформления цифр по формату.
Полный текст поста
Самый дорогой AI-сценарий обычно выглядит прилично: "ну модель же справляется".
А потом смотришь внимательнее, и там один и тот же навык каждый раз заново арендуется по токенам.
В этом месте AI как раз начинает взрослеть.
В [ReaComp](https://arxiv.org/abs/2605.05485) исследователи взяли reasoning traces и компилировали их не в очередной промпт, а в символические решатели. Итог довольно неприятный для любителей вечно дергать LLM: ансамбли таких решателей дали 91,3% на PBEBench-Lite и 84,7% на PBEBench-Hard, причем без LLM calls at test time.
То есть после сборки навык уже не "вспоминается" на каждом запуске. Он живет в механике.
Похожая мысль есть и в [From History to State: Constant-Context Skill Learning for LLM Agents](https://arxiv.org/abs/2605.05413): если задача повторяется, выгоднее перегонять контекст в состояние, чем таскать за собой длинную простыню истории и промптов. Не просить модель помнить. Заставить систему знать.
И вот тут начинается не наука, а деньги.
Каждый повторный запрос к модели это переменная себестоимость, замаскированная под "интеллект". Пока все обсуждают новые интеграции вроде [ChatGPT в Excel и Google Sheets](https://t.me/gpt_news/8022) и инфраструктурные сделки уровня [Anthropic и SpaceX](https://t.me/data_secrets/9181) с сотнями мегаватт и примерно 220k GPU, у бизнеса вопрос скучный: что из этого вы будете гонять через модель тысячу раз, хотя можно один раз прибить к полу правилом, шаблоном, формулой или кодом.
Короче, хороший AI-процесс не обязан каждый раз думать.
Иногда он просто должен перестать быть чатом.
Подтверждающие источники
| Тема | Источник | Дата | Заголовок | Ссылка |
|---|
| У этого поста не найдено подтверждающих источников. |
Поля проверки
| Поле | Значение |
|---|
| Оригинальность | 8 |
| Попадание в аудиторию | 9 |
| Практическая польза | 6 |
| Тон | 8 |
| Плотность текста | 8 |
| Форматирование | 5 |
| Опора на источники | 8 |
| Проверка источников | 7 |
| Готов к отправке | Да |
| Причина | Сильный синтез и релевантность, но мало конкретных решений для бизнеса и не хватает оформления цифр по формату. |