К реальным собесам
Реальный собес2026-04-13

MLSD: прогноз производства по отчетам и LLM-фичи

ML System Design кейс про прогноз производства по отчетам: как использовать LLM для извлечения признаков, валидировать факты из документов и превращать годовой guidance в quarterly features.

Таймлайн собеседования

Компактный список вопросов и задач по ходу записи: раскрывайте только нужные детали.

00:01:02-00:02:00MLSD

Постановка: прогноз добычи меди по рудникам

00:02:07-00:04:31MLSD

Данные: PDF-отчетность, ownership и operator

00:04:38-00:06:09MLSD

Горизонт прогноза: кварталы текущего и следующего года

00:06:13-00:12:52MLSD

Tabular baseline: история, регион, компания и рынок

00:13:43-00:18:17MLSD

Почему исторический baseline ломается на инвестициях

00:18:17-00:21:10MLSD

Какие сигналы из PDF важны для прогноза

00:21:10-00:22:10MLSD

LLM как extractor фичей, а не финальная модель

00:22:10-00:25:12MLSD

Как хранить и обновлять фичу планового производства

00:25:12-00:30:29MLSD

Почему средний годовой коэффициент ломает квартальный прогноз

00:30:29-00:35:39MLSD

Извлекать события и обновлять JSON-state прогноза

00:35:39-00:37:42MLSD

Конкретные LLM-фичи: quarterly plan и grade

00:37:42-00:40:29MLSD

Где возникает leakage из pretraining LLM

00:40:29-00:41:54MLSD

Как валидировать LLM-фичи и не дать модели додумывать

00:41:54-00:44:13MLSD

Как разложить годовой guidance по кварталам

00:44:13-00:50:44MLSD

Как связывать события из нескольких документов

00:52:58-00:54:26MLSD

Как интерпретировать backtest при возможном leakage

00:54:32-00:55:38MLSD

Извлечение графиков в JSON и риск тонких ошибок

00:55:38-00:56:38MLSD

Зачем прогноз добычи нужен бизнесу и рынку

Выводы и как готовиться

  • LLM стоит позиционировать как extractor признаков из документов, а не как замену табличной модели прогноза.
  • Для отчетов нужен grounding: ссылки на документ, confidence, контроль hallucination и ручная/автоматическая проверка качества извлечения.
  • Годовые прогнозы и management guidance нужно аккуратно раскладывать по времени, не создавая leakage.