К реальным собесам
Реальный собесBHFT2026-04-22

BHFT technical ML: временные ряды и HFT case

Собеседование с ML System Design и notebook-heavy задачей про временные ряды. Пока публикуется как вопрос/кейс без автотестов.

Таймлайн собеседования

Компактный список вопросов и задач по ходу записи: раскрывайте только нужные детали.

00:03:44-00:06:15Вопрос

Проблемы item-to-item рекомендаций одежды

00:06:15-00:09:49Вопрос

Почему time-series модель может развалиться после хорошего offline

00:09:49-00:14:15Вопрос

Как получить уверенность модели в предсказании

00:14:15-00:21:31MLSD

Lead-lag prediction: постановка HFT-задачи

00:21:31-00:24:49MLSD

Разбор таблиц trades и order book

00:24:49-00:30:26MLSD

Выбор target: относительное изменение mid-price

00:30:26-00:56:55MLSD

Time grid 100 ms и признаки из нерегулярных событий

00:56:55-00:58:58Вопрос

Почему CatBoost, а не линейная модель

00:58:58-01:00:10Вопрос

Как понять, хороший ли MSE на тесте

01:00:10-01:04:27Вопрос

Proxy-метрика ближе к PnL без полноценного бэктеста

01:04:27-01:16:18MLSD

Ревью notebook: признаки, leakage и gap между train/test

01:16:18-01:16:55MLSD

Какую deep learning архитектуру выбрать для временного ряда

Выводы и как готовиться

  • В time-series задачах сначала фиксировать target, горизонт прогноза и момент принятия решения.
  • Валидация должна идти по времени; random split почти наверняка ломает смысл проверки.
  • Перед сложной моделью нужен baseline и отдельная проверка leakage.