Реальный собесAgeCode2026-03-26
AgeCode MLSD: поиск по статьям, BM25 и RAG
ML System Design собеседование про поиск по базе статей: BM25 baseline, hybrid retrieval, offline/online evaluation и related articles через reranker.
Таймлайн собеседования
Компактный список вопросов и задач по ходу записи: раскрывайте только нужные детали.
Выводы и как готовиться
- Даже для RAG/search кейса стоит начинать с BM25 baseline, чтобы было с чем сравнивать embeddings и reranker.
- Метрики нужно разделять на offline relevance, online поведение пользователя и production guardrails.
- Related articles можно делать precomputed baseline, а затем усиливать query-aware reranker.