Реальный собесSatel Generation2026-04-21
Satel Generation: RAG, evaluation и production ownership
Технический deep dive по RAG-пайплайну: архитектура embeddings/retrieval, оценка качества, self-hosted LLM и опыт доведения ML-проектов до production.
Таймлайн собеседования
Компактный список вопросов и задач по ходу записи: раскрывайте только нужные детали.
00:07:06-00:07:38Вопрос
ВопросКакая архитектура embeddings/retrieval была в legal RAG
00:07:38-00:09:49Вопрос
ВопросКак нарезать юридические документы на чанки
00:09:51-00:10:54Вопрос
ВопросКак выбрать чанки для контекста после retrieval
00:11:28-00:12:05Вопрос
ВопросКак оценивать качество RAG: retrieval, generation и RAGAS
00:13:23-00:15:46Вопрос
ВопросНа чем развернут RAG: FastAPI, Qdrant, ranker и vLLM
00:15:52-00:17:44Behavioral
BehavioralКакой ML-проект ты доводил до production
00:17:49-00:23:43Вопрос
ВопросКак устроить BERT-based moderation inference service
00:23:45-00:26:19Вопрос
ВопросКак собрать данные и классы для модели модерации
00:26:13-00:28:12Вопрос
ВопросКакие offline и online метрики у moderation-модели
Выводы и как готовиться
- RAG нужно разбирать на отдельные контуры: ingestion, chunking, retrieval, reranking, context assembly и generation.
- Оценку качества стоит делить на retrieval-метрики, generation-метрики и production/product signals.
- Для production-вопросов нужен короткий ownership story: роль, rollout, мониторинг, impact и ограничения.