Реальный собесSatel Generation2026-04-21

Satel Generation: RAG, evaluation и production ownership

Технический deep dive по RAG-пайплайну: архитектура embeddings/retrieval, оценка качества, self-hosted LLM и опыт доведения ML-проектов до production.

Таймлайн собеседования

Компактный список вопросов и задач по ходу записи: раскрывайте только нужные детали.

00:07:06-00:07:38Вопрос

Вопрос

Какая архитектура embeddings/retrieval была в legal RAG

00:07:38-00:09:49Вопрос

Вопрос

Как нарезать юридические документы на чанки

00:09:51-00:10:54Вопрос

Вопрос

Как выбрать чанки для контекста после retrieval

00:11:28-00:12:05Вопрос

Вопрос

Как оценивать качество RAG: retrieval, generation и RAGAS

00:13:23-00:15:46Вопрос

Вопрос

На чем развернут RAG: FastAPI, Qdrant, ranker и vLLM

00:15:52-00:17:44Behavioral

Behavioral

Какой ML-проект ты доводил до production

00:17:49-00:23:43Вопрос

Вопрос

Как устроить BERT-based moderation inference service

00:23:45-00:26:19Вопрос

Вопрос

Как собрать данные и классы для модели модерации

00:26:13-00:28:12Вопрос

Вопрос

Какие offline и online метрики у moderation-модели

Выводы и как готовиться

RAG нужно разбирать на отдельные контуры: ingestion, chunking, retrieval, reranking, context assembly и generation.
Оценку качества стоит делить на retrieval-метрики, generation-метрики и production/product signals.
Для production-вопросов нужен короткий ownership story: роль, rollout, мониторинг, impact и ограничения.