Скачать [Stepik] Vector DB & RAG Developer (Алексей Малышкин)

Зарегистрируйтесь, чтобы посмотреть скрытый контент
Робот
Робот
Робот форума
Сообщения
411 424
Реакции
1 792
Монеты
21 179
Оплачено
0
Ссылка на картинку
Vector DB & RAG Developer

Практический курс по векторным базам данных и семантическому поиску. Вы развернёте Qdrant, Weaviate и FAISS, научитесь индексировать миллионы эмбеддингов, строить k-NN-поиск с фильтрами, объединять его с BM-25 и создавать RAG-ботов, которые отвечают на вопросы на основе ваших данных.

Чему вы научитесь:
  • Пояснять, как работают эмбеддинги и к-NN-поиск
  • Разворачивать Qdrant, Weaviate и FAISS локально и в Docker
  • Загружать и хранить миллионы векторов, не теряя производительность
  • Настраивать фильтрацию и гибридный поиск (BM25 + ANN)
  • Реализовывать мультимодальный поиск (текст, изображение) с CLIP
  • Строить RAG-чат-ботов, дополняющих LLM свежими фактами из базы
  • Метриками Recall@K и nDCG измерять качество выдачи
  • Автоматизировать CI/CD пайплайн для поиска с GitHub Actions
  • Оптимизировать индексы под CPU и GPU, выбирая HNSW, IVF или PQ
  • Оценивать, когда выбрать облако (Pinecone, Qdrant Cloud) vs on-prem
О курсе:

Vector DB & RAG Developer — практический маршрут от «что такое эмбеддинги?» до production-чат-бота, отвечающего на вопросы из вашей корпоративной базы знаний.

За несколько недель вы:
  • развернёте Qdrant, Weaviate и FAISS локально и в Docker/Cloud;
  • создадите коллекции на миллионы векторов, подберёте правильный индекс (HNSW, IVF-PQ, ScaNN);
  • настроите гибридный поиск (BM25 + ANN) и мультимодальный поиск с CLIP;
  • подключите базу к LLM (OpenAI/GPT-4o, Mistral, Llama) и реализуете RAG-архитектуру;
  • измерите качество выдачи (Recall@K, nDCG) и построите автоматические тесты;
  • оформите CI/CD пайплайн: тесты → Docker → GitHub Actions → prod;
  • защитите проект от «векторного взрыва» (sharding, фильтры, дедупликация).
  • Итог — готовый репозиторий с API для семантического поиска и RAG-бот, которого можно деплоить на Render, Railway или собственный сервер.
  • Вы можете задать любой вопрос по курсу в телеграмм @alexey_stepik
Для кого этот курс:
  • ML / Data-инженеры, которым нужен быстрый поиск по embeddings.
  • Backend-разработчики, добавляющие умный поиск или чат-бота в продукт.
  • DS/Analytics-junior — хотите прокачать портфолио проектом на LLM.
  • Техлиды / CTO, выбирающие стек для корпоративного knowledge-base.
  • Стартапы, где «Google-поиск по документам» и RAG-бот экономят поддержку.
Начальные требования:
  • Запускать скрипт python main.py, ставить пакеты pip install …
  • Переходить между папками (cd), копировать-вставлять команды
  • Склонировать репозиторий git clone … — всё остальное покажем
Автор Алексей Малышкин:
  • Аналитик-разработчик с опытом работы в крупных компаниях.
  • Победитель олимпиад по математике, программированию и анализу данных.
Показать больше
 
Зарегистрируйтесь , чтобы посмотреть скрытый контент.
Поиск по тегу:
Теги
stepik vector db & rag developer алексей малышкин
Похожие складчины
Показать больше похожих складчин

Зарегистрируйте учетную запись

У вас появится больше возможностей!

Создать учетную запись

Пройдите быструю регистрацию

Войти

Уже зарегистрированы? Войдите.

Сверху