Введение в векторные базы данных и RAG системы

Введение в векторные базы данных. Виды данных по их структуре.

Обзор трёх типов данных — структурированных, полуструктурированных и неструктурированных — с примерами баз данных для каждого типа и объяснением роли векторных баз данных в работе с неструктурированными данными.

Структура векторной базы данных и что в ней хранится

Обзор типов данных в реляционных, документо-ориентированных и векторных базах данных: структурированные таблицы, JSON-документы и хранение неструктурированных данных в виде эмбеддингов с метаданными и контекстом.

Что такое embedding и embedding модели

Объяснение концепции эмбеддингов в векторных базах данных: как объекты (текст, изображения, аудио) преобразуются в числовые векторы с помощью AI-моделей и сохраняются в многомерном пространстве для последующего поиска.

Что такое RAG (retrieval augmented generation)?

Векторные базы данных применяются в рекомендательных системах, поиске похожих товаров и статей, а также в RAG-системах. Что такое RAG - это подход, при котором языковая модель перед генерацией ответа получает релевантные данные из внешних источников. Такой подход снижает затраты на работу с LLM и расширяет возможности обработки информации.

Чем хорош формат markdown. Почему он популярен для AI

Материал объясняет, почему формат Markdown стал стандартом для работы с системами искусственного интеллекта и RAG-системами. Рассматриваются ключевые преимущества формата: простота структуры, экономия токенов, универсальная совместимость с инструментами и удобство разбивки текста на чанки.

Что еще добавить в этот курс? Каких уроков вам не хватило?