Введение в векторные базы данных и RAG системы

Введение в векторные базы данных. Виды данных по их структуре.

Обзор трёх типов данных — структурированных, полуструктурированных и неструктурированных — с примерами баз данных для каждого типа и объяснением роли векторных баз данных в работе с неструктурированными данными.

Структура векторной базы данных и что в ней хранится

Обзор типов данных в реляционных, документо-ориентированных и векторных базах данных: структурированные таблицы, JSON-документы и хранение неструктурированных данных в виде эмбеддингов с метаданными и контекстом.

Что такое embedding и embedding модели

Объяснение концепции эмбеддингов в векторных базах данных: как объекты (текст, изображения, аудио) преобразуются в числовые векторы с помощью AI-моделей и сохраняются в многомерном пространстве для последующего поиска.

Понятие RAG систем

Векторные базы данных применяются в рекомендательных системах, поиске похожих товаров и статей, а также в RAG-системах (Retrieval Augmented Generation). Они помогают находить релевантные данные и интегрируются с большими языковыми моделями (LLM), такими как ChatGPT, для эффективной обработки запросов. Это снижает затраты на работу с LLM, расширяя возможности обработки информации.

Чем хорош формат markdown. Почему он популярен для AI

Материал объясняет, почему формат Markdown стал стандартом для работы с системами искусственного интеллекта и RAG-системами. Рассматриваются ключевые преимущества формата: простота структуры, экономия токенов, универсальная совместимость с инструментами и удобство разбивки текста на чанки.

Что еще добавить в этот курс? Каких уроков вам не хватило?