Сценарии использования GraphRAG
Конкретные паттерны, где GraphRAG выигрывает у plain RAG — продуктовые знания, поддержка, compliance, внутренние доки — с примерами вопросов и тем, что добавляет граф.
Plain RAG — правильный дефолт. GraphRAG оправдывает стоимость, только когда форма вопроса вынуждает сшивать факты между документами. Это каталог таких паттернов, с примерами вопросов и тем, какую графовую структуру ожидаешь увидеть.
Детали реализации — GraphRAG entity model. Правило plain vs GraphRAG — GraphRAG overview.
Паттерн 1 — Продуктовые знания между документами
Где живёт: внутренние продуктовые доки, support-статьи, changelogs.
Примеры вопросов:
- «Как наш PrestaShop-коннектор соотносится с v1 API?»
- «Какие фичи зависят от wallet-модуля?»
- «Что мы выкатили между v2.4 и v2.6 в ранжировании поиска?»
Что фиксирует граф:
| Node | Relation | Node |
|---|---|---|
PrestaShop Connector | uses | Connector API |
Connector API | deprecates | v1 API |
Wallet Module | powers | AI Answer |
v2.6 release | affects | Ranking Pipeline |
GraphRAG прыгает от anchor-сущности вопроса по её связям и собирает evidence-чанки из каждой. Plain RAG пришлось бы вытащить все релевантные чанки по одному similarity-скору — обычно вытягивает очевидные, но теряет deprecation-цепочку.
Паттерн 2 — Поддержка и troubleshooting
Где живёт: runbook-и, постмортемы, support-макросы.
Примеры:
- «Если public search возвращает 429, что у downstream проверять?»
- «Какой failure mode ломает reindex и как чинили раньше?»
- «Какие алерты валились на wallet ledger за 6 месяцев?»
Что фиксирует граф:
| Node | Relation | Node |
|---|---|---|
SearchRateLimitBucket | feeds | Public Search Endpoint |
Reindex Job | depends_on | Typesense Alias |
Alert: wallet_low_balance | triggers | Notification Queue |
Post-mortem 2024-09 | references | Reindex Job |
Ментальная модель оператора при troubleshooting — это уже граф: симптом → вероятные причины → митигейшены. GraphRAG её естественно повторяет. Plain RAG срабатывает, если постмортем исчерпывающий — а они обычно не такие.
Паттерн 3 — Compliance и аудит
Где живёт: политики, DPA / SOC 2 evidence, security questionnaires.
Примеры:
- «Какие контроли покрывают обработку персональных данных в wallet ledger?»
- «Какое evidence у нас по SOC 2 CC6.1 — logical access?»
- «Какие third-party processors мы используем для AI-фич?»
Что фиксирует граф:
| Node | Relation | Node |
|---|---|---|
AC-2 Access Policy | covers | Wallet Ledger |
SOC 2 CC6.1 | evidenced_by | Access Review 2024-Q3 |
OpenAI | processes | Knowledge Chunk Text |
DPA Annex II | lists | OpenAI |
Compliance не прощает: ответ должен ссылаться на документ, не на пересказ. evidenceChunkId в GraphRAG делает путь инспектируемым: каждое утверждение → чанк → документ.
Scope SOC 2 / DPA и data residency — Security & Compliance.
Паттерн 4 — Кейсы клиентов и референсы
Где живёт: sales-деки, кейсы, customer wikis.
Примеры:
- «Какие клиенты в retail использовали scoped tokens?»
- «Кейсы, где мы держали > 100 RPS на одном индексе?»
- «Кто с нашей стороны вёл миграцию Acme на Bitrix?»
Что фиксирует граф:
| Node | Relation | Node |
|---|---|---|
Acme Retail | uses | Scoped Tokens |
Acme Retail | integrated | Bitrix Connector |
Case 2024-11 | documents | 100 RPS sustained |
Jane Doe | owned | Acme Bitrix migration |
Sales / CS постоянно задают multi-entity вопросы. Plain RAG ок, когда один документ покрывает весь кейс; GraphRAG — когда ответ раскидан по account note, кейсу и slack-архиву.
Паттерн 5 — Архитектура и dependency tracing
Где живёт: архитектурные доки, ADR, runbook-и.
Примеры:
- «Если выпилим wallet, что ещё сломается?»
- «Какие модули импортируют из
@repo/search?» - «Проследи auth-флоу от cookie до oRPC-процедуры.»
Что фиксирует граф:
| Node | Relation | Node |
|---|---|---|
Wallet Module | provides_to | AI Answer Public Handler |
AI Answer Public Handler | depends_on | Public Auth Gate |
@repo/search | imported_by | @repo/api search router |
Better Auth Session | feeds | oRPC Context |
GraphRAG плюс docs-as-code (документы этого сайта, замороженные в Knowledge space) — отвечает на «что сломается, если я поменяю X?» без копания в коде. Обновляем граф re-ingest-ом доков после каждого релиза.
Паттерн 6 — Обучение и онбординг
Где живёт: онбординг-доки, how-to, глоссарии.
Примеры:
- «Что мне надо знать про scoped tokens до того, как трогать widget auth?»
- «Проведи меня через lifecycle reindex-а.»
Это «дай маршрут» — последовательные вопросы. path из graphragExplain — список (from, relation, to) — двойная функция: ответ + обучающий тур.
Когда граф пустой
Если GraphRAG включён на свежем space, а пути пустые — три типичные причины:
- Ingest не запустил graph build. Проверяем
IngestionJob.inputMeta.graphBuilt: true. Если нет —KnowledgeSpace.ragConfig.graphragEnabledбыл выключен при ingest-е. - Мало документов. При < 20 — недостаточно overlap-а сущностей для интересных связей. Plain RAG ок до этого.
- Сильно image-based контент. OCR — roadmap; без текста entity-resolution-у нечего жевать.
Быстрый smoke-test: количество строк в graph_edge для space. Меньше 50 → графа недостаточно, чтобы он что-то менял.
Где GraphRAG плох
- Numerical aggregation. «Сумма выручки по кейсам с тегом X» — это БД-запрос, не графовый.
- Длинные causal цепи. > 2 hops — roadmap; сейчас «A → B → C → D» теряется.
- Live-данные. Граф — снапшот на момент ingest. Для свежести — storefront / API.
Связанные страницы
Модель сущностей GraphRAG
Форма данных knowledge graph — GraphNode, GraphEdge, evidence-чанки и ограничения, обеспечивающие безопасный мультитенантный graph-запрос.
Рекомендации
Обзор движков рекомендаций AACsearch — похожие, also-viewed, frequently-bought-together, trending, персонализированные и GraphRAG. Какой движок куда поставить.