AACsearch
GraphRAG

Сценарии использования GraphRAG

Конкретные паттерны, где GraphRAG выигрывает у plain RAG — продуктовые знания, поддержка, compliance, внутренние доки — с примерами вопросов и тем, что добавляет граф.

Plain RAG — правильный дефолт. GraphRAG оправдывает стоимость, только когда форма вопроса вынуждает сшивать факты между документами. Это каталог таких паттернов, с примерами вопросов и тем, какую графовую структуру ожидаешь увидеть.

Детали реализации — GraphRAG entity model. Правило plain vs GraphRAG — GraphRAG overview.

Паттерн 1 — Продуктовые знания между документами

Где живёт: внутренние продуктовые доки, support-статьи, changelogs.

Примеры вопросов:

  • «Как наш PrestaShop-коннектор соотносится с v1 API?»
  • «Какие фичи зависят от wallet-модуля?»
  • «Что мы выкатили между v2.4 и v2.6 в ранжировании поиска?»

Что фиксирует граф:

NodeRelationNode
PrestaShop ConnectorusesConnector API
Connector APIdeprecatesv1 API
Wallet ModulepowersAI Answer
v2.6 releaseaffectsRanking Pipeline

GraphRAG прыгает от anchor-сущности вопроса по её связям и собирает evidence-чанки из каждой. Plain RAG пришлось бы вытащить все релевантные чанки по одному similarity-скору — обычно вытягивает очевидные, но теряет deprecation-цепочку.

Паттерн 2 — Поддержка и troubleshooting

Где живёт: runbook-и, постмортемы, support-макросы.

Примеры:

  • «Если public search возвращает 429, что у downstream проверять?»
  • «Какой failure mode ломает reindex и как чинили раньше?»
  • «Какие алерты валились на wallet ledger за 6 месяцев?»

Что фиксирует граф:

NodeRelationNode
SearchRateLimitBucketfeedsPublic Search Endpoint
Reindex Jobdepends_onTypesense Alias
Alert: wallet_low_balancetriggersNotification Queue
Post-mortem 2024-09referencesReindex Job

Ментальная модель оператора при troubleshooting — это уже граф: симптом → вероятные причины → митигейшены. GraphRAG её естественно повторяет. Plain RAG срабатывает, если постмортем исчерпывающий — а они обычно не такие.

Паттерн 3 — Compliance и аудит

Где живёт: политики, DPA / SOC 2 evidence, security questionnaires.

Примеры:

  • «Какие контроли покрывают обработку персональных данных в wallet ledger?»
  • «Какое evidence у нас по SOC 2 CC6.1 — logical access?»
  • «Какие third-party processors мы используем для AI-фич?»

Что фиксирует граф:

NodeRelationNode
AC-2 Access PolicycoversWallet Ledger
SOC 2 CC6.1evidenced_byAccess Review 2024-Q3
OpenAIprocessesKnowledge Chunk Text
DPA Annex IIlistsOpenAI

Compliance не прощает: ответ должен ссылаться на документ, не на пересказ. evidenceChunkId в GraphRAG делает путь инспектируемым: каждое утверждение → чанк → документ.

Scope SOC 2 / DPA и data residency — Security & Compliance.

Паттерн 4 — Кейсы клиентов и референсы

Где живёт: sales-деки, кейсы, customer wikis.

Примеры:

  • «Какие клиенты в retail использовали scoped tokens?»
  • «Кейсы, где мы держали > 100 RPS на одном индексе?»
  • «Кто с нашей стороны вёл миграцию Acme на Bitrix?»

Что фиксирует граф:

NodeRelationNode
Acme RetailusesScoped Tokens
Acme RetailintegratedBitrix Connector
Case 2024-11documents100 RPS sustained
Jane DoeownedAcme Bitrix migration

Sales / CS постоянно задают multi-entity вопросы. Plain RAG ок, когда один документ покрывает весь кейс; GraphRAG — когда ответ раскидан по account note, кейсу и slack-архиву.

Паттерн 5 — Архитектура и dependency tracing

Где живёт: архитектурные доки, ADR, runbook-и.

Примеры:

  • «Если выпилим wallet, что ещё сломается?»
  • «Какие модули импортируют из @repo/search
  • «Проследи auth-флоу от cookie до oRPC-процедуры.»

Что фиксирует граф:

NodeRelationNode
Wallet Moduleprovides_toAI Answer Public Handler
AI Answer Public Handlerdepends_onPublic Auth Gate
@repo/searchimported_by@repo/api search router
Better Auth SessionfeedsoRPC Context

GraphRAG плюс docs-as-code (документы этого сайта, замороженные в Knowledge space) — отвечает на «что сломается, если я поменяю X?» без копания в коде. Обновляем граф re-ingest-ом доков после каждого релиза.

Паттерн 6 — Обучение и онбординг

Где живёт: онбординг-доки, how-to, глоссарии.

Примеры:

  • «Что мне надо знать про scoped tokens до того, как трогать widget auth?»
  • «Проведи меня через lifecycle reindex-а.»

Это «дай маршрут» — последовательные вопросы. path из graphragExplain — список (from, relation, to) — двойная функция: ответ + обучающий тур.

Когда граф пустой

Если GraphRAG включён на свежем space, а пути пустые — три типичные причины:

  1. Ingest не запустил graph build. Проверяем IngestionJob.inputMeta.graphBuilt: true. Если нет — KnowledgeSpace.ragConfig.graphragEnabled был выключен при ingest-е.
  2. Мало документов. При < 20 — недостаточно overlap-а сущностей для интересных связей. Plain RAG ок до этого.
  3. Сильно image-based контент. OCR — roadmap; без текста entity-resolution-у нечего жевать.

Быстрый smoke-test: количество строк в graph_edge для space. Меньше 50 → графа недостаточно, чтобы он что-то менял.

Где GraphRAG плох

  • Numerical aggregation. «Сумма выручки по кейсам с тегом X» — это БД-запрос, не графовый.
  • Длинные causal цепи. > 2 hops — roadmap; сейчас «A → B → C → D» теряется.
  • Live-данные. Граф — снапшот на момент ingest. Для свежести — storefront / API.

Связанные страницы

On this page