AACsearch
AI Поиск

Обзор AI Search

Где AI Search встраивается в AACSearch OS — семантический поиск, AI-ответы, подсказки — и чем это отличается от полнотекстового поиска и Knowledge RAG / GraphRAG.

AACSearch OS добавляет три «интеллектуальных» слоя поверх одного и того же индексированного каталога:

ПоверхностьЧто делаетГде живёт
Keyword searchТипонезависимый полнотекстовый поиск по объявленным полям. Быстро, детерминированно, без LLM.POST /api/search и POST /api/search/multi
Semantic searchВекторный поиск через эмбеддинги. Помогает, когда формулировка ≠ ключевые слова в каталоге.POST /api/search с queryByEmbedding (Beta) / Semantic search
AI answersКраткий ответ на естественном языке над списком результатов, со ссылками на цитируемые документы.POST /api/search/ai/answer / AI answers
SuggestionsАвтокомплит / «возможно вы имели в виду» / популярные запросы во время набора.Suggestions

Глубинный слой — Q&A по вашим собственным документам — это Knowledge RAG и GraphRAG:

ПоверхностьЧто делаетДокументация
Knowledge RAGRetrieval-augmented Q&A по загруженным файлам / URL в Knowledge-пространстве.Knowledge RAG
GraphRAGГрафовый retrieval, который проходит по сущностям/связям для многодокументного reasoning-а.GraphRAG

Статус фич

ВозможностьСтатус
Полнотекстовый поиск (типонезависимый, фасеты, сортировка)✅ Available
AI-ответ над результатами поиска (/api/search/ai/answer)✅ Available
Image-to-vector поиск (/api/search/ai/image)✅ Available
Knowledge RAG (загрузка файлов/URL, ask)✅ Available
Knowledge RAG streaming (askStream)✅ Available
GraphRAG: граф сущностей и связей✅ Available
GraphRAG: детекция сообществ (Louvain)✅ Available
GraphRAG: drill-down explain (graphragExplain)✅ Available
Semantic search с выбором модели эмбеддингов🟡 Beta — выбор модели per Knowledge space
Auto-embedding при ingest🟡 Beta
Knowledge sources через коннекторы (Confluence, Notion, GDrive)⏳ Roadmap
Tenant-fine-tuned модель⏳ Roadmap (Enterprise)

Feature-флаги и привязка к тарифам — Plans and limits. Те же статусы дублируются на маркетинговых страницах фич; если есть расхождение — источник правды эта страница.

Когда какой слой использовать

Это не «что умнее» — это компромисс между латентностью, стоимостью и точностью.

ЗадачаЧто брать
«Покажи товары, подходящие под запрос»Keyword search
«Покажи товары, даже когда пользователь формулирует иначе»Semantic + keyword (hybrid)
«Над списком — краткая выжимка из 5 товаров, отвечающая на вопрос»AI answer
«Ответь по моей поддерживающей документации, со ссылками»Knowledge RAG
«Ответь на вопрос, охватывающий несколько документов и концепций»GraphRAG
«Подсказывай запросы во время набора»Suggestions / multi-search

Когда AI-ответы лучше не включать

AI-ответы — это мощно, но не бесплатно, не всегда верно и не всегда нужно. Пропускайте, когда:

  • Запрос — это навигация («страница входа», «оформление заказа»). Покажите ссылку, а не абзац.
  • Ответ должен быть авторитетным (юридический, медицинский, ценовой). Полнотекст возвращает источник; пользователь читает сам.
  • Латентность важнее «гладкости». AI-ответ добавляет 500–2000 мс к поиску.
  • В каталоге меньше ~5 матчей — модель додумает контекст, которого нет.
  • Не можете показать или измерить цитирования. Ответ без ссылок — это необсуждаемая ответственность для поддержки.

Если запрос не проходит ни один из этих фильтров — отрисуйте список и фасеты, дайте пользователю выбрать. AI-ответ — дополнительный слой, не замена результатам.

Форма стоимости

Все AI-поверхности учитываются через AI Wallet в BigInt-копейках (Инвариант 8). Публичные AI-эндпоинты используют схему reserve → call → commit/release:

  1. Резерв кредитов до любой платной операции (reserveCreditsForPublicHandler).
  2. Вызов LLM / эмбеддинга.
  3. На успехе — commitFlatFeeUsage; на ошибке/отмене — releaseAiReservation.

Тарифы — packages/api/modules/entitlements/credit-rates.ts (CREDIT_RATES.ai_answer, CREDIT_RATES.ai_image_search, …). При нехватке кредитов — 402 Payment Required, операция не выполняется.

Privacy и поток данных

  • AI-ответы и Knowledge RAG отправляют сниппеты найденных чанков (не полные документы) в выбранного провайдера LLM.
  • Провайдер по умолчанию — OpenAI; выбор модели per-организация (Beta) — KnowledgeSpace.ragConfig.
  • Image-to-vector сначала прогоняет картинку через vision-вызов gpt-4o-mini, потом эмбеддит описание; сама картинка не сохраняется дольше длительности запроса.
  • Tenant isolation (Инвариант 5) держится во всех AI-вызовах: каждое извлечение скоупится одним organizationId (и внутри Knowledge — одним knowledgeSpaceId).

Подробности по SOC 2 / DPA — Security & Compliance.

Связанные страницы

  • AI answers — эндпоинт, цитаты, форма промпта, ограничения
  • Semantic search — эмбеддинги, гибридный режим, выбор модели
  • Suggestions — автокомплит и «возможно вы имели в виду»
  • Knowledge RAG — Q&A по загруженным документам
  • GraphRAG — многодокументный reasoning по графу сущностей
  • Plans and limits — права и квоты

On this page