Обзор AI Search

Где AI Search встраивается в AACSearch OS — семантический поиск, AI-ответы, подсказки — и чем это отличается от полнотекстового поиска и Knowledge RAG / GraphRAG.

AACSearch OS добавляет три «интеллектуальных» слоя поверх одного и того же индексированного каталога:

Поверхность	Что делает	Где живёт
Keyword search	Типонезависимый полнотекстовый поиск по объявленным полям. Быстро, детерминированно, без LLM.	`POST /api/search` и `POST /api/search/multi`
Semantic search	Векторный поиск через эмбеддинги. Помогает, когда формулировка ≠ ключевые слова в каталоге.	`POST /api/search` с `queryByEmbedding` (Beta) / Semantic search
AI answers	Краткий ответ на естественном языке над списком результатов, со ссылками на цитируемые документы.	`POST /api/search/ai/answer` / AI answers
Suggestions	Автокомплит / «возможно вы имели в виду» / популярные запросы во время набора.	Suggestions

Глубинный слой — Q&A по вашим собственным документам — это Knowledge RAG и GraphRAG:

Поверхность	Что делает	Документация
Knowledge RAG	Retrieval-augmented Q&A по загруженным файлам / URL в Knowledge-пространстве.	Knowledge RAG
GraphRAG	Графовый retrieval, который проходит по сущностям/связям для многодокументного reasoning-а.	GraphRAG

Статус фич

Возможность	Статус
Полнотекстовый поиск (типонезависимый, фасеты, сортировка)	✅ Available
AI-ответ над результатами поиска (`/api/search/ai/answer`)	✅ Available
Image-to-vector поиск (`/api/search/ai/image`)	✅ Available
Knowledge RAG (загрузка файлов/URL, `ask`)	✅ Available
Knowledge RAG streaming (`askStream`)	✅ Available
GraphRAG: граф сущностей и связей	✅ Available
GraphRAG: детекция сообществ (Louvain)	✅ Available
GraphRAG: drill-down explain (`graphragExplain`)	✅ Available
Semantic search с выбором модели эмбеддингов	🟡 Beta — выбор модели per Knowledge space
Auto-embedding при ingest	🟡 Beta
Knowledge sources через коннекторы (Confluence, Notion, GDrive)	⏳ Roadmap
Tenant-fine-tuned модель	⏳ Roadmap (Enterprise)

Feature-флаги и привязка к тарифам — Plans and limits. Те же статусы дублируются на маркетинговых страницах фич; если есть расхождение — источник правды эта страница.

Когда какой слой использовать

Это не «что умнее» — это компромисс между латентностью, стоимостью и точностью.

Задача	Что брать
«Покажи товары, подходящие под запрос»	Keyword search
«Покажи товары, даже когда пользователь формулирует иначе»	Semantic + keyword (hybrid)
«Над списком — краткая выжимка из 5 товаров, отвечающая на вопрос»	AI answer
«Ответь по моей поддерживающей документации, со ссылками»	Knowledge RAG
«Ответь на вопрос, охватывающий несколько документов и концепций»	GraphRAG
«Подсказывай запросы во время набора»	Suggestions / multi-search

Когда AI-ответы лучше не включать

AI-ответы — это мощно, но не бесплатно, не всегда верно и не всегда нужно. Пропускайте, когда:

Запрос — это навигация («страница входа», «оформление заказа»). Покажите ссылку, а не абзац.
Ответ должен быть авторитетным (юридический, медицинский, ценовой). Полнотекст возвращает источник; пользователь читает сам.
Латентность важнее «гладкости». AI-ответ добавляет 500–2000 мс к поиску.
В каталоге меньше ~5 матчей — модель додумает контекст, которого нет.
Не можете показать или измерить цитирования. Ответ без ссылок — это необсуждаемая ответственность для поддержки.

Если запрос не проходит ни один из этих фильтров — отрисуйте список и фасеты, дайте пользователю выбрать. AI-ответ — дополнительный слой, не замена результатам.

Форма стоимости

Все AI-поверхности учитываются через AI Wallet в BigInt-копейках (Инвариант 8). Публичные AI-эндпоинты используют схему reserve → call → commit/release:

Резерв кредитов до любой платной операции (reserveCreditsForPublicHandler).
Вызов LLM / эмбеддинга.
На успехе — commitFlatFeeUsage; на ошибке/отмене — releaseAiReservation.

Тарифы — packages/api/modules/entitlements/credit-rates.ts (CREDIT_RATES.ai_answer, CREDIT_RATES.ai_image_search, …). При нехватке кредитов — 402 Payment Required, операция не выполняется.

Privacy и поток данных

AI-ответы и Knowledge RAG отправляют сниппеты найденных чанков (не полные документы) в выбранного провайдера LLM.
Провайдер по умолчанию — OpenAI; выбор модели per-организация (Beta) — KnowledgeSpace.ragConfig.
Image-to-vector сначала прогоняет картинку через vision-вызов gpt-4o-mini, потом эмбеддит описание; сама картинка не сохраняется дольше длительности запроса.
Tenant isolation (Инвариант 5) держится во всех AI-вызовах: каждое извлечение скоупится одним organizationId (и внутри Knowledge — одним knowledgeSpaceId).

Подробности по SOC 2 / DPA — Security & Compliance.

Связанные страницы

AI answers — эндпоинт, цитаты, форма промпта, ограничения
Semantic search — эмбеддинги, гибридный режим, выбор модели
Suggestions — автокомплит и «возможно вы имели в виду»
Knowledge RAG — Q&A по загруженным документам
GraphRAG — многодокументный reasoning по графу сущностей
Plans and limits — права и квоты