Обзор AI Search
Где AI Search встраивается в AACSearch OS — семантический поиск, AI-ответы, подсказки — и чем это отличается от полнотекстового поиска и Knowledge RAG / GraphRAG.
AACSearch OS добавляет три «интеллектуальных» слоя поверх одного и того же индексированного каталога:
| Поверхность | Что делает | Где живёт |
|---|---|---|
| Keyword search | Типонезависимый полнотекстовый поиск по объявленным полям. Быстро, детерминированно, без LLM. | POST /api/search и POST /api/search/multi |
| Semantic search | Векторный поиск через эмбеддинги. Помогает, когда формулировка ≠ ключевые слова в каталоге. | POST /api/search с queryByEmbedding (Beta) / Semantic search |
| AI answers | Краткий ответ на естественном языке над списком результатов, со ссылками на цитируемые документы. | POST /api/search/ai/answer / AI answers |
| Suggestions | Автокомплит / «возможно вы имели в виду» / популярные запросы во время набора. | Suggestions |
Глубинный слой — Q&A по вашим собственным документам — это Knowledge RAG и GraphRAG:
| Поверхность | Что делает | Документация |
|---|---|---|
| Knowledge RAG | Retrieval-augmented Q&A по загруженным файлам / URL в Knowledge-пространстве. | Knowledge RAG |
| GraphRAG | Графовый retrieval, который проходит по сущностям/связям для многодокументного reasoning-а. | GraphRAG |
Статус фич
| Возможность | Статус |
|---|---|
| Полнотекстовый поиск (типонезависимый, фасеты, сортировка) | ✅ Available |
AI-ответ над результатами поиска (/api/search/ai/answer) | ✅ Available |
Image-to-vector поиск (/api/search/ai/image) | ✅ Available |
Knowledge RAG (загрузка файлов/URL, ask) | ✅ Available |
Knowledge RAG streaming (askStream) | ✅ Available |
| GraphRAG: граф сущностей и связей | ✅ Available |
| GraphRAG: детекция сообществ (Louvain) | ✅ Available |
GraphRAG: drill-down explain (graphragExplain) | ✅ Available |
| Semantic search с выбором модели эмбеддингов | 🟡 Beta — выбор модели per Knowledge space |
| Auto-embedding при ingest | 🟡 Beta |
| Knowledge sources через коннекторы (Confluence, Notion, GDrive) | ⏳ Roadmap |
| Tenant-fine-tuned модель | ⏳ Roadmap (Enterprise) |
Feature-флаги и привязка к тарифам — Plans and limits. Те же статусы дублируются на маркетинговых страницах фич; если есть расхождение — источник правды эта страница.
Когда какой слой использовать
Это не «что умнее» — это компромисс между латентностью, стоимостью и точностью.
| Задача | Что брать |
|---|---|
| «Покажи товары, подходящие под запрос» | Keyword search |
| «Покажи товары, даже когда пользователь формулирует иначе» | Semantic + keyword (hybrid) |
| «Над списком — краткая выжимка из 5 товаров, отвечающая на вопрос» | AI answer |
| «Ответь по моей поддерживающей документации, со ссылками» | Knowledge RAG |
| «Ответь на вопрос, охватывающий несколько документов и концепций» | GraphRAG |
| «Подсказывай запросы во время набора» | Suggestions / multi-search |
Когда AI-ответы лучше не включать
AI-ответы — это мощно, но не бесплатно, не всегда верно и не всегда нужно. Пропускайте, когда:
- Запрос — это навигация («страница входа», «оформление заказа»). Покажите ссылку, а не абзац.
- Ответ должен быть авторитетным (юридический, медицинский, ценовой). Полнотекст возвращает источник; пользователь читает сам.
- Латентность важнее «гладкости». AI-ответ добавляет 500–2000 мс к поиску.
- В каталоге меньше ~5 матчей — модель додумает контекст, которого нет.
- Не можете показать или измерить цитирования. Ответ без ссылок — это необсуждаемая ответственность для поддержки.
Если запрос не проходит ни один из этих фильтров — отрисуйте список и фасеты, дайте пользователю выбрать. AI-ответ — дополнительный слой, не замена результатам.
Форма стоимости
Все AI-поверхности учитываются через AI Wallet в BigInt-копейках (Инвариант 8). Публичные AI-эндпоинты используют схему reserve → call → commit/release:
- Резерв кредитов до любой платной операции (
reserveCreditsForPublicHandler). - Вызов LLM / эмбеддинга.
- На успехе —
commitFlatFeeUsage; на ошибке/отмене —releaseAiReservation.
Тарифы — packages/api/modules/entitlements/credit-rates.ts (CREDIT_RATES.ai_answer, CREDIT_RATES.ai_image_search, …). При нехватке кредитов — 402 Payment Required, операция не выполняется.
Privacy и поток данных
- AI-ответы и Knowledge RAG отправляют сниппеты найденных чанков (не полные документы) в выбранного провайдера LLM.
- Провайдер по умолчанию — OpenAI; выбор модели per-организация (Beta) —
KnowledgeSpace.ragConfig. - Image-to-vector сначала прогоняет картинку через vision-вызов
gpt-4o-mini, потом эмбеддит описание; сама картинка не сохраняется дольше длительности запроса. - Tenant isolation (Инвариант 5) держится во всех AI-вызовах: каждое извлечение скоупится одним
organizationId(и внутри Knowledge — однимknowledgeSpaceId).
Подробности по SOC 2 / DPA — Security & Compliance.
Связанные страницы
- AI answers — эндпоинт, цитаты, форма промпта, ограничения
- Semantic search — эмбеддинги, гибридный режим, выбор модели
- Suggestions — автокомплит и «возможно вы имели в виду»
- Knowledge RAG — Q&A по загруженным документам
- GraphRAG — многодокументный reasoning по графу сущностей
- Plans and limits — права и квоты