통합 의사결정 트리

호스트 인프라 안에서만 처리해야 하는가?
├─ 예
│   ├─ 호스트 LLM/에이전트와 결합 → (A) MCP 서브에이전트 (온프레)
│   └─ 호스트 인프라 내 임베드  → (C) Python SDK
└─ 아니오
    ├─ 즉시 PoC                  → (D) SaaS 사이드카
    ├─ 호스트 앱과 깊은 통합    → (A) MCP 서브에이전트
    └─ 다양한 백엔드와 통합     → (B) REST API

선택 후 권장 운영 가이드

(A) 선택 시 — 호스트 LLM의 도구 카탈로그에 retriever와 보조 도구를 등록하고, mode=smart를 기본으로 하되 정밀도가 필요한 화면에서만 mode=deep으로 전환한다 (사용자 ⚡ Smart / 🧠 Deep 토글과 직접 매핑).
(B) 선택 시 — REST 단일 진입점으로 통합 권장.
(C) 선택 시 — 사내 PyPI 또는 Docker 배포로 통일하고, 사내 LLM 서빙 노드의 GPU 풀 크기는 7.표에 따라 산정.
(D) 선택 시 — 단기 PoC 후 보안 검토를 통해 (A) 또는 (B)로 전환 가능하며, 인입 데이터·그래프는 보존된다.

4개 통합 모드 모드 개요