호스트 인프라 안에서만 처리해야 하는가?
├─ 예
│ ├─ 호스트 LLM/에이전트와 결합 → (A) MCP 서브에이전트 (온프레)
│ └─ 호스트 인프라 내 임베드 → (C) Python SDK
└─ 아니오
├─ 즉시 PoC → (D) SaaS 사이드카
├─ 호스트 앱과 깊은 통합 → (A) MCP 서브에이전트
└─ 다양한 백엔드와 통합 → (B) REST API선택 후 권장 운영 가이드
- (A) 선택 시 — 호스트 LLM의 도구 카탈로그에
retriever와 보조 도구를 등록하고,mode=smart를 기본으로 하되 정밀도가 필요한 화면에서만mode=deep으로 전환한다 (사용자 ⚡ Smart / 🧠 Deep 토글과 직접 매핑). - (B) 선택 시 — REST 단일 진입점으로 통합 권장.
- (C) 선택 시 — 사내 PyPI 또는 Docker 배포로 통일하고, 사내 LLM 서빙 노드의 GPU 풀 크기는 7.표에 따라 산정.
- (D) 선택 시 — 단기 PoC 후 보안 검토를 통해 (A) 또는 (B)로 전환 가능하며, 인입 데이터·그래프는 보존된다.