오픈소스

[GitHub Trending] PageIndex: 추론 기반의 차세대 Vectorless RAG 시스템

2026-02-25
## 📌 핵심 요약 PageIndex는 기존 RAG의 한계인 벡터 유사도 검색(Vector Similarity)에서 벗어나, LLM의 추론 능력을 활용한 **계층적 트리 인덱싱** 방식을 제안합니다. 전문가가 문서를 탐색하는 방식을 모방하여 정보 검색의 정확도와 맥락 이해도를 극대화했습니다. ## 🚀 주요 특징 및 장점 - **Vectorless & Chunking-free**: 인위적인 데이터 분할이나 벡터화 없이 문서 본연의 구조를 활용하여 정보 손실을 최소화합니다. - **Agentic Tree Search**: 문서를 의미론적 트리 구조로 변환한 뒤, 에이전트가 최적의 경로를 추론하며 데이터를 추출합니다. - **전문 문서 최적화**: 금융 리포트, 법률 문서 등 고도의 전문성이 필요한 긴 문서 분석에서 벡터 검색보다 월등한 성능을 보입니다. - **검증된 성능**: FinanceBench 테스트에서 **98.7%의 정확도**를 기록하며 SOTA(State-of-the-Art) 성능을 입증했습니다. ## 💡 기술적 인사이트 단순히 유사한 문장을 찾는 시대를 넘어, 데이터의 구조를 이해하고 논리적으로 접근하는 **"Reasoning-based Retrieval"**의 가능성을 보여주는 프로젝트입니다. RAG 시스템의 신뢰성과 투명성을 높이고자 하는 개발자들에게 강력한 솔루션이 될 것입니다.

Stay Inspired

매일 아침 가장 쉬운 AI 소식을 받아보세요!