spot_img

구글, “RAG 구축 이제 쉽다”…제미나이 API에 완전 관리형 검색 시스템 공개

구글이 복잡했던 검색 증강 생성(RAG) 구축 과정을 대폭 간소화한 완전 관리형 솔루션을 선보였다. 6일(현지시간) 구글은 제미나이 API에 ‘파일 서치(File Search)’라는 RAG 시스템을 공개하며, 기업이 별도의 인프라 구축 없이도 자체 데이터로 신뢰도 높은 AI 응답을 생성할 수 있도록 지원한다고 밝혔다. RAG는 모델이 학습된 지식에만 의존하지 않고 실시간으로 외부 문서를 검색·인용해 더 정확하고 검증 가능한 답변을 생성하는 방식으로, 최근 기업용 생성 AI의 핵심 기술로 자리 잡았다. 그러나 전통적인 RAG 파이프라인을 구축하려면 파일 저장, 분할, 임베딩 생성, 벡터 검색, 인덱싱, 인용 관리 등 복잡한 공정을 직접 연결하는 엔지니어링 부담이 컸다.

파일 서치는 이러한 복잡한 검색 파이프라인을 모두 추상화한 완전 관리형 시스템이다. 개발자는 generateContent API에서 파일 서치를 호출하기만 하면 제미나이가 자동으로 파일 저장과 분할 전략, 임베딩 생성 및 검색까지 수행한다. 이 기능은 최근 MTEB(Massive Text Embedding Benchmark)에서 최고 성능을 기록한 ‘제미나이 임베딩(Gemini Embedding)’ 모델을 기반으로 한다. 쿼리 입력 시 문서의 의미와 맥락을 벡터 검색으로 파악해, 사용자가 정확한 단어를 입력하지 않아도 관련 정보를 찾아 응답을 생성한다. 또한 AI가 답변을 생성할 때 문서 내 인용을 자동으로 삽입해 어떤 문서의 어떤 부분을 근거로 했는지 명시한다.

지원 파일 형식은 PDF, DOCX, TXT, JSON과 다양한 프로그래밍 언어 파일을 포함한다. 구글은 “파일 서치는 제미나이를 사용자 데이터와 결합해 더 정확하고, 관련성 높고, 검증 가능한 결과를 제공하는 간단하고 통합적이며 확장 가능한 방법”이라고 강조했다. 일부 스토리지와 임베딩 기능은 무료로 제공되며, 인덱싱 시 100만 토큰당 0.15달러의 고정 요금이 부과된다. 구글은 “단순히 일부 구성 요소만 관리하는 것이 아니라, RAG 파이프라인 전체를 자동화한다”며 차별점을 내세웠다.

이번 기능은 오픈AI의 ‘어시스턴트 API’, AWS의 ‘베드록’, 마이크로소프트의 ‘애저 AI 서치’ 등과 경쟁하게 됐다. 기존 솔루션들도 RAG 구축을 지원하지만 파일 서치는 파이프라인 전체를 자동화한다는 점에서 개발자 경험을 한 단계 끌어올렸다는 평가다. 현재 파일 서치는 제미나이 API를 통해 이용할 수 있으며, 앞으로는 기업 규모와 데이터 형식에 맞춘 확장 옵션을 차례로 선보일 예정이다. 이는 RAG 기술의 민주화를 가속화하고, 중소기업도 복잡한 엔지니어링 부담 없이 고품질 AI 검색 시스템을 구축할 수 있게 만드는 계기가 될 전망이다.

구글의 이번 행보는 생성 AI 시장에서 개발자 경험(DX)이 핵심 경쟁력으로 부상하고 있음을 보여준다. AI 모델 성능만큼이나 얼마나 쉽고 빠르게 실제 서비스에 통합할 수 있는지가 중요해졌다. 파일 서치는 복잡한 기술적 장벽을 낮춰 더 많은 기업이 AI를 활용할 수 있도록 하는 전략적 도구로, 구글이 기업용 AI 시장에서 경쟁력을 강화하는 중요한 무기가 될 것으로 보인다. 향후 RAG 시스템의 표준화와 자동화 경쟁이 더욱 치열해질 것으로 전망된다.

태그: #구글 #제미나이 #RAG

수진 이
수진 이
실용적이고 구체적인 사례를 중심으로 기술의 사회적 영향을 분석하는 기술 전문 기자 이수진입니다. 최신 기술 트렌드와 혁신을 다루겠습니다.

LEAVE A REPLY

Please enter your comment!
Please enter your name here

많이 본 뉴스

- Advertisment -
Google search engine