미국 AI 연구기관 FutureHouse가 차세대 AI 과학자 시스템 ‘Kosmos’를 공개했다. 5일(현지시간) FutureHouse에 따르면 Kosmos는 기존 AI 과학자 ‘Robin’을 대폭 업그레이드한 모델로, 1,500편의 논문을 읽고 4만2,000줄의 분석 코드를 실행하며 복잡한 과학적 발견을 자율적으로 수행한다. 베타 테스터들은 “Kosmos가 하루 만에 수행하는 작업이 자신들에게는 6개월이 걸릴 것”이라고 평가했으며, 실제로 Kosmos의 결론 중 79.4%가 정확한 것으로 확인됐다. FutureHouse는 이날 플랫폼 운영을 상업적 스핀아웃 기업 Edison Scientific으로 이관하며, 관대한 무료 티어를 유지하되 고급 기능은 유료로 제공한다고 밝혔다.
Kosmos의 핵심 혁신은 ‘구조화된 세계 모델(structured world models)’ 활용이다. 기존 AI 과학자들은 언어모델의 제한된 컨텍스트 길이 때문에 일정 단계 이상의 논리적 추론을 수행하지 못했다. 반면 Kosmos는 수백 개의 에이전트 궤적에서 추출한 정보를 효율적으로 통합하고, 수천만 토큰에 걸쳐 특정 연구 목표를 향한 일관성을 유지한다. 개별 Kosmos 실행에는 1,500편의 논문 읽기와 4만2,000줄의 분석 코드 실행이 포함되며, 이는 다른 어떤 에이전트보다 방대한 규모다. 또한 모든 결론을 특정 코드 라인이나 과학 문헌의 특정 구절까지 추적할 수 있어 완전한 감사 가능성을 보장한다.
FutureHouse는 Kosmos가 수행한 7가지 발견 사례를 공개했다. 3건은 인간 과학자의 기존 발견을 독립적으로 재현했고, 4건은 과학 문헌에 새로운 기여를 했다. 재현 사례로는 저체온 쥐 뇌에서 뉴클레오타이드 대사를 주요 변화 경로로 식별한 것, 페로브스카이트 태양전지 효율에서 절대 습도가 지배적 요인임을 발견한 것 등이 있다. 신규 발견으로는 순환 SOD2 수치 증가가 심근 섬유화를 인과적으로 감소시킬 수 있다는 통계적 증거 제시, 제2형 당뇨병 위험을 줄이는 SNP의 새로운 분자 메커니즘 제안 등이 포함됐다. 특히 7번째 발견은 임상적으로 중요한 성과로, 알츠하이머병에서 가장 먼저 타우 축적이 발생하는 내후각피질 뉴런이 노화에 따라 플리파제 유전자 발현이 감소한다는 점을 밝혔다.
“6개월 상당의 작업”이라는 추정에 대해 FutureHouse는 상세한 검증 과정을 제시했다. 베타 사용자 7명을 대상으로 설문한 결과, 20단계 Kosmos 실행이 평균 6.14개월의 작업에 해당한다는 응답을 얻었다. 이는 주관적 추정이지만, 두 가지 객관적 근거가 이를 뒷받침한다. 첫째, Kosmos가 재현한 3건의 발견은 원래 인간 과학자가 약 4개월간 작업해 도출한 결과였다. 둘째, 논문 1편 읽기에 15분, 데이터 분석 궤적 1개 수행에 2시간이 걸린다고 가정하면 평균 Kosmos 실행은 약 4.1개월의 시간에 해당한다. 다만 FutureHouse는 Kosmos가 때로 통계적으로 유의하지만 과학적으로 무의미한 발견을 추적하거나 토끼굴에 빠지는 경우가 있어, 동일 목표에 여러 차례 실행하는 것을 권장한다고 밝혔다.
Kosmos의 등장은 AI가 과학 연구를 가속화하는 시대가 본격적으로 도래했음을 보여준다. 실행당 200달러(학계 무료 티어 제공)로 책정된 가격은 향후 인상될 예정이며, 창립 구독자는 현재 가격을 영구 고정할 수 있다. FutureHouse는 “Kosmos를 챗봇이 아닌 시약 키트처럼 고가치 타겟에 필요시 실행하는 도구로 생각해야 한다”고 강조했다. 현재 웹랩에서 발견 사항을 검증 중이며, 사용자가 제공하는 데이터로 Kosmos가 만들어낼 발견을 기대한다고 덧붙였다. AI 과학자가 인간 연구자를 대체하는 것이 아니라 강력하게 증강하는 도구로 자리잡을 가능성을 제시한 사례다.
태그: #FutureHouse #Kosmos #AI과학자


