OpenAI는 ‘심층 연구’를 위한 새로운 ChatGPT 에이전트를 공개합니다

OpenAI는 ChatGPT, 회사의 인공 지능 챗봇 플랫폼을 사용하여 사람들이 심층적이고 복잡한 연구를 수행하는 데 도움이 되는 새로운 AI '에이전트'를 발표하고 있습니다.

적절하게, 이것은 심층 연구라고 합니다.

OpenAI는 일요일에 발표된 블로그 글에서 '이 새로운 기능은 금융, 과학, 정책 및 공학과 같은 분야에서 집중적인 지식 작업을 하는 사람들을 위해 설계되었으며 철저하고 정확하며 신뢰할 수 있는 연구가 필요한 사람들을 위해 설계되었습니다.' 또한 OpenAI는 '자동차, 가전제품 및 가구와 같은 신중한 연구가 필요한 구매를 하는 사람들에게도 유용할 수 있다'고 덧붙였습니다.

ChatGPT 심층 연구는 빠른 답변이나 요약이 아니라 여러 웹사이트 및 기타 소스에서 정보를 신중하게 고려해야 하는 경우에 사용되었습니다.

OpenAI는 오늘부터 ChatGPT Pro 사용자들에게 심층 연구를 제공하고, 매월 100개의 쿼리로 제한된 채로 시작하며, 곧 Plus 및 팀 사용자를 지원할 예정이고 그 다음에는 기업이 될 것입니다. (OpenAI는 Plus 롤아웃을 약 한 달 후로 목표로 하고 있으며, 유료 사용자의 쿼리 제한은 곧 '상당히 높아질' 예정입니다.) 이는 지리적으로 대상화된 론칭이며, OpenAI는 영국, 스위스 및 유럽 경제 지역의 ChatGPT 고객에게는 공개 시간표를 공유할 것이 없었습니다.

이미지 제공: OpenAI /

ChatGPT 심층 연구를 사용하려면 작곡가에서 '심층 연구'를 선택하고 쿼리를 입력한 후 파일이나 스프레드시트를 첨부할 수 있습니다. (현재는 웹만 지원되며, 이번 달 후반에는 모바일 및 데스크톱 앱 통합이 예정되어 있습니다.) 심층 연구는 답변하는 데 5~30분이 소요될 수 있으며 검색이 완료되면 알림을 받게 됩니다.

현재 ChatGPT 심층 연구의 결과물은 텍스트만 지원됩니다. 그러나 OpenAI는 곧 포함된 이미지, 데이터 시각화 및 기타 '분석' 결과물을 추가할 계획이라고 밝혔습니다. 또한 '구독 기반' 및 내부 리소스를 비롯한 '더 특수화된 데이터 소스'와 연결할 수 있는 능력도 계획 중에 있습니다고 OpenAI는 덧붙였습니다.

큰 문제는 ChatGPT 심층 연구가 얼마나 정확한지입니까? 결국 AI는 불완전합니다. 환각 현상이나 '심층 연구' 시나리오에서 특히 유해할 수 있는 다른 유형의 오류에 취약합니다. 그래서 OpenAI는 말합니다. 모든 ChatGPT 심층 연구 출력물은 '명확한 인용과 사고의 요약이 담긴 전문적인 텍스트'로 완전 문서화되기로 했습니다.

이러한 완화 조치가 AI 실수를 대비하고 있을지 여부에 대한 의문이 남아 있습니다. OpenAI의 AI 기반 웹 검색 기능인 ChatGPT Search는 가끔 실수를 저지르며 질문에 잘못된 답변을 주기도 합니다. TechCrunch의 테스트 결과, 특정 질문에 대해서 Google 검색에 비해 ChatGPT Search가 덜 유용한 결과물을 제공했습니다.

심층 연구의 정확도를 향상시키기 위해 OpenAI는 '실제 브라우저 및 Python 도구 사용을 필요로 하는 실제 업무를 통한 강화 학습을 통해 훈련된 최근 발표된 o3 '추론' AI 모델의 특별한 버전을 사용하고 있습니다. 강화 학습은 모델이 특정 목표를 달성하기 위해 시행착오를 통해 '가르치는' 것을 의미합니다. 모델이 목표에 가까워질수록 목표를 달성하는 데 더 잘하는 것이라는 가상 '보상'을 받게됩니다. 최종적으로는 더 나은 수행이 될 것입니다.

OpenAI는 ChatGPT 심층 연구를 '인류의 마지막 시험'이라는 3,000개가 넘는 전문가 수준의 질문으로 구성된 평가를 사용하여 테스트했다고 밝혔습니다. 심층 연구를 구동하는 o3 모델은 26.6%의 정확도를 달성했으며 이것은 불합격 여부로 보일지도 모릅니다. 그러나 '인류의 마지막 시험'은 모델 발전에 앞선 서술과 비교하여 더 어려운 것으로 설계되었습니다. OpenAI에 따르면 심층 연구 o3 모델은 Gemini Thinking(6.2%), Grok-2(3.8%) 및 OpenAI의 GPT-4o(3.3%)보다 훨씬 앞서 나간다고 합니다.

그럼에도 불구하고, OpenAI는 ChatGPT 심층 연구에도 한계가 있으며 가끔씩 실수와 잘못된 추론을 할 수 있습니다. 심층 연구는 권위있는 정보와 루머를 구별하기 어렵고, 종종 뭔가에 대해 확신이 없을 때 거짓 정보를 전달하기도 합니다. 또한 보고서 및 인용에 대한 형식적인 오류를 범하기도 합니다.

학생들에게 미치는 생성적 AI의 영향이 걱정되는 분들을 위해, 온라인에서 정보를 찾으려는 사람들에게 이러한 상세하고 잘 인용된 산출물은 단순한 챗봇 요약보다 더 매력적으로 들릴 것입니다. 그러나 대부분의 사용자들이 실제 분석과 재확인을 하거나 아니면 그저 복사 및 붙여넣기할 텍스트로 처리할지 아니면 '심층 연구'를 진지하게 대할지에 대해서는 앞으로 알겠습니다.

만약 이 모든 것이 익숙하게 들린다면, 구글은 두 달 가까운 기간 동안 동일한 이름을 가진 유사한 AI 기능을 발표했습니다.