
OpenAI AI 추론 연구를 이끄는 Noam Brown은 연구자들이 '올바른' 접근 방식과 알고리즘을 '알고 있었다면' 몇십 년 전에도 특정 형태의 '추론' AI 모델이 나올 수 있었을 것이라고 말했습니다.
'이 연구 방향이 왜 소홀히 받아들여졌는지 다양한 이유가 있었습니다,'라고 Brown은 수요일 산호세의 Nvidia GTC 컨퍼런스에서 열린 패널에서 말했습니다. '연구를 진행하면서 발견했는데, 사람들은 어려운 상황에서 행동하기 전에 많은 시간을 생각에 쓴다는 것을 알게 되었습니다. 아마 이것은 AI에서 매우 유용할 것입니다.'
Brown은 Carnegie Melon 대학에서 게임 플레이 AI에 대한 연구 중 Pluribus를 포함하여 꼬마포커를 이긴 프로 플레이어를 누르는데 성공한 경력을 언급했습니다. Brown이 함께 창조한 AI는 더 거친 접근 방식보다 '이유를 근거로' 문제를 해결하려고 시도했다는 점에서 그 시기에 독특했습니다.
Brown은 OpenAI AI 모델인 o1의 아키텍트 중 한 명으로, '테스트 타임 추론'이라는 기술을 활용하여 질문에 답하기 전에 '생각'하는 방식을 사용했습니다. 테스트 타임 추론은 모델을 실행할 때 추가적인 컴퓨팅을 적용하여 '추론'의 형태를 유도합니다. 일반적으로, 이른바 추론 모델은 수학과 과학과 같은 영역에서 전통적인 모델에 비해 정확하고 신뢰성 있습니다.
브라운은 패널 중에 학계가 컴퓨팅 자원에 접근할 수 없는 학회의 전반적인 부족 때문에 OpenAI와 같은 AI 연구소와 같은 모델 규모의 실험을 수행할 수 있을지 물었습니다. 최근 몇 년 동안 모델이 더 많은 컴퓨팅 자원을 필요로 하면서 점점 어려워지고 있다고 인정했지만, 학자들이 모델 설계와 같은 덜 컴퓨팅을 필요로 하는 영역을 탐구함으로써 영향을 미칠 수 있다고 말했습니다.
'[T] 경계선 연구소와 학계 사이의 협력 기회가 있습니다'라고 브라운은 말했습니다. '분명히, 경계선 연구소는 학회 출판물을 주의 깊게 검토하고, 이 논문이 더 확대될 시 매우 효과적일 것이라는 설득력 있는 주장이 있는지를 신중하게 고려합니다. 만약 그 논문에서 그런 설득력 있는 주장이 있다면, 우리는 이러한 실험실에서 이를 조사할 것입니다.'
브라운의 발언은 트럼프 행정부가 과학 연구 감축을 진행하고 있는 시기에 나왔습니다. 노벨상 수상자 Geoffrey Hinton을 포함한 AI 전문가들은 이러한 감축에 대해 비판해 왔으며, 국내외의 AI 연구 노력을 위협할 수 있다고 말했습니다.
브라운은 학계가 중요한 영향을 끼칠 수 있는 AI 벤치마킹이라는 영역을 지적했습니다. 'AI의 벤치마크 상태는 정말 안 좋습니다. 그것은 많은 컴퓨팅 자원이 필요하지 않습니다,'라고 그는 말했습니다.
우리가 이전에 썼던 것처럼, 현재 인기 있는 AI 벤치마크들은 주로 난해한 지식을 테스트하고 대중들이 중요시하는 일에 대한 능력과 점수가 잘 상관되지 않습니다. 이것은 모델의 성능과 개선에 대해 널리 혼란을 일으켰습니다.
본문 4:06 p.m. 태평양: 이 글의 이전 버전은 브라운이 첫 발언에서 o1과 같은 추론 모델에 대해 언급한 것으로 오해를 줬습니다. 실제로 그는 OpenAI에서 일하기 전에 게임 플레이 AI에 대한 연구를 참고하고 있었다. 실수를 사과드립니다.