OpenAI 직원들이 Grok3가 벤치마크 결과를 오도했다고 공개적으로 비난했습니다.

PANews는 2월 23일 진시에 따르면 최근 OpenAI의 한 직원이 일론 머스크의 xAI 회사를 공개적으로 비난하며, 최신 AI 모델인 Grok3의 벤치마크 결과가 오해의 소지가 있다고 말했다고 보도했습니다. 이에 대해 xAI의 공동 창립자인 이고르 바부슈킨은 회사가 아무런 잘못을 하지 않았다고 주장했습니다. xAI 차트는 Grok3의 두 가지 버전(Grok3 Reasoning Beta 및 Grok3 mini Reasoning)이 AIME 2025에서 OpenAI의 현재 가장 강력한 모델인 o3-mini-high보다 성능이 우수했음을 보여줍니다. 그러나 OpenAI 직원들은 X 플랫폼에서 xAI 차트에 "cons@64"의 o3-mini-high에 대한 AIME 2025 점수가 포함되지 않았다고 빠르게 지적했습니다. 바부슈킨은 Platform X에서 OpenAI가 과거에도 비슷하게 오해의 소지가 있는 벤치마크 차트를 게시했다고 주장했습니다. 이러한 차트는 자체 모델의 성능을 비교하는 데 사용됩니다.

공유하기:

작성자: PA一线

이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요