PANews 6月28日消息,根據財聯社報道,OpenAI新推出了一個基於GPT-4的模型——CriticGPT,用於捕獲ChatGPT代碼輸出中的錯誤。
CriticGPT的作用相當於讓人們用GPT-4來找出GPT-4的錯誤。該模型可以對ChatGPT反應結果做出批評評論,從而幫助人工智慧訓練師在「基於人類回饋的強化學習(RLHF)」過程中發現的錯誤,為人工智慧訓練師提供明確的人工智慧協助。這項新模型的發布意在向投資者傳達,OpenAI在RLHF賽道上的領先地位。 RLHF的關鍵部分是收集比較,讓人工智慧訓練師對不同的ChatGPT回答進行評分,並回饋給ChatGPT。
研究發現,當訓練家使用CriticGPT來審查ChatGPT輸出代碼時,他們的表現比沒有得到幫助的人高出60%。並且,在CriticGPT的幫助下,他們的指正比自己單獨做的更全面。