科技媒體 testingcatalog 昨日(5 月 13 日)發(fā)布博文,報道稱 Anthropic 即將發(fā)布 Claude Neptune 新 AI 模型,目前正接受內(nèi)部安全測試,推出后預(yù)估與 OpenAI 的 GPT-5,以及谷歌的 Gemini Ultra 競爭。
IT之家援引博文介紹,該模型已進入內(nèi)部安全測試階段,使用 Anthropic Workbench 平臺進行評估,紅隊演習(xí)(主要測試模型對越獄攻擊的抵抗力)將于 5 月 18 日結(jié)束。
本次演習(xí)重點測試 constitutional classifiers 系統(tǒng)(安全協(xié)議的核心),特別關(guān)注越獄嘗試的防范,初期測試結(jié)果表明對安全問題,比以往模型更敏感(更強大)。
該媒體推測 Anthropic 可能會在 5 月底或者 6 月初發(fā)布 Claude Neptune 模型,將讓它直接對抗 OpenAI 的 GPT-5 和 Google 的 Gemini Ultra,預(yù)計將加強多模態(tài)和智能體功能。