在2025世界人工智能大會(WAIC)騰訊論壇上,騰訊研究院聯(lián)合騰訊優(yōu)圖實驗室正式發(fā)布《“共生伙伴”:2025人工智能十大趨勢報告》(以下簡稱“報告”)。
報告系統(tǒng)梳理了AI技術正如何從“從推理到行動”,并聚焦基礎模型演進、智能體崛起、AI走向物理世界三大關鍵領域,展現(xiàn)AI從“智能工具”走向“共生伙伴”的演化路徑,描繪出人與AI協(xié)作共生、共創(chuàng)未來的全新圖景。
騰訊研究院資深研究員徐思彥在現(xiàn)場指出:“2025年是AI從推理智能邁向行動智能的關鍵拐點。AI不再只是一個可調用的工具,而是正在成長為人類的生產(chǎn)力伙伴與決策合伙人。這一變革將深刻重塑社會結構與協(xié)作模式。”
騰訊研究院資深研究員徐思彥
模型躍遷:強化學習推動模型自進化,多模態(tài)原生融合正成主流
報告指出,AI基礎模型正在經(jīng)歷深層次演進,其核心競爭力正從“數(shù)據(jù)+規(guī)模”轉向“自我優(yōu)化+多模態(tài)原生融合”。
強化學習正在成為大模型后訓練的關鍵技術,推動AI從“語言生成器”向“任務執(zhí)行者”演進,實現(xiàn)自主工具使用與復雜任務執(zhí)行。特別是在金融、政務等垂直場景中,強化學習有望突破數(shù)據(jù)稀缺與安全壁壘,加速專業(yè)化模型落地。
原生多模態(tài)能力的提升,也標志著AI感知與交互方式的革命性升級。報告指出,通過構建統(tǒng)一的跨模態(tài)表示空間,并引入端到端學習架構,原生多模態(tài)模型實現(xiàn)了感知、理解與生成的高效協(xié)同。其“所見即所得”的閉環(huán)體驗,將成為推動下一輪AI應用創(chuàng)新的核心動力。
在聲音智能方面,語音合成已突破機械感表達,進入具備情緒理解與擬人化表達的新階段;音樂生成從實驗工具成長為高可控的創(chuàng)作平臺,聲音AI正從輔助工具邁向擁有情感表達能力的“智能共創(chuàng)者”。
Agent生態(tài):AI正成為“共生伙伴”
報告認為,AI Agent正成為AI產(chǎn)業(yè)的重要拐點。從2023年的探索實踐,到如今加速落地,智能體技術已進入大規(guī)模生產(chǎn)應用階段,形成編排類+端到端模型雙軌并進的生態(tài)格局。
在企業(yè)場景中,Agent正深度嵌入政務、金融、工業(yè)、醫(yī)療等流程,承擔起分析、執(zhí)行、優(yōu)化等關鍵職能,從“工具”演進為真正的“數(shù)字員工”,與人類員工互補協(xié)作。
在個人生活中,AI正演化為LifeOS——一個具備長期記憶、具身感知、多角色協(xié)同的“終身智能系統(tǒng)”。報告指出,這種AI不僅能陪伴用戶,更能協(xié)助其完成復雜決策,實現(xiàn)真正意義上的個性化生活協(xié)同。正如騰訊研究院徐思彥所說:“從零散對話,到‘認識你是誰’,未來的AI不只是會回答問題的聊天工具,而是一位了解過去、陪伴當下、引領未來的‘共生伙伴’!
在虛擬世界中,游戲智能體也正由“NPC”進化為具備情感反應和持續(xù)學習能力的“共創(chuàng)者”,將深刻改變虛擬互動體驗,并且可以成為社會模擬的虛擬實驗場。
從比特到原子:AI正走向物理世界的深度融合
報告強調,AI的能力邊界正在從比特世界快速延伸至物理世界,進入“從虛擬到現(xiàn)實”的躍遷期?臻g智能讓AI初步具備了理解和處理三維世界的核心能力,能夠像預測下一個詞元(Token)一樣去預測下一個體素(Voxel),使AI具備感知、理解乃至操控三維空間的能力,賦能自動駕駛、智慧制造、XR等新一代空間智能場景。
尤其值得關注的是,“具身智能”正迎來類GPT-2的關鍵突破。以VLA(視覺-語言-動作)多模態(tài)大模型為代表的創(chuàng)新,使得機器人具備從感知到執(zhí)行的閉環(huán)智能鏈路。AI不再局限于算法演示,而是在真實物理環(huán)境中具備自主學習與適應能力,開始邁入從實驗室走向商業(yè)落地的量產(chǎn)階段。
騰訊研究院資深研究員徐思彥指出,具身智能已被上升至國家戰(zhàn)略高度,伴隨技術突破與應用拓展,機器人正成為下一個“超級終端”,隨著機器人向工業(yè)、物流、服務等多場景滲透,具身智能正逐步承擔起重復性、高風險、低技能崗位的工作。
報告提到,AI正在從“通用工具”向“專屬助手”演進,成為每個人的數(shù)字搭檔、每家企業(yè)的智能勞動力、每個行業(yè)的增長引擎。隨著AI從“可用”邁向“好用”,它不僅提升效率,更將重塑組織結構、優(yōu)化社會協(xié)作、拓展人類認知邊界,成為推動社會變革的核心動力。