2022年9月1日,世界人工智能大會(WAIC)“AI領SHOW”欄目在上海世博會議中心火熱拉開序幕。“AI領SHOW”是本屆WAIC整場會議活動全新升級后的配套欄目,“鎮(zhèn)館之寶”、“SAIL獎Top30代表”、“重磅新品發(fā)布”、“元宇宙”等代表紛紛閃亮登場,全程通過大會官網(wǎng)及CCTV.com直播。
中科院自動化所研究員、武漢人工智能研究院院長王金橋首先在AI領SHOW欄目登臺演講,展示了基于昇騰 AI 基礎軟硬件平臺打造的全球首個三模態(tài)大模型“紫東.太初”!白蠔|.太初”通過跨模態(tài)多任務自監(jiān)督學習,實現(xiàn)了圖像、文字、語音和視頻等不同模態(tài)數(shù)據(jù)之間的統(tǒng)一表示和互相生成的,且形成了完整的智能表示、推理和生成能力。
王院長在AI領SHOW欄目向與會嘉賓講述道:“傳統(tǒng)人工智能學習當中,通過視覺模型可以實現(xiàn)人臉的識別,但是并不知道機器怎么表征每個人的特征差異,只能從圖像中間結果的特征圖解釋機器學習的過程,而通過“紫東.太初”三模態(tài)的模型,可以把圖像、語音等實現(xiàn)跨模態(tài)的統(tǒng)一到人類語言的維度,更接近于人類的理解和思考方式!
細數(shù)“紫東.太初”四大大突破
1.多任務多層次的跨模態(tài)自監(jiān)督學習
提出了多任務多層次的跨模態(tài)自監(jiān)督學習的訓練框架,支持詞條級別、模態(tài)級別和樣本級別的訓練,實現(xiàn)了跨模態(tài)理解與生成的統(tǒng)一建模。
2.首次使“以圖生音”和“以音生圖”成為現(xiàn)實
“紫東.太初”首次貫通了語音、圖像、文字這幾種信息,形成了完整的智能表示、推理和生成能力,是當前數(shù)據(jù)智能領域的最新發(fā)展趨勢,為探索人類智能本質提供了一個極佳的平臺。
3.首個千億參數(shù)多模態(tài)預訓練大模型
“紫東.太初”作為全球范圍內首個千億參數(shù)的三模態(tài)大模型,標志著我國從限定領域的弱人工智能正式邁向通用人工智能路徑的重要探索。
4.“一專一能”突破至“多專多能”
“紫東.太初”多項算法指標性能全球第一。讓AI從“一專一能”邁向“多專多能”的同時,在多項下游任務中超越業(yè)界最好的性能,構建了全自主人工智能技術體系。
除了向線上線下參會嘉賓展示“紫東.太初”的技術優(yōu)勢,王院長還表示已經(jīng)實現(xiàn)基礎模型開源和大模型的服務開放,近期將開放“紫東.太初”服務平臺新的版本,支持低代碼人工智能模型的訓練、微調和部署,通過API調用的模式,自動上傳數(shù)據(jù),自動標注模型,自動形成推理部署的工具,自動體驗效果。