9月21日,由科學(xué)技術(shù)部、中國工程院、清華大學(xué)共同發(fā)起主辦的長城工程科技會議“人工智能賦能高質(zhì)量發(fā)展”主題大會在清華大學(xué)召開??萍疾奎h組書記、部長王志剛、清華大學(xué)黨委書記邱勇致辭,中國工程院潘云鶴院士、中國科學(xué)院張鈸院士等多位學(xué)術(shù)界、產(chǎn)業(yè)界專家圍繞人工智能技術(shù)前沿與產(chǎn)業(yè)發(fā)展分享了真知灼見。百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰以《人工智能技術(shù)生態(tài)與產(chǎn)業(yè)模式》為題作主旨報告。會上,王海峰表示,人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的核心基礎(chǔ)能力,這四項能力越強,越接近通用人工智能,而大語言模型具備了這四項能力,為發(fā)展通用人工智能帶來曙光。
早在2019年,王海峰就曾提出,深度學(xué)習(xí)具有很強的通用性,并具備標(biāo)準(zhǔn)化、自動化和模塊化的工業(yè)大生產(chǎn)特征,推動人工智能進入工業(yè)大生產(chǎn)階段。四年來,深度學(xué)習(xí)技術(shù)和應(yīng)用的發(fā)展充分驗證了這一觀點。深度學(xué)習(xí)技術(shù)的通用性越來越強,深度學(xué)習(xí) 平臺的標(biāo)準(zhǔn)化、自動化和模塊化特征越來越顯著,而預(yù)訓(xùn)練大模型的興起,使得人工智能應(yīng)用的深度和廣度進一步拓展,技術(shù)生態(tài)更加完善。人工智能已進入工業(yè)大生產(chǎn)階段。
標(biāo)準(zhǔn)化方面,框架和模型聯(lián)合優(yōu)化,多硬件統(tǒng)一適配,應(yīng)用模式簡潔高效,大幅降低人工智能應(yīng)用門檻;自動化方面,從訓(xùn)練、適配,到推理部署,提升人工智能研發(fā)全流程效率;模塊化方面,豐富的產(chǎn)業(yè)級模型庫,支撐人工智能在廣泛場景的便捷應(yīng)用。
據(jù)了解,得益于飛槳產(chǎn)業(yè)級深度學(xué)習(xí)開源開放平臺和文心大模型的互相促進,貫通了深度學(xué)習(xí)全產(chǎn)業(yè)鏈,飛槳生態(tài)愈加繁榮,已凝聚800萬開發(fā)者,服務(wù)22萬家企事業(yè)單位,基于飛槳創(chuàng)建了80萬個模型。伴隨大模型的發(fā)展,百度推出了星河大模型社區(qū),寓意“文心加飛槳,翩然赴星河”,與開發(fā)者共享共創(chuàng)大模型生態(tài)。
王海峰表示,人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的核心基礎(chǔ)能力,這四項能力越強,越接近通用人工智能,而大語言模型具備了這四項能力,為發(fā)展通用人工智能帶來曙光。
具體而言,人工智能的典型能力如創(chuàng)作、編程、解題、規(guī)劃等都依賴于理解、生成、邏輯、記憶等核心基礎(chǔ)能力,依賴程度有所不同。以解題為例,從讀懂題目、解答題目到最后寫出答案,需要理解、記憶、邏輯及生成能力的綜合運用。
知識增強大語言模型文心一言充分驗證了這一點。在訓(xùn)練數(shù)據(jù)規(guī)模和參數(shù)規(guī)模相同的情況下,純中文模型比多語言模型生成能力強,理解和邏輯能力弱。文心一言首先從數(shù)萬億數(shù)據(jù)和數(shù)千億知識中融合學(xué)習(xí)得到預(yù)訓(xùn)練大模型,在此基礎(chǔ)上采用有監(jiān)督精調(diào)、人類反饋的強化學(xué)習(xí)和提示等技術(shù),并具備知識增強、檢索增強和對話增強等技術(shù)優(yōu)勢。在檢索增強和知識增強的基礎(chǔ)上,通過知識點增強,提升對世界知識的掌握和運用;通過邏輯數(shù)據(jù)構(gòu)建、邏輯知識建模、多粒度語義知識組合以及符號神經(jīng)網(wǎng)絡(luò),提升邏輯推理能力。進一步地,通過多種策略優(yōu)化數(shù)據(jù)源及數(shù)據(jù)分布、基礎(chǔ)模型長文建模、多類型多階段有監(jiān)督精調(diào)、多任務(wù)自適應(yīng)有監(jiān)督精調(diào)、多層次多粒度獎勵模型等技術(shù)創(chuàng)新,全面提升基礎(chǔ)通用能力。
效率方面,通過飛槳端到端自適應(yīng)混合并行訓(xùn)練技術(shù)以及壓縮、推理、服務(wù)部署的協(xié)同優(yōu)化,文心大模型訓(xùn)練速度達到原來的3倍,推理速度達到原來的30多倍。根據(jù)人民數(shù)據(jù)、新華網(wǎng)等多個公開測評,文心大模型3.5支持下的文心一言綜合能力超過ChatGPT,遙遙領(lǐng)先于國內(nèi)其他大模型。IDC《AI大模型技術(shù)能力評估報告,2023》顯示,文心大模型3.5拿下12項指標(biāo)的7個滿分,得到“綜合評分第一,算法模型第一,行業(yè)覆蓋第一”三個絕對第一。
應(yīng)用方面,通過數(shù)據(jù)驅(qū)動、提示構(gòu)建,以及插件增強進行場景適配,協(xié)同優(yōu)化。文心一言已上線百度搜索、覽卷文檔、E言易圖、說圖解畫、一鏡流影等原生插件,使模型具備生成實時準(zhǔn)確信息、長文本摘要和問答、數(shù)據(jù)洞察和圖表制作、基于圖片的創(chuàng)作和問答、文生視頻等能力。插件機制擴展了大模型能力邊界,更適應(yīng)場景需要。
數(shù)據(jù)顯示,文心一言在8月31日率先面向全社會開放服務(wù),首日回答了網(wǎng)友3342萬個問題,細分應(yīng)用場景豐富,包括文案創(chuàng)意、教育咨詢、代碼生成等,目前已有15萬企業(yè)和2萬多插件開發(fā)者申請接入。
面對大模型產(chǎn)業(yè)化的挑戰(zhàn),王海峰表示,類似芯片代工廠,可以采用“集約化生產(chǎn),平臺化應(yīng)用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù)。這一產(chǎn)業(yè)化路徑已在文心大模型產(chǎn)業(yè)實踐中得到驗證,百度與各行業(yè)頭部企業(yè)、機構(gòu)共建了包括能源、金融、航天、制造、傳媒、城市、社科以及影視等行業(yè)大模型。以文心一言等大語言模型為代表的人工智能正在深入千行百業(yè),加速產(chǎn)業(yè)升級和經(jīng)濟增長。
北疆新聞:內(nèi)蒙古自治區(qū)重點新聞網(wǎng)站(客戶端),內(nèi)蒙古出版集團新華報業(yè)中心旗下國家互聯(lián)網(wǎng)新聞信息采編發(fā)布服務(wù)一類資質(zhì)網(wǎng)站(客戶端)。
北疆新聞版權(quán)與免責(zé)聲明:
一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權(quán)均屬北疆新聞所有,轉(zhuǎn)載時必須注明“來源:北疆新聞”,并附上原文鏈接。
二、凡來源非北疆新聞的新聞(作品)只代表本網(wǎng)傳播該消息,并不代表贊同其觀點。
如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請在見網(wǎng)后30日內(nèi)進行,聯(lián)系郵箱:bjwmaster@163.com。
版權(quán)聲明:北疆新聞版權(quán)所有,未經(jīng)書面授權(quán),不得轉(zhuǎn)載或建立鏡像,違者依法必究。 本站違法和不良信息舉報電話:15648148811蒙ICP備16001043號-1
Copyright © 2016- 北疆新聞網(wǎng) All Rights Reserved互聯(lián)網(wǎng)新聞信息服務(wù)許可證:15120200009-1蒙公網(wǎng)安備:15010502001245