AI大模型是人工智能開發、應用的基礎設施,體現著一個國家的AI技術發展水平。12月8日,鵬城實驗室與百度舉辦新聞發布會,聯合發布全球首個知識增強千億大模型——「鵬城-百度·文心」(模型版本號:ERNIE 3.0 Titan),該模型參數規模達2600億,是目前全球最大的中文單體模型。「鵬城-百度·文心」在機器閱讀理解、文本分類、語義相似度計算等60多項任務中取得最好效果,並在30餘項小樣本和零樣本任務上刷新基準。
中國工程院院士、鵬城實驗室主任高文在發布會上表示,大模型對於整個科學的發展、社會的發展、創新的發展都是非常重要的工具。運用這個工具,可以讓更多行業受益於人工智能的賦能,這對人工智能的發展是一個福音。
為解決「鵬城-百度·文心」大模型應用落地難題,百度團隊首創大模型在線蒸餾技術,模型參數壓縮率可達99.98%。壓縮版模型僅保留0.02%參數規模就能與原有模型效果相當,更有利於產業大規模應用。本着開源開放的理念,該模型代碼近期會在OpenI啟智社區開源,依託「鵬城雲腦Ⅱ」對外開放,助力科技創新,推動產業發展。
「鵬城-百度·文心」大模型的成功研發,源於鵬城實驗室與百度共同成立的「鵬城-百度自然語言處理聯合實驗室」。「鵬城-百度·文心」大模型基於鵬城實驗室的算力系統「鵬城雲腦Ⅱ」和百度飛槳深度學習平台的支持,解決了超大模型訓練的多個公認技術難題,實現了訓練速度大幅提升、效果更優。「鵬城雲腦Ⅱ」是自主研發的國內首個E級AI算力平台,曾在多個國際性能測試比賽中奪冠;飛槳是我國首個自主研發的深度學習開源開放平台,創建了端到端自適應分布式訓練框架,實現多硬件支持,並行效率高達90%。
百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰發布百度產業級知識增強大模型「文心」全景圖。
當日發布會上,百度產業級知識增強大模型「文心」全景圖也首次亮相。王海峰介紹,最新的產業級知識增強大模型「文心」全景圖,既包含基礎通用的大模型,也包含面向重點領域、重點任務的大模型,以及豐富的工具與平台,有助於推動技術創新和產業發展。
目前,百度「文心」通過百度飛槳平台陸續對外開源開放,並大規模應用於百度搜索、信息流、智能音箱等產品,並通過百度智能雲賦能工業、能源、金融、通信、媒體、教育等眾多行業。在金融領域,通過百度「文心」大模型賦能,同時結合百度全流程AI開發平台BML提供模型再訓練的能力,基於定製的保險合同條款「智能解析模型」,不僅能夠完成一份合同內近40個類目條款的智能分類,根據計算,業務員處理單份合同文本的時長縮短到1分鐘,速度提升了幾十倍。百度智能雲的「智能客服」也基於百度「文心」提升了服務的精準性,目前已在中國聯通、浦發銀行等國內眾多企業中得到應用。(記者 林彬彬)
頂圖:中國工程院院士、鵬城實驗室主任高文(左),百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰聯合發布「鵬城-百度·文心」。