澎湃新聞見習記者 王盈穎
在2008年北京奧運會開幕式上,10萬觀眾“刷臉”入場,在100個關口接受了人臉識別系統的驗證。這是奧運史上第一次使用人臉識別技術,成為中國將該技術應用于安防的標志性事件。但當時,人臉識別仍然基于模式識別,準確率的天花板是88%,識別所需時間也較長。
深度學習是源于對生物人腦機理的仿生學研究,其動機在于建立、模擬人腦進行分析學習的神經網絡。它的出現打破了這層天花板,將人臉識別技術的準確率提升了10個百分點。
近日,中星微“數字多媒體芯片技術”國家重點實驗室宣布,已研發成功了中國首款嵌入式神經網絡處理器(NPU)芯片,成為全球首顆具備深度學習人工智能的嵌入式視頻采集壓縮編碼系統級芯片,并取名“星光智能一號”。這款基于深度學習的芯片運用在人臉識別上,最高能達到98%的準確率,超過人眼的識別率。該芯片于今年3月6日實現量產,目前出貨量為十幾萬件。
星光智能一號。
該實驗室執行主任、中星微首席技術官張韻東在接受澎湃新聞(www.thepaper.cn)采訪時表示,裝備了神經網絡處理器的芯片應用在監控攝像頭上,攝影頭由“眼睛”升級為“帶有大腦的眼睛”,這是全球首次。
“數字多媒體芯片技術”國家重點實驗室成立于2010年,依托于北京中星微電子有限公司,由科技部批準建立。據資料顯示,中星微電子有限公司于1999年由原國家信息產業部直接投資創立,是專攻芯片技術的公司中的“國家隊”,其研發的“星光系列芯片”曾打破國際市場上無“中國芯”的局面。
人工智能的落地
“星光智能一號”是一款嵌入式NPU。神經網絡處理器NPU(Neural Processing Unit)還未被熟知,卻是芯片領域熱門的技術。它與馮諾依曼架構中的CPU處理器相對,采用的是“數據驅動并行計算”這種顛覆性的新型架構。如果將馮諾依曼架構處理數據的方式類比成單車道,那么“數據驅動并行計算”是128條多車道并行,可以同時處理128個數據,利于處理視頻、圖像類的海量多媒體數據。
中星微NPU架構圖。
在業內,單位功耗的計算性能,也就是性能功耗比,被用來衡量處理器架構的優劣。據該實驗室執行主任、中星微首席技術官張韻東對澎湃新聞(www.thepaper.cn)介紹,“星光智能一號”的性能功耗比在傳統的馮諾依曼架構上“至少提高了兩三個數量級”,也就是幾百倍。
高功耗是很多頂尖人工智能技術被詬病的。IBM20世紀的“深藍”和谷歌2016的AlphaGo因其需要由巨大的數據計算支撐,前者使用超級計算機,后者使用服務器集群,無法脫離恒定溫度和濕度的機房。AlphaGo下一盤棋光電費就需要3000美元。張韻東將它們稱之為“一場科學實驗”,離技術落地、投入應用還有較遠的距離。
這凸顯了嵌入式NPU的小型化、低功耗和低成本優勢,加快人工智能技術落地應用。例如無人機對攝像頭的重量和功耗有很高的要求,否則會影響起飛和續航能力。而“星光智能一號”只有普通郵票大小,重量僅幾十克,它的誕生讓諸多監控攝像頭等小型設備有了人工智能化的可能,邁出了人工智能從神秘的機房,跨向生活應用的一步。
“星光智能一號”芯片和主板。
大腦與眼睛兼得
“我們這個芯片,是全球第一個集成了大腦和眼睛的芯片。”
張韻東分別將芯片中的神經網絡處理器和視頻采集、壓縮編碼系統,類比成大腦和眼睛。裝備了神經網絡處理器的芯片應用在監控攝像頭上,攝影頭由“眼睛”升級為“帶有大腦的眼睛”。
除了神經網絡處理器,國家重點實驗學術委員會主任楊曉東介紹,“星光智能一號”集成了國家標準(SVAC)的音視頻編解碼器。這個國家標準在2010年,由中星微和公安部合作制定,是全球第一個專門針對安防監控的視頻編寫標準。張韻東解釋說,由于視頻文件太大,只有通過編碼才能在網絡上傳輸,而原先的標準借用國外,是針對廣播電視節目,在安全性方面不佳。SVAC則解決了該問題。經過6年的時間,該標準已經在國內大規模使用,有望走向國際。
SVAC標準和人工智能分析技術的聯姻在安防、偵查上有不錯的成效。2013年11月,山西省省委附近發生連環爆炸,根據省委附近的攝像頭,公安鎖定了犯罪嫌疑人的車輛,通過人工智能比對、分析,在48小時內破案。
除了安防,今后,大腦與眼睛兼得的“星光智能一號”將應用于汽車無人駕駛或智能輔助,無人機自動拍攝、跟蹤、避障,智能機器人理解合成語言、娛樂和陪護等方面。“深度學習的芯片有一個學習的過程,就像一個正在成長的小孩,它的訓練、學習有一個過程,使用了很多樣本作為它學習的數據。”張韻東說,隨著樣本不斷的積累,芯片的“智商”會越來越高。
下一代NPU會帶來什么驚喜?芯片也許會更逼近人腦的運算機理,在低功耗和強計算能力上取得變革性的跨越,從而使得在可穿戴硬件上實現人工智能。