【香港商報網訊】記者 姚志東 報導:6月23日,鯤雲科技在深圳舉行產品發佈會,發佈全球首款數據流AI芯片CAISA,定位於高性能AI推理,已完成量產。鯤雲科技通過自主研發的數據流技術在芯片實測算力上實現了技術突破,較同類產品在芯片利用率上提升了最高11.6倍。第三方測試數據顯示僅用1/3的峰值算力,CAISA芯片可以實現英偉達T4最高3.91倍的實測性能。鯤雲科技的定製數據流技術不依靠更大的芯片面積和製程工藝,通過數據流動控制計算順序來提升實測性能,為用戶提供了更高的算力性價比。
深圳市副市長聶新平,福田區區長黃偉,深圳市科技創新委員會、深圳市工信局等政府領導,及英特爾PSG中國區總經理等合作夥伴出席發佈會。中國科協黨組成員、書記處書記宋軍,鯤雲科技聯合創始人兼首席科學家、英國皇家工程院院士、英國計算機學會(BCS)會士Wayne Luk陸永青院士等嘉賓為鯤雲成功實現全球首款數據流AI芯片量產送上了祝福。
超高芯片利用率 定製數據流芯片架構完成3.0升級
據介紹,此次發佈的CAISA芯片採用鯤雲自研的定製數據流芯片架構CAISA 3.0,相較於上一代芯片架構,CAISA3.0在架構效率和實測性能方面有了大幅的提升,並在算子支持上更加通用,支持絕大多數神經網絡模型快速實現檢測、分類和語義分割部署。CAISA3.0在多引擎支持上提供了4倍更高的並行度選擇,架構的可拓展性大大提高,在AI芯片內,每一個CAISA都可以同時處理AI工作負載,進一步提升了CAISA架構的性能,在峰值算力提升6倍的同時保持了高達95.4%的芯片利用率,實測性能線性提升。同時新一代CAISA架構對編譯器RainBuilder的支持更加友好,軟硬件協作進一步優化,在系統級別上為用戶提供更好的端到端性能。
CAISA3.0架構繼續保持在數據流技術路線的全球領先地位,指令集架構採用馮諾依曼計算方式,通過指令執行次序控制計算順序,並通過分離數據搬運與數據計算提供計算通用性。CAISA架構依託數據流流動次序控制計算次序,採用計算流和數據流重疊運行方式消除空閑計算單元,並採用動態配置方式保證對於人工智能算法的通用支持,突破指令集技術對於芯片算力的限制。
作為一款面向邊緣和雲端推理的人工智能芯片,CAISA可實現最高95.4%的芯片利用率,為客戶提供更高的算力性價比。CAISA芯片具有良好的通用性,可支持所有常用AI算子,通過數據流網絡中算子的不同配置和組合,CAISA芯片可支持絕大多數的CNN算法。針對CAISA芯片,鯤雲提供RainBuilder 3.0工具鏈,可實現推理模型在芯片上的端到端部署,使軟件工程師可以方便的完成CAISA芯片在AI應用系統中的集成。
發佈會上,鯤雲科技創始人和CEO牛昕宇博士還發佈了基於CAISA芯片的星空系列邊緣和數據中心計算平台,X3加速卡和X9加速卡,並公布了由人工智能產業技術聯盟(AIIA)測試的包括ResNet-50, YOLO v3等在內的主流深度學習網絡的實測性能。
商業落地先行 鯤雲加速卡實現多領域規模落地
作為技術驅動的AI芯片公司,鯤雲科技自成立以來一直注重商業落地,目前鯤雲科技已與多家行業巨頭達成戰略合作,成為英特爾全球旗艦FPGA合作夥伴,在技術培訓、營銷推廣以及應用部署等方面進行合作;與浪潮、戴爾達成戰略簽約,在AI計算加速方面開展深入合作;與山東產業技術研究院共建山東產研鯤雲人工智能研究院,推進人工智能芯片及應用技術的規模化落地。明星產品「星空」加速卡已在電力、教育、航空航天、智能製造、智慧城市等領域落地。
自2016年成立至今,鯤雲科技已經完成了天使輪,Pre-A輪及A輪融資,設有深圳、山東、倫敦研發中心。