在6月7日高考第一天里,有一位特殊的“考生”開始了它的高考“首秀”。它就是人工智能機器人“AI-MATHS”。據澎湃新聞報道,在斷網斷題庫的環境下,AI-MATHS用時22分鐘完成了北京卷文科數學高考題,成績為105分(總分150分)。之后,AI-MATHS挑戰全國二卷數學卷,用時10分鐘,成績為100分(總分150分)。
與此同時,在北京,另一個人工智能機器人Aidam與6名往屆高考狀元展開了一場“北京卷文科數學”的人機大戰,最終Aidam的成績僅與高考狀元的平均分相差1分。
AI-Maths在答北京文科數學卷(圖片來自:澎湃新聞)
人工智能機器人高考“首秀”:斷網斷庫
6月7日18時10分許,一場特別的高考模擬在成都高新區天府新谷園區10號樓舉行,考生是人工智能機器人“AI-MATHS”。
AI-MATHS誕生于2014年,是成都準星云學科技有限公司依托清華大學大數據、人工智能、自然語言識別等技術,研發的一款以自動解題技術為核心的人工智能系統。
AI-MATHS是一個黑色的大機箱,被安排在一間完全斷網的房間內,并用警戒線圍起,黑色的服務器機箱中有11臺服務器負責解題。為保證考試公正,考試現場沒有人可以操作這些服務器。房間門外貼有“所有設備斷網段庫”的標識。
所謂斷網斷庫意味著,模仿考生封閉環境的閉卷考試;測試復雜邏輯推理能力與聯想能力;斷絕一切可能的外界支持,包括專家系統庫。這也是人工智能技術的核心——斷網斷庫場景下的綜合邏輯推理能力。
7日,該公司首席執行官、清華大學蘇州研究院大數據中心主任林輝介紹,斷網斷庫小樣本訓練是國家863類人解題項目的要求。由此來驗證系統是否能自主形成學習復雜邏輯推理和數理思維,鍛煉系統超越人類力所能及的思維能力以及類人的舉一反三聯想推理能力,為跨行業應用做物美價廉的技術支撐。
房間門外貼有“所有設備斷網段庫”的標識(圖片來自:澎湃新聞)
媒體記者在觀看高考機器人AI-Maths答北京文科數學卷(圖片來自:澎湃新聞)
高考機器人最大的問題:讀不懂題
“AI-MATHS”分別挑戰了北京卷文科數學以及全國二卷文科數學的考試,分別用時22分鐘和10分鐘,得分為105分和100分。這個成績接近于此前研究人員為它設定的110分的目標。
兩次考試具體得分如下:
北京文科數學卷,選擇題滿分、填空題20分、解答題45分,全卷105分;
全國卷二選擇題55分、填空題20分,解答題25,全卷100分。
在選擇題和填空題上,“AI-MATHS”表現十分亮眼。丟分環節主要是解答題,有些題目甚至是0分。
由于高考數學成績尚未出爐,人們還無法判斷AI-MATHS和人類考生相比到底處在什么水平。不過,閱卷老師現場評估認為,這相當于中等成績水平的高中畢業生。
作為“家長”——成都準星云學科技有限公司CEO、清華大學蘇州研究院大數據中心主任林輝指出了“自家孩子”在答題時的一個弱點,“看不懂題。”研發高考機器人最大的難點在于,要讓系統準確理解人類語言。
林輝說,“直接用數學語言表述的應用題它可以輕松解答,但它最大的弱項是不能理解考題里場景式的描述語言,它會讀不懂題目。”
高考數學機器人為何會讀不懂題目?對于這個問題,林輝打了個比方,如果題目是10-1=?人工智能系統可以輕松作答。但如果題目用了場景描寫將其表述為“小明有10個蘋果,小麗吃了一個,請問還有幾個蘋果?”面對這樣的情況,人工智能系統就“傻”了,“它不理解小明是什么、小麗是什么、吃又是什么意思。”
實際上,為了“AI-MATHS”迅速克服這解題的弱點,準星云學科研團隊此前對“AI-MATHS”已進行了500套試卷、12000道題目的魔鬼式訓練。
研究人員表示,AI-MATHS在自然語言識別方面還有待提高。用參與閱卷的數學老師的話說,AI-MATHS要考好數學,還得先學好語文。
研究人員相信,經過更多的訓練和學習以后,未來AI-MATHS會取得更好的成績。
評卷專家正在批改高考機器人AI-Maths所答的北京文科數學卷(圖片來自:澎湃新聞)
6名往屆高考狀元1分險勝智能機器人
而與此同時,在北京,一場高考的人機大戰也打響了。
由中小學智能化教育公司“學霸君”自主研發的智能教育機器人Aidam,首次與6名高考理科狀元在北京同臺PK,解答2017年高考文科數學試卷。
最終,Aidam僅用9分47秒就答題結束,成績為134分。6名高考狀元的答題時間是55分鐘,成績平均分為135分。
據“學霸君”創始人張凱磊介紹,為了便于展示,Aidam答題放慢了速度,平時每道題完成時間應該在7~15秒。
據了解,“學霸君”投入數年時間,集200多位技術人員之力進行智能教育機器人的研發。資深教師和工程師在7000萬道題目之上構建了推理引擎和龐雜的知識元,機器在所有的解題路徑中探索出最簡明的一種。