首页 > > 24

這4位不懂日語的工程師開發出日文識別軟件

2016-04-14
来源:新浪科技

  導語:彭博社網站今天刊文稱,利用深度學習技術,4名不懂日語的工程師開發出了一款日文手寫識別軟件。這表明了深度學習人工智能的潛力。

  以下為文章全文:

  現實世界的人工智能正在以出乎意料的方式呈現在用戶眼前,而發展速度也要比人們想象中更快。

  盡管AlphaGo贏得圍棋比賽令人印象深刻,但機器學習技術的應用還有更多。在幾個月時間裏,4名完全不懂日語的工程師開發了一款軟件,能准確識別日文的手寫文字。

  來自Reactive的這些程序員開發的應用識別准確率高達98.66%。這家位於東京的創業公司成立只有18個月。近期,全球開發者和投資者都在試圖挖掘神經網絡的潛力,將人工智能應用至更貼近現實的場景,而不僅僅是回答問題或贏得棋類遊戲。

  作為機器學習專業的博士生,大衛·馬爾金(David Malkin)表示:“幾年前,只有真正的天才才能去做這件事。目前,聰明人都能開發出有用的工具。未來更多的是發揮想象力,將這一技術應用至真實的商業場景。”

  神經網絡通過模擬的多層神經元去“看到”信息,這一技術正越來越複雜,與人類的視覺神經類似。


  人工智能的開發以往只屬於穀歌、Facebook和其他科技巨頭。目前,任何深度學習創業公司都可以使用雲計算平台,而微軟、英偉達和亞馬遜將人工智能當作一種應用工具去銷售。

  Reactive的技術表明,在某個領域沒有太多經驗的小團隊也能開發出複雜的應用。困難之處在於找到商業模式。關於這一問題,Reactive希望幫助日本的學校批閱試卷。日本目前的考試仍基本采用手寫答卷,而這項技術有可能變革這一領域。

  馬爾金和他的同事,包括喬伊·布拉德(Joe Bullard)、菲利普·萊米(Philippe Remy)和菲利普·伊裏(Philip Irri)正迅速取得進展。布拉德今年早些時候在穀歌日本總部的聚會上向人工智能的愛好者展示了該團隊的成果。軟件表現得非常完美。

  盡管英文的手寫識別對深度學習技術來說難度不大,但日文的手寫識別情況完全不同。這是由於,日文中包含日本漢字,需要單獨處理。日文中常用的漢字達到2000多個,而這些漢字往往有多個筆畫。Reactive的算法利用神經網絡進行模式匹配,逼近最准確的結果。該公司用約180萬個手寫漢字對這一神經網絡進行了訓練。


  富士通實驗室項目負責人岡本青史(Seishi Okamoto,音)表示:“這項技術能在某個領域獲得專業性,在商用的速度和可擴展性方面取得優勢。”該實驗室正在開發軟件去識別中文。岡本青史表示:“用於手寫中文識別的深度學習已達到人類的水平,很有可能即將超過人類水平。”

  盡管Reactive的技術已經在穀歌等公司的活動上進行了公開展示,但數據尚未得到獨立驗證,或是獲得同行業人士的評價。

  與基於硬性規則的傳統算法不同,深度學習人工智能技術模仿了人腦處理信息的方式。只要給予足夠多的數據作為輸入,並設定期望的輸出結果,神經網絡就能自動進行中間過程的處理,從而找到不同於傳統方法的解決方案,例如語音表達和照片標記。

  蒙特利爾大學計算機科學教授約書亞·本吉奧(Yoshua Bengio)表示:“這涉及到多方面因素:高性能計算成為了廉價商品,大規模數據集成為了可能,而基礎科學研究也在不斷進步。工具的民主化幫助第二層用戶更方便地開發新應用和新產品。”

  所有這一切都在加速人工智能技術的開發。根據CB Insights的數據,2015年,專注於教育、零售和農業等領域的人工智能創業公司獲得的投資達到了3.1億美元,在5年時間增長了近7倍。

[责任编辑:朱剑明]
网友评论
相关新闻