立法會去年與內地人工智能公司科大訊飛合作,推出AI自動謄錄系統「智識聽」,記錄議員會上發言。立法會主席梁君彥今日(30日)在立法會向傳媒介紹「智識聽」系統運作,指系統現時處於第二期功能,運作良好,轉換準確率超過90%,聲紋辨識準確率高達七成。前兩期系統花費不多於1500萬元,正計劃向政府申請撥款多1000萬元,發展第三期系統。
梁君彥介紹,系統已輸入2.5億個字,用了2年時間學習,在10月復會後已使用第二期系統,能即時逐字記錄會議,準繩度達93%,可應付英語、廣東話及普通話三語混合說話,又能透過聲音辨認正在發言的官員及議員,還能透過學習解決個別議員的口音問題。
梁君彥舉例指,一向習慣講普通話的選委界議員譚岳衡轉用廣東話發言,系統第一次辨識度並不高,但當第二次發言時,AI學習了譚岳衡的口音後,已即時有很大進步。不過,有議員的廣東話發音不準及有懶音,系統有機會出錯,需要職員即時在後台修正,但相比以往純人手逐字記錄,已經節省很多時間。他說,現時系統為第二期,第三期完成後可以在直播時提供即時書面字幕,希望明年可完成第三期;而第四期則可成為資料庫,協助議員搜尋資料,及進行政策研究。

被問及「智識聽」的成本,梁君彥表示,前兩期系統花費不多於1500萬元,正計劃向政府申請撥款多1000萬元,發展第三期系統,屆時可即時把口語轉換成書面文字及出字幕,預計明年第三季推出。而第四期系統透過輸入已通過的法例,令AI深層學習,發展成為政策資料庫及分析,方便議員、官員用來找資料,會在適當時候向政府申請撥款。
至於能否達到100%成功轉換率,梁君彥說,人工智能會持續學習,「越學就會越精」。
被問到日後立法會換屆,辨識新上任議員的聲紋所需要時間,梁君彥表示只需10秒,指立法會每個會議都有不同官員前來,只需職員在辨認聲線的首10秒,即可辨識相關人士。
至於「智識聽」系統經常將不同議員的聲音標注為民建聯議員李世榮所發出,梁君彥笑稱「可能個系統好鍾意李世榮」。立法會秘書處職員解釋,因系統聲紋辨識準確率為七成,在語句之間停頓時,誤認為其他人發聲。
被問及會否因「智識聽」而精簡人手,梁君彥指,使用系統一定可節省人手,以前需要一個月完成第一版的會議紀要,現時只需要幾日,可提升效率和透明度,讓公衆以最快時間獲得關心議題的資訊,但沒有精簡人手的想法,而是希望人員別做「揼石仔」工作,去做更聰明的事協助議員。(文/ 圖:李銘欣)


