物流及供應鏈多元技術研發中心(LSCM)邀請到3位名人參與「名家聯乘AI真人發聲書項目」,分別是特許氣象學家林超英、全國港澳研究會副會長譚耀宗和著名藝人汪明荃,3人早前錄音朗讀著作部分章節,LSCM利用收錄的語音訓練人工智能AI模型製作人工智能AI合成語音。
林超英表示,是抱着理解騙案形成的心態參加,在聽到合成錄音後覺得很震驚,擔心日後收到自己打給自己的電話,連講廣州話時有少許潮州口音都可捕捉到。他希望將來這個世界可做到聽書,聽書可記得多點,看書是過眼雲煙,推廣聽書風氣或許是好的發展方向。
汪明荃稱,最近出一本書記錄粵劇進度,而做有聲書可作推廣,人們在睡前聽書可學到野。她認為語氣特色很相似,達到百分之九十,害怕人們冒認自己做其他事情,期望能盡快拿出安全方程式,既可與人分享又可節省很多時間。汪明荃相信今次只是嘗試,要製作整本書牽涉很多版權問題,需要多方面同意才可實行。
譚耀宗透露,進行了3小時的錄音,聽完難分真假,害怕自己聲線用作其他不當行為,而錄音的速度是比原來快20%,他解釋講慢點人們容易吸收,於是提議加快10%,並發現AI講出來是照讀,如果能做到口語化會更真實。他更希望這種技術可一直鋪下去,香港人生活太忙碌,有聲好書可於跑步或健身時聽。譚耀宗未來會錄普通話,相信會很困難,因讀書時要求標準,害怕懂普通話的人批評。
物流及供應鏈多元技術研發中心研究及技術開發總監唐志鴻指,經驗顯示1至4小時錄音都可製作到合成語音,愈多錄音愈細微地方都可捕捉。他更提到沙聲可調校,但調校後是否與真人聲音相似是另一個課題。唐志鴻認為製作合成語音需要投入很多硬件、軟件、電腦和隊伍,故只有大型科技巨頭才可做到,普通人可到有關平台製作,但只是玩樂,製作不到自己需要東西。
唐志鴻介紹,實驗室一直製作中、英文和其他語言,還嘗試過俄文、阿拉伯文、西班牙文、意大利文,並會透過很便宜轉移方式,交由行業公司如出版商和作者進行製作。(蔡啟文攝)
頂圖圖說:特許氣象學家林超英、著名藝人汪明荃和全國港澳研究會副會長譚耀宗接受傳媒訪問後合照。
特許氣象學家林超英談及參與真人發聲書原因。
全國港澳研究會副會長譚耀宗認為如果AI能做到口語化會更真實。
著名藝人汪明荃認為有聲書可節省很多時間。