汪揚:沒人敢說OpenAI是獨屬美國的-香港商报
首页 > 新闻专题 > 财经 > 财经

汪揚:沒人敢說OpenAI是獨屬美國的

2024-03-13
来源:香港經濟導報

Sora的橫空出世,如同一枚深水炸彈,瞬間引爆全球。我們特地專訪了在AI領域的權威人物——香港科技大學副校長汪揚,邀請他就讀者關心的焦點話題進行深度解讀。

「沒有什麼事情是人工智能做不到的」

記者:在您看來,Sora的出世意味着人工智能已發展到何種程度?

汪揚:早在GPT-3發布時,我就覺得AI技術已經是不可想象的強大了。只是因為它不是interactive(可交互的),也沒有開放給所有人,所以受到的關注比較少。等到ChatGPT(GPT-3.5),那就是take the world by storm(席捲全球),全世界人民熱烈地談論了起碼有半年的時間,沒想到很快又迭代到了GPT-4。

對於Sora,我更有這樣的信心:在3到5年內,你把電影劇本錄入Sora,它就能做出電影,哪怕不是非常完美,但至少是一份初稿,你可以根據這份初稿與它進行對話,告訴它需要調整的地方,最後它真的就可以做出一部成熟的電影。

但任何技術,最終都要回答一個問題:它將帶我們去向何方?

近兩年以來,AI驚人的發展速度讓大家感到幾乎沒有什麼事情是人工智能做不到的。這就不可避免地會觸及到倫理問題,今後我們該如何定義人為的邊界?在電影《西部世界》裏,機器人攜帶槍支,但它永遠不會傷害人類。而人類卻可以隨意虐待甚至殺戮它們,機器人成了人的奴隸。結果最後這些機器人慢慢地修改了它們自己的程序,開始越過了邊界,可以傷害人了,最後演變成一場災難。

如今大家又有了同樣的討論,但不管怎麼樣,Sora現在離成熟還有段距離。最簡單的來說,ChatGPT和GPT-4完全可以商業化的,Sora目前還沒有到這個程度,但是假以時日,Sora是可以做到的。

記者:Sora目前依舊有很多問題,生成的視頻瑕疵不少,Sora進一步優化的技術難點在哪裏?

汪揚:決定Sora表現的是參數的多少。參數越多,模型越大越合理,自然功能就更成熟,生成的視頻就更接近完美,但模型和參數優化都是一步一步迭代出來的,不可能一步到位,一定是一個漸進的過程。隨着模型變大,一定會階段性地出現種種問題,不斷解決然後才能一點點擴大,這是需要積累的。

谷歌為什麼目前還沒有趕上 OpenAI?就是因為它積累不夠。就像我們都知道中國航空發展需要好的發動機,發動機的原理在很早以前我們都已經搞得很清楚了,但為什麼我們造一台先進發動機那麼困難?原因就在於缺乏經驗。

這讓我想起一個故事,當時我們的工程師研究烏克蘭援助的發動機,發現它的葉片做得很毛糙,以為是質量很差,就把它改成非常光滑漂亮的,但測試後發現性能根本不行。跟對方一溝通詢問是什麼原理,對方看了之後直接回答說他們也不知道,他們也是試了很多次,最後才發現就是這樣毛糙的才好用。這就跟Sora的發展進程一樣,是不是一下子將參數提升幾個量級,Sora就完美了?不是那麼回事,參數增加的過程,是不斷解決問題、不斷嘗試的過程。在一個成功的模型上改進,總是比在一個未知的模型上想達到完美容易很多。

記者:什麼決定了人工智能的發展進程?

汪揚:我認為發展人工智能有三個必備條件:算力、數據和人才。排在第一位的算力是最最基礎所在。過去我們都認為人才和數據最重要,那是在用錢可以解決算力,而且也沒有現在這麼海量算力需求的前提下。但如今,訓練大模型成了發展人工智能的根基,算力則是發展大模型必不可缺的燃料。

香港短期內幾乎不太可能做出大模型,為什麼?缺乏算力。ChatGPT的訓練用了至少1萬片英偉達A100卡,GPT-4至少2萬片。現在香港沒有任何企業機構有這樣的算力。但香港可以專注做垂直應用,我認為這也是將來的主要賽道。目前,只有OpenAI、微軟、谷歌和亞馬遜這樣的大公司有足夠算力來發展通用大模型。近年來美國對中國進口高端GPU實施限制,也確實使中國在發展人工智能的第一點條件,即算力方面處於比較劣勢的狀態,我們需要一段時間才能解決算力問題。

第二個條件則是數據。對中國而言,我們有中文數據,但是數據量比英文的要小很多,加之一些客觀原因限制了我們的數據應用,而數據對於人工智能發展是至關重要的。

以人臉識別技術發展歷程為例,人臉識別技術必須要達到99.9%以上的準確率才能滿足實際應用的要求,研發者一開始找到最頂級的專家來幫助他們對算法進行改進,但發現無論如何改進,準確率都只有有限的提升。後來他們選擇以crowdsourcing付費的方式形式吸引大家上傳頭像照片,以此方法,他們一下子收集到了大量的人臉數據,短時間內準確率就超過了99.99%。這就是展現數據重要性的先例。為什麼OpenAI和谷歌有先天的優勢?就是因為他們很早就開始收集各種各樣的數據。

數據確實是目前中國發展人工智能通用大模型的瓶頸,但中國想要追趕上也只是時間問題而已。另外中國在垂直領域數據方面沒有這麼大的差距,甚至在很多領域還領先。

人才是第三,中國不缺才,光香港科大就培養了不少人才(笑),清華北大里都是優秀學生,Sora的核心團隊裏就有北大畢業的,所以我從來沒覺得人才是一個瓶頸。

「沒有人敢說OpenAI是獨屬於美國的」

記者:美國採取的芯片限制政策在何種程度上影響了中國人工智能的發展?

汪揚:芯片數量和質量決定了算力的大小,而正如剛才提到,算力是發展人工智能的最重要元素。目前較為大眾所熟知的國產GPU芯片當屬華為升騰910芯片,它表現雖還不達英偉達的水平,但依舊是供不應求,無法完全滿足市場需求,部分原因就是芯片限制下,英偉達出口的只能是閹割版的芯片。

不過從原始算力上來看,根據許多報道,升騰910已經至少達到A100的90%,甚至是95%的水平,這是非常了不起的,要知道GPT4就是用A100訓練的。但華為的差距目前是在優化方面,英偉達的優勢不僅在於芯片,更在於它配套的軟件CUDA,還有芯片之間的通訊速度。這恰恰是華為所缺乏的。

因此,據我所知,華為的實際算力目前只能達到英偉達的20%左右,這肯定是不夠的。但這些都可以克服,我認為在兩年內,中國自產芯片的整體性能能夠達到A100的90%以上,到了那個時候,中國大模型發展將會有一個質的飛躍。但在算力方面想趕超英偉達,10年可能都做不到。

記者:中美在AI發展方面差距如何?

汪揚:在這方面總有人唱衰中國,認為中國在這一方面的研究遠遠落後於美國。我很反對這種說法,首先,以游泳運動講法為例,當領先一個身位的時候,就可以說是有絕對優勢。目前美國領先中國可能兩三個身位。但我們需要看到,中國可能是領先別的國家四五個身位。全世界現在只有中國和美國在第一梯隊,而且中國的優勢在於垂直領域。

其次,沒有人敢說OpenAI是獨屬於美國的,Sam Altman(OpenAI的CEO)是一個非常理想化的人。如果你問他:「你是為美國而做的嗎?」他一定不會同意,他一定是為全人類而做的,這樣的技術全世界人共享才能發揮真正的價值。另外,我認為人工智能越往前發展,越有可能蠶食掉美國的優勢行業,或許美國會後悔的(笑)。

舉個例子,在電影《大空頭》裏,當別人都不假思索地跟風購買CDS時,電影的主人公 Michael Burry耐下心來閱讀了基金公司們故意寫得很複雜冗長的100多頁產品介紹,發現CDS不過一堆垃圾。於是他開始做空,在市場崩潰時得利,成為贏家。而現在你我都不用花費時間讀這些東西了,直接將內容往ChatGPT4里一輸入,它可以立馬告訴你這個產品到底是什麼,可以讓你更好判斷值不值得入手,甚至直接給出建議。如此一來,人們將不再需要傳統的金融分析師。

「利用AI進行創造,成了一門學問。」

記者:您認為,以Sora、ChatGPT為首的這些人工智能產品會對教育界產生什麼影響?

汪揚:衝擊非常大,用孫正義的話來說,人將分為兩類,會用人工智能和不會用人工智能的人。十年之後,這兩類人的距離會跟人與猿人之間的距離一樣遠。ChatGPT剛出來的時候大家都很擔憂:有了它還要我們老師幹什麼?我認為這種擔憂是完全沒有必要的。我們應該用歡迎的姿態迎接人工智能,我們的教育思路、產品也必須跟着科技的進步做出調整。

其中一個很重要的課題就是教會學生如何利用AI進行創造,這反而成了一門學問。什麼樣的人才能在這樣的環境中脫穎而出?首先是具備想象力的人,沒有想象力的人一定是用不好AI的,因為AI始終是根據用戶輸入的內容進行創造。

第二是有鑑賞力的人,這是我認為在今後的人工智能的發展中最最重要的能力之一了,其與想象力的重要性並駕齊驅。為什麼鑑賞力如此重要?因為今後一定會出現同質化,以GPT4為例,它生成的內容相似度都很高,這時,就需要鑑賞力來分辨出什麼才是真正好的。

最後就是原創性,人工智能永遠超越不了真正杰出的作家和畫家,莫奈、梵高的畫並不會因為人工智能可以創造出大量的很不錯的圖片就貶值,這一點我們從數碼拍照就可以看出來。數碼拍照讓很多業餘人士都能拍出非常精美的圖片,但這些照片永遠都賣不出Ansel Adams這些大師們精心拍攝沖洗出來的照片的價錢。

人工智能終究是輔助人實現目的的一種工具,而不會取代人的原創性,相反其更能凸顯出原創的價值所在,人工智能只是按照我們所想的去做,我們才是真正的指揮官。作者:納婕謐

來源:香港《經濟導報》總3563期

[责任编辑:郑婵娟]