文/羅超
尼泊爾發生了本世紀陸地第五次八級大地震,加德滿都12座世界遺產建築被不同程度損毀,尼泊爾專家稱能工巧匠需要用大約10年時間才可修複這些古跡。在他們實現這一目標之前,某互聯網巨頭拿出了一個快速解決方案:基於照片遊技術,號召全球網友上傳加德滿都相關景點照片,嘗試用技術在虛擬世界對被損毀的景點進行360°還原。這聽上去是一個巨大的“拼圖”工程,好在有一項名為“照片遊”的技術,而這項技術未來甚至有望取代街景車,做到真正還原世界每一個時刻的每一個角落。
照片遊技術收集和還原真實世界
地圖還原加德滿都的計劃,使用被稱為照片遊的核心技術。這個技術並不難解釋清楚:首先,其收集用戶手裏海量的關於某個景點不同角度、不同時間、不同特征的風景照片;其次,通過圖像技術對海量照片進行篩選和三維建模,把平面還原成空間;再次,通過智能遊覽路徑規劃算法,生成一條最佳遊覽路徑模擬真人遊覽;最後,利用照片渲染技術,對某些缺失的角落進行修補插入虛擬照片。
照片遊技術所以來的四項基本技術,每一個都已被應用在成熟應用之中。
百度、Google地圖很早就有UGC景點相冊功能,用戶可選定一個地點上傳對應照片,只不過主要目的是分享給其他用戶。基於平面圖像的3D建模,是街景應用的核心技術,只不過它的照片素材是街景車等專業取景器拍攝而來。
智能路徑遊覽規劃算法主要是利用大數據分析和圖像識別算法,分析出哪些角度更受用戶親睞,哪些位置的人流最多,進而得出景點最合適的虛擬遊覽路線。照片渲染技術在《返老還童》《速度與激情7》已在大量電影中被應用,一些照相館提供的照片修複服務所使用的軟件同樣應用了這個技術。
基於UGC的照片遊技術已經被應用在Google地圖和百度地圖之中。
上述所有技術都離不開關鍵的幾個基礎技術:大數據、機器視覺和人工智能。用戶上傳的海量照片與街景車的規范照片比雜亂數倍,需要剔除無用、重複照片,篩選對於還原有效的照片,這需要圖像識別和大數據技術;在還原時不可能人工去拼接需要機器自動還原為3D,路徑規劃和圖片渲染則需要基於圖像素材情況進行自動的規劃,這需要人工智能技術。當然,機器視覺本身是基於大數據和人工智能技術。
照片遊技術還有哪些使用場景?
照片遊技術還在探索階段,目前僅僅用於少部分景點的虛擬街景生成。隨著圖像識別技術、圖像渲染技術、三維建模技術和人工智能技術的發展,它將不斷成熟,具有巨大的應用潛力,我甚至認為照片遊技術可以與街景技術、電子地圖技術並列,成為未來的核心地圖技術之一,因為它可以低成本、高效率、無死角地幫助人類把物理世界映射到虛擬世界,而這是從地圖第一天誕生其人類一直都有的願望,並且今天愈發強烈。
典型場景1:還原世界的每個時刻
在加德滿都被毀之後,基於街景車的專業取景已無可能,只有基於舊照片進行還原,利用互聯網的UGC能力可收集到全球海量照片,照片遊技術則可以實現還原。盡管在加德滿都被損毀之後,其他重要旅遊經典應該會有意識加快街景建設。不過別忘了,有目的的街景建設都只能還原某個時刻的街景,比如杭州西湖春夏秋冬各不相同,只有通過照片遊才可還原不同時間點的街景。
還有,除了加德滿都,世界上還有大量景色已經無法還原,且存在可觀數量的照片,比如三峽工程蓄水後被淹沒的沿線城市、沿線風景。哪怕是你所生活的城市,幾年之後你再回頭來看,恐怕都會面目全非,人類建設大躍進正在淹沒一代又一代記憶。不過這個星球每時每刻都在被不同的人從不同角度拍攝進去,從室內到室外,海量照片未來都可能成為“照片遊”還原的素材。而這些還原後的結果則可以被應用到景區導覽、人文社科研究、用戶還舊尋幽探古,等等。
典型場景2:更低成本的街景制作
街景技術已經出現近十年了,不過你會發現你所在地區可能並不在街景地圖之中,就算在可能已是兩年前的數據,店鋪、路段什么的可能都已經認不出來了,相對於電子地圖而言,街景地圖不論是在覆蓋范圍還是更新頻率上,都差距甚大。原因很簡單:街景制作成本太高了。最典型的數據收集設備是街景車,此外還有自行車、頭戴式、背包式的街景拍攝器。不過它們都需要大量專業人力,並且收集速度是非常慢的。
照片遊技術可以部分取代現在的街景制作技術,它成本更低,更重要的是,速度更快,每個具有拍照設備的人都成為街景收集器,只要他們願意貢獻數據——現在是主動上傳,未來或許是對海量雲端相冊照片進行去隱私處理後的利用。總而言之,照片遊是更低成本、更高效率的眾包街景制作技術。
典型場景3:室內街景從點到面
過去的街景幾乎都是室外部分,並不是室內街景沒需求,相反室內虛擬遊覽、室內導航的需求可能更甚,比如商場和博物館。
室內街景沒怎么做,我想主要有兩個原因:室內諸多街景采集設備都失效了,街景車跑步起來,頭上戴個街景采集器估計會被打。室內更容易觸犯用戶隱私,室外距離遠人群密度低尚出現過Google 街景拍攝到換衣服女人遭起訴事件,室內就更容易出現這樣的事件了。盡管Google、百度在過去做過博物館、藝術館的內部街景瀏覽,不過都非常少,並且為此付出了巨大的數據采集成本。
而照片遊技術基於用戶拍攝的照片,因此並不存在街景車跑不起來的限制。隱私問題在機器視覺技術成熟到一定成熟完全可以對人臉進行自動馬賽克處理。而室內定位技術的成熟也給室內街景虛擬路徑規劃提供了更大的可能,百度已投資芬蘭室內導航公司IndoorAtlas,iBeacon等室內定位技術正高速發展。總之,未來我們世界打開手機地圖查看商場虛擬導航,並不是吃人說夢——這些導航都是基於用戶上傳的室內照片生成。未來互聯網公司則可基於室內街景開展O2O體驗式購物、O2O體驗式公民博物館,虛擬曆史教育等等。
照片遊技術未來還有哪些發展方向?
照片遊技術才剛剛開始,它的未來不只是一個更低成本更高效率的街景工具,與以下技術有著巨大的結合空間:
1、視頻技術。圖像識別技術只是機器視覺技術的一種,隨著人工智能、大數據和深度學習技術的發展,隨著機器計算能力的爆發式增長,視頻識別技術正在日益成熟。前Google X實驗室負責人吳恩達讓機器自動從海量YouTuBe視頻識別貓就是視頻識別的應用。未來照片遊可升級為視頻遊,實際上視頻數據量更大,因為它無時不刻、不知疲勞地地記錄著世界,而這些記錄的“眼睛”遍布在我們的周圍且越來越多。
2、雲攝像頭。不少用戶已經開始購買雲攝像頭,以便通過雲實時查看某個地方的視頻,這些視頻被存放在某個雲空間,或者被公開分享,未來它們可以成為照片遊街景的數據來源。另外一個分支是運動攝像頭,GoPro為代表,國內現在抄得很厲害,未來運動攝像頭拍攝的海量運動照片和視頻,則可以成為運動聖地,比如珠穆拉瑪峰的虛擬實景還原的素材,能夠登頂珠峰的人太少,不過想要體驗登頂感覺的普通人太多了。
3、虛擬現實。VR設備,Oculus是其中最出名的應用,你帶上一個眼鏡之後就可以進入一個虛擬世界,它可以給你聲音、環境諸多維度的感覺,能夠感知你的動作、聲音、情緒。而這些虛擬現實設備都缺乏應用和內容,未來基於照片遊技術可以為它們創造大量的與現實環境緊密結合的內容。記得去美國大峽穀遊玩時在峽穀邊看了場平面電影,以後再去可能就是直接帶著眼鏡去體驗滑翔、跳傘等探險項目了;去三亞則可以帶著眼鏡等設備學習潛水、體驗深潛……
4、無人機航拍。DJI(大疆)的聲名鵲起說明了一個趨勢:航拍太火了。過去人們都是站在地上看這個世界,卻很少有機會通過“上帝視角”來了解這個世界。有了俯瞰式的航拍影像數據,人們可以真正實現360度建模世界、還原世界——Google Earth的衛星雲圖實在太模糊了。航拍技術的普及讓Google Earth一下進入了史前時代。從覆蓋范圍來看,無人機航拍更多還是一個補充,不過它更有用。
總結:還原加德滿都采用照片遊技術,只不過呈現了冰山一角的能力,照片遊未來還有巨大空間,當然,一切的前提是人工智能、機器視覺和大數據技術要更加成熟。