關燈 巨大 直達底部
親,雙擊螢幕即可自動滾動
第26部分

較深的是兩個外國朋友對這項技術獨具匠心的使用故事。John是一位新生兒的父親,當週末妻子出去購物,留下他和孩子兩個人在家的時候,他時常為寸步不能離開孩子而煩惱。當他從網上下載了“微軟肖像”之後,他在嬰兒床前按了一臺攝像頭。於是他可以帶著掌上電腦隨心所欲地在房子的每個角落活動,透過影片觀察孩子的一舉一動,他甚至還能放心地在院子裡除草,而這往往是週末最佔用他時間的一項勞動了。

Peter是一家醫院的見習醫生,經常會輪到晚上值班巡視病房的差事。可是因為住院病人多,醫生少的緣故,很多發生突發情況的病人往往無法得到及時的救護。於是,當他擁有了“微軟肖像”技術之後,他在巡視某一個病房的時候,也可以透過掌上電腦看到安在其他病人床前的攝像鏡頭做提供的情況。他可以在移動中實時“觀察”每個病人,一有緊急情況便可以跑過去處理或者通知其他醫護人員。Peter說有了“微軟肖像”,就像有了N多雙眼睛同時在幫他巡視病房。

上面的主人公只是很多使用者中的兩位。他們對這項技術的認可和別出心裁的應用也極大鼓舞了我們對“微軟肖像”不斷改進的信心。直到2007年5月20日,我們組推出了最近也是最新一款試用版本為止,細數下來,“微軟肖像”前前後後經歷了20個版本的更新和改進。在這八年中,“微軟肖像”專案也經歷了一段曲折的發展歷程。

難題迎刃而解

退回去想想,也許你很難想象2000年時千位元/秒的手機網路的頻寬能做些什麼?可是,就在當時網路頻寬較低的情況下,我們便在捉摸:如何實現移動裝置的可視通訊呢?顯然用傳統的彩色影片技術是實現不了的,因為彩色影片對傳輸速度和網路頻寬的要求都比較高。千位元/秒的頻寬就把這個可能給否決了。另外,既然是手機,CPU的處理能力就不如臺式計算機那樣強大,所以本來在臺式計算機上運用的影片壓縮和解碼技術就不能被照搬到手機上。我們就要對壓縮和解碼演算法進行一些簡化,才能最終運用到手機上。在綜合考慮上述兩種條件的基礎上,我們開始了“微軟肖像”的研究。

“掌上”影片拉近你我的距離 李江(2)

當時,在跟我們的研究主管、視覺計算領域的專家沈向洋博士討論中,我們認識到:既然,影片壓縮技術已經相當成熟,想要從這方面尋求突破幾乎不大可能,那麼是否可以結合視覺技術從資料本身來尋求解決呢?要進行實時通訊,使得你講話的意思能夠被對方瞭解,除了語音之外,表情也很重要。那麼表情怎麼來傳遞,我們就想到了用線條的方法來傳遞,想著用線條的方式頻寬是不是就可以佔用得少一些。

當時我們注意到,在實時影片通訊中,人們對影象的要求,並不像在定睛觀看一幅圖畫時那麼高。人們不太注意形象,而更注重表情;不太注意細節紋理,而更注意整體輪廓。從這個意義上而言,在影片通訊中,通話者大腦真正感興趣的有效資訊並不多,所以透過提取通話者的表情輪廓和線條等簡單資訊,就可以有效表達一幀影片的絕大部分內容。如果只壓縮和傳輸這部分用線條表示的資訊,將會大大降低計算和通訊的負荷。

靜態“素描”一幀的線條雖然看上去依稀可辨,但是如果要實現由靜至動,讓多幀靜態“素描”連續動起來,就會出現很多問題。首先,在光線強度常易變化等條件的影響下,兩幀之間的過渡非常不平穩、閃爍不定。另外,用線條表示出的通話者頭髮,因為其發跡覆蓋處沒有黑色填充而顯得非常的不自然。在這種情況下,我們研究組就想到用“二值影片”技術來解決這兩個問題:在0…256之間確定一個亮度的閾值,影象畫素灰度值高於該值則為白,低於該值則為黑。非黑即白(一般用1和0表示)。這種技術不只區分出了線條,而且內部什麼地方是白,什麼地方是黑,都可以填充進去,這樣頭髮的問題就解決了。

“二值影片”技術大大降低了影片的原始資料量,而且傳輸中的連貫性較好,可是其間產生的噪聲還是比較多。後來我們又想了一個更為巧妙的辦法,這也是“微軟肖像”中的核心技術:在區分黑白的時候,不是設定一個單一的閾值來比較,而是設定一個閾值帶來比較。閾值帶有一定的寬度範圍。如果影象畫素的灰度值在這個閾值帶的上限以上,我們能夠很明確地說它是1;如果在它的下限以下,我們也可以很明確地說它是0。但是如果影象畫素的灰度值處於這個閾值帶之內怎麼辦呢?我們的處理辦法是根據它同一幀內周圍的畫素和它前一幀相應