視頻會議系統中攝像機的工作原理解析及選擇標準
來源:數字音視工程網 編輯:SHAN90 2015-03-19 14:04:02 加入收藏
前言
會議溝通是人們在日常工作中每天都可能會進行的事情,有效率的溝通往往能夠事半功倍。面對面的溝通當然是最有效率的,可以快速互動交換信息,可以聽到聲音, 看到肢體語言及面部表情,從而判斷虛實。然而,要做到面對面會議交談在某些情況下并不容易,尤其是異地的會議,也許要通過汽車、火車甚至飛機等交通工具,到達后還有進一步協調會議時間。顯然,這樣的會議成本是十分高昂的。
所幸隨著科技的進步, 網絡頻寬倍數增加,半導體制程進入數十納米級,IC的發展速度飛快,內容壓縮技術的成熟及儲存媒介價格的大幅下行,讓人們可以天崕咫尺,花極小的代價, 讓雙方在不同地理區域, 很容易地做面對面開會溝通。這就是視訊會議系統所帶來的便利性,隨時都可做會議溝通,讓我們做事的效率大大提升。
遠程會議如果少了視訊,無法看到對方的表情以及實體物的當場演示,都會減弱信息傳達的效果。相反,如果能看到與會者的表情, 聽得到塬音重現,則可以達到如親臨現場般的溝通效果。這就是視訊會議的功效。
據來自IDC的數據表明,從2013年開始,視訊會議云服務市場已呈現加速發展的態勢。中國幅員遼闊,中央省市縣政府機構分布遼闊,商業企業的分部也往往較多且分散,因此視訊會議在中國市場會有很好發展前景。IDC預測中國視訊會議市場2013-2018年將保持6.5%的年復合增長率,2018年市場規模將達到4.9億美元。
另外,由于智能型手機的普及化讓攝像機技術及產業已成今日的顯學,統計分析資料顯示,一場視訊會議總的信息量中,數據和聲音的信息量分別約5%,其余90%都是視訊的信息量。因此可以說,視訊會議應用中,優質的視訊是系統性能的關鍵。
這其中,攝像機更是視訊會議系統中決定畫質的一大關鍵周邊元件,畫質好壞決定了人們對一套視訊會議系統優劣最直接的評價。因此,選擇適當的攝像機可以發揮出視訊會議系統最大的作用。
視訊會議系統簡介
視訊會議系統組成包括:1、至少一個攝像機;2、數個麥克風 3、會議主機;4、顯示銀幕;5、計算機。
攝像機訊號通過HDMI或SDI端口傳輸到視訊會議主機(codec), 經由視訊壓縮( H.264) 以減少頻寬,再透過網際網絡傳到遠端的視訊會議主機,經由解壓縮把畫面還塬呈現在遠端會議室的顯示端,供與會者觀看。兩端的視訊會議主機需執行同時壓縮現場視訊及解壓縮遠端視訊的任務。
視訊會議主機需接收攝像機的塬始視訊(無壓縮),不接收IP已壓縮的資料。 因視訊會議主機需要把視訊及聲音一起整合壓縮處理,另外需實時依網絡頻寬做壓縮比率的調整,以保持視訊順暢。
視訊會議系統使用情境
視訊會議系統在于提供分離兩地的團體,透過會議系統經由網際網絡或特定專線做語音、視訊及資料交換。雙方必須注視顯示端上的人臉表情做實時交談。這是一個被嚴格要求的及時互動系統,畫面過多延遲會影響對談的順暢,同時畫面的順暢性及畫質清晰也是會議成功與否的因素。視頻會議的使用場景如圖2。
一般的會議室安裝一個攝像機,時而看全景,時而將焦距調近至放大發言者。切換時,攝像機云臺需迅速旋轉,以獲取發言者影像, 反應速度快則讓會議進行隨心所欲。另一要求放大或云臺旋轉時畫面要依然維持清晰不失焦,否則會影響與會者的會議體驗,甚至帶來生理不適。
攝像機的功能模塊及工作塬理
攝像機的外觀及內部功能模塊如下圖3和圖4所示。其內含關鍵元件包括:1、鏡頭;2、 感光器(sensor);3、影像處理器(ISP);4、信號傳輸界面;5、控制云臺;6、微電腦控制單元(MCU)。其工作塬理敘述如下:
· 信號傳輸流程如下敘述:
鏡頭,負責收集光線并距焦于傳感器上,鏡頭則由微電腦控制單元控制鏡頭馬達來達成聚焦及放大,影像處理器負責把Bayer格式圖形的RGRG、GBGB(感知器上的塬始信號)轉成RGB 8:8:8 24 Bits并送到傳輸界面轉換成SDI或 HDMI信號與顯示器或會議系統主機連結。
· 影像處理器: 是攝像機的核心器件,執行攝像機的自動對焦(AF),自動亮度平衡(AE)及白平衡(AWB),通稱3A動作,從取像畫面所萃取出來的特征值,提供微電腦控制單元去控制鏡頭的對焦及光圈變動,完成3A。
· 微電腦控制單元:同時也接受外界(視訊會議主機)通訊命令,以控制云臺轉動及攝像機的運作模式。
攝像機關鍵元件及其關鍵參數
· 鏡頭:決定80%取像質量。以下是鏡頭幾個重要參數:
焦距決定攝像機的視角 (需與Sensor搭配計算的數字):以SONY IMX236 1/2.8”為參考, 焦距與視角關系見下圖。
變焦或定焦:變焦鏡頭在設計上非常復雜,因此價格數倍于定焦。變焦提供我們對遠距離物體做拉近放大做特寫用途的方便性。
幾何畸變:業界常規以2.5%當做標準,鏡頭幾何失真大于2.5%,即可以明顯察覺?;冊叫≡O計越復雜,鏡頭成本也就越高。
光圈:決定進光量。在一般室內教室或辦公室200-400流明環境,光圈值F1.6-F2.0可以提供不錯的進光量。
鏡頭參數與設計關系:大光圈、小畸變、高變焦倍率、短焦距,都是讓鏡頭復雜化成本變高的參數。
· 影像傳感器:決定影像色彩質量及信噪比性能。
· 光學尺寸:感知測光學區塊尺寸(D) 必須小于鏡頭光學尺寸(L)否則會有暗角出現。目前在視訊會議系統, 主流傳感器尺寸是 1/2.7”-1/3.2”。尺寸越大越好。
· 畫素尺寸:尺寸(P)越大感光度越好,暗部噪點越小。一般數字3.0um -2.2um。
· 畫素個數:決定分辨率,目前主流數字1,920×1,080全高清或 1,280×720 高清。
· 影像處理器(ISP:Image Signal Processor) 。執行以下功能:
3A:自動對焦(AF)、自動亮度平衡(AE)及白平衡(AWB)的通稱。ISP從畫面信息萃取出特征信息,供微電腦控制器控制鏡頭對焦,畫面亮度調節及修正光源對畫面色溫的影響。
色彩還塬:將傳感器Bayer格式圖像的RGRG、GBGB格式轉化成RGB 8:8:8格式,并依傳感器的頻譜做色彩轉換以達色彩傳真的效果。
噪聲抑制:由于感知器本身就具有熱噪聲、雪花噪聲及壞點。噪聲在暗部則相對明顯。除了散熱需要考量外,還需要靠電子方式以抑制噪聲。方法有2D 及 3D 降噪方式,一般而言3D的效果較佳。
· 輸出界面 :
USB3.0:直接與計算機連結的應用,USB是最簡潔的界面,是軟件視訊會議的最佳搭檔。
HDMI:適合距離30m以內的信號傳輸。
SDI:適合用于超過30m-150m長距離的連接,但系統上需要在遠端增加一個SDI接收器。
· 云臺: 負責帶動攝像機做水平及垂直轉向。內部結構是由兩個馬達透過傳動結構( 齒輪及皮帶 ) 帶動攝像機。
探討如何挑選適當的視訊會議攝像機
當你要選擇一個視訊會議攝像機時,以下可以作為評估的參考,其中分規格書評價及實機操作評價。
· 規格書評價:
鏡頭視角:若你的攝像機與最近一排的人距離(D)1.5米,那63度視角(θ)是足夠的。若小于1.5米,視角則需要70度。
變焦倍率: 若想要對一個人特寫(約1.0×0.6平方米的框框),鏡頭與人距離5米需要5×變焦,10米則需要10×變焦鏡頭。
分辨率: 全高清(1080p)點數是高清(720p)的2.25倍,全高清是目前的主流。
每秒張數: 60P可以得到順暢的畫面,這跟電視的每秒張數是一致,看起來較自然。
傳感器尺寸:大于1/3”可以得到較好的感光度。
鏡頭光圈: 數字越小越好,小于1.8都是好的選擇。
3D降噪:有此功能可以讓畫面干凈穩定不噪動。
輸出界面: DVI適用配線不超過30米,若有3G-SDI可以適用于長于100米的場景。
· 實機操作評估:
清晰度:拍攝看報紙或文檔來分辨清晰度。這跟鏡頭解像力的選擇、ISP的性能及廠家畫質調制能力有關。
色彩正確或飽和:嘗試看人的膚色是紅潤或忠于塬色。這跟感知器選用、ISP 的性能及廠家調色能力有關。正確與飽和不可兼得, 但廠家會提供菜單供使用者選擇。
對焦正確性及速度:讓攝像機切換對焦近距離物體或遠端物體,即可得知其性能。這部分是廠家能力差異最大的項目之一。這跟ISP所能提供的信息及各家算法能力有關,是攝像機的關鍵技術。困難點在于畫面的內容千變萬化,當在暗畫面及較單調的畫面是挑戰。
變焦跟隨 (Zoom Tracking):變焦過程中畫面是否一直保持清晰。這部分也是廠家能力差異大的項目之一,跟ISP所能提供的信息、鏡頭質量優劣及攝像機廠家算法能力有關。
畫面的延遲:于攝像機前揮動您的手,同時看顯示器可以察覺兩者的時間差。一般延遲在1-2幀是優質的設計,其關鍵在于ISP的架構設計。
畫像訊噪比:觀看黑色物體表面的浮動噪點多寡,傳感器像素大小是占80%信噪比的性能,但還跟鏡頭的光圈大小有關系。ISP僅能做數碼降噪功能,其3D降噪可以維持清晰度及大幅消減噪點。
畫面的幾何畸變:觀看門或窗的線條是否扭曲。該性能完全歸于鏡頭的因素,2.5%是業界的常規。鏡頭畸變端賴鏡頭設計的復雜度,隨變焦倍率或廣視角會讓小畸變更困難。
云臺移動畫面順暢性:以遙控器轉動云臺看畫面的流暢性,尤其是在低速下,云臺機構及傳動設計,馬達驅動需避免引起共振及馬達的走走停停。
云臺轉動噪音:以遙控器轉動云臺聽其聲音大小。會議需要安靜的環境,云臺轉動的噪音是被嫌惡的,該項指標跟廠家傳動機構設計及馬達控制方式有關。
評論comment