富士通開發三維手勢識別技術適用於個人或平板電腦

富士通宣佈開發三維手勢識別技術。利用個人或平板電腦的單鏡頭拍攝得到的影像,偵測不止於手部的上下、左右方向的活動,更包括以手部進行的前後推拉活動,即面向展示螢幕向前及向後時,所產生的距離遠近移動的動作。

目前的手勢識別技術能偵測手的上下、左右移動,即類同操控滑鼠游標的相應動作。可是,偵測改變手部距離如向前、向後動作,即與點擊操作相應的方向移動則難以做到。富士通研究所和富士通研究開發中心有限公司以手掌模型,開發了高準確度及高速偵測手部區域的技術,以及能偵測向前、向後的手部移動的技術,讓使用者能以「推」的手勢,進行點擊操作。

此嶄新技術可以通過手勢進行一系列複雜的操作,例如當使用者遠離電腦時,也可以上下揮手來選擇項目單,並以「推」的手勢確認選擇項目。使用地圖及其他圖像時亦可以「推」及「拉」的手勢來操作擴大及縮小指示。

【開發背景】

近年來,以人體的自然動作來操作裝置的手勢識別技術備受矚目。此技術能通過鏡頭偵測手勢以操作裝置,適用於多種場合;例如當使用者遠離個人或平板電腦等裝置時、手濕或髒時,或者基於衛生理由而不想接觸公共裝置時。當考慮以手勢來代替鼠標操作時,一般技術只能偵測到與游標移動相應的手勢如上下、左右移動,卻很難偵測與點擊操作相應的前後推拉方向動作。

【技術問題】

以單鏡頭偵測手部前後推拉移動需要依據使用者手掌面積的變化為基準。當使用者穿著短袖衣服,或當背景顏色與膚色近似時,識別手掌和背景會相對困難,往往難以準確地從背景中抽取出使用者手掌的區域。直至現今階段,使用其他方法如距離傳感器和多個鏡頭雖然可以計算或偵測前後推拉活動,但設備的成本卻高昂。
【關於新技術】

富士通研究所和富士通研究開發中心有限公司開發了能從單鏡頭拍攝的影像中準確地抽取使用者手掌的區域,並能穩定地捕捉影像中手掌的大小變化的技術。技術特點如下:

  1. 根據手掌模型研發的手部區域偵測技術

此技術先把使用者的手掌掃描成圖像,並以預設大小將圖像切成單位。每一個手型(如手掌模型)會通過計算並判斷是否與預設數據吻合。此程序會把手部與整個圖像的背景作對比,通過比較位置和大小不同的單位,得出手掌的確實位置和大小。然後,手掌區域的影像會按照手的位置和大小被抽取,同時手掌的原圖會以顏色變化來展示。上述方法能夠確保手部區域偵測技術的穩定性。

 

2. 根據手部大小變化的深度偵測技術

此技術可以準確地根據手部的連續活動估計其深度(即前後進拉方向的動作),包括經常變化的狀態如手的大小、角度和中心位置,讓偵測「推」及「拉」的手勢的準確度約有九成。

【成果】

此嶄新開發技術可於多個情況下使用。例如使用者可以上下揮動手部於裝置上選擇項目單,並以「推」的手勢確認選擇項目。電影、音樂、體育賽事、以至其他不同內容也可以上下揮手的形式作選項,並以「推」的手勢確認。使用地圖及其他圖像時亦可以「推」及「拉」的手勢來擴大及縮小影像。此外,由於手部運動可以單鏡頭偵測,設備便能以低成本生產。

 

【未來發展】

富士通研究所計劃以技術的可用性作評估,同時致力改善手部偵測和識別技術的準確度,目標在2014年把技術商業化。

在此提及的所有其他公司或產品均為其各自擁有者的商標或註冊商標。此資料以發布時為準,內容會有機會更新,但不會作另行通知。

 

資料由有關機構提供