手勢(shì)識(shí)別是一種用戶(hù)界面,允許計(jì)算機(jī)捕捉和解釋非語(yǔ)言交流,包括面部表情、頭部運(yùn)動(dòng)、身體定位和手部動(dòng)作作為命令。手勢(shì)是一種越來(lái)越普遍的計(jì)算機(jī)控制模式,用于識(shí)別手勢(shì)的傳感器類(lèi)型也在不斷增加。
本文將簡(jiǎn)要回顧了當(dāng)今手勢(shì)控制的實(shí)施方式,探討了手勢(shì)未來(lái)可能的應(yīng)用,最后對(duì)用于識(shí)別、解釋和響應(yīng)手勢(shì)的各種類(lèi)型的非視頻傳感器進(jìn)行了調(diào)查,包括電場(chǎng)感應(yīng)、激光雷達(dá)、先進(jìn)的電容技術(shù)和觸覺(jué)。
最初,所有手勢(shì)識(shí)別都依賴(lài)于實(shí)時(shí)視頻源的解釋?;镜幕谝曨l的手勢(shì)識(shí)別仍然被廣泛使用。這是一個(gè)計(jì)算密集型過(guò)程,工作原理如下:
攝像頭將圖像數(shù)據(jù)與來(lái)自深度感應(yīng)設(shè)備(通常是紅外傳感器)的數(shù)據(jù)配對(duì),輸入計(jì)算機(jī),以捕捉三個(gè)維度的動(dòng)態(tài)手勢(shì)。手勢(shì)識(shí)別軟件將捕獲的圖像數(shù)據(jù)與手勢(shì)庫(kù)進(jìn)行比較以找到匹配項(xiàng)。然后,軟件將識(shí)別出的手勢(shì)與相應(yīng)的命令進(jìn)行匹配。一旦手勢(shì)被識(shí)別和解釋?zhuān)?jì)算機(jī)要么確認(rèn)用戶(hù)想要的命令,要么簡(jiǎn)單地執(zhí)行與該特定手勢(shì)相關(guān)的命令。在復(fù)雜環(huán)境中,可以使用骨骼和面部跟蹤以及語(yǔ)音識(shí)別和其他輸入來(lái)增強(qiáng)基本視頻信息(圖 1)。
圖 1:基于攝像頭的手勢(shì)識(shí)別廣泛用于受益于非接觸式計(jì)算機(jī)控制的應(yīng)用。
(圖片來(lái)源:3D Cloud by Marxent)
汽車(chē)內(nèi)飾是基于視頻的手勢(shì)識(shí)別系統(tǒng)新興用途的一個(gè)很好的例子。當(dāng)前的汽車(chē)手勢(shì)識(shí)別系統(tǒng)使駕駛員和乘客能夠控制信息娛樂(lè)系統(tǒng)或來(lái)電,而無(wú)需觸摸按鈕或屏幕。在這種環(huán)境下,手勢(shì)識(shí)別有望提高安全性,因?yàn)轳{駛員可以使用簡(jiǎn)單的手部動(dòng)作代替復(fù)雜的菜單界面操作,使他們能夠更專(zhuān)注于駕駛車(chē)輛。
語(yǔ)音控制系統(tǒng)也可以使駕駛員能夠?qū)W⒂诘缆?,但使用起?lái)更加復(fù)雜。大多數(shù)當(dāng)前的語(yǔ)音控制系統(tǒng)不使用自然語(yǔ)言,它們需要精確的語(yǔ)音命令,并且可能涉及長(zhǎng)菜單鏈以達(dá)到所需的特定命令。由于其對(duì)用戶(hù)的簡(jiǎn)單性,手勢(shì)識(shí)別的汽車(chē)應(yīng)用有望擴(kuò)展到其他系統(tǒng),例如加熱和冷卻、室內(nèi)照明控制、遠(yuǎn)程信息處理系統(tǒng),甚至與遠(yuǎn)程智能家居系統(tǒng)的連接。系統(tǒng)結(jié)合了語(yǔ)音識(shí)別和手勢(shì)識(shí)別的最佳特性。
攝像頭安裝在基于攝像頭的汽車(chē)內(nèi)部手勢(shì)識(shí)別系統(tǒng)中,通常從天花板等高處獲得相關(guān)內(nèi)部空間的暢通無(wú)阻的視野。當(dāng)前系統(tǒng)只關(guān)注駕駛員。未來(lái),隨著車(chē)內(nèi)攝像頭數(shù)量的增加和圖像質(zhì)量的提高,監(jiān)控空間的范圍有望擴(kuò)大到包括乘客在內(nèi)。監(jiān)控區(qū)域由紅外LED或激光照亮,即使在低光照條件下也能提供最佳圖像質(zhì)量。如上所述,手勢(shì)是實(shí)時(shí)分析的,機(jī)器學(xué)習(xí)支持準(zhǔn)確性的不斷提高。BMW7系汽車(chē)識(shí)別的一些手勢(shì)如圖2所示。
圖 2:BMW Series 7 汽車(chē)中編程的手勢(shì)示例。(圖片來(lái)源:Aptiv)
電場(chǎng)手勢(shì)識(shí)別
電場(chǎng)接近感應(yīng) (EFPS) 是基于輕微導(dǎo)電的附近物體對(duì)電場(chǎng)的擾動(dòng)。EFPS 的一個(gè)實(shí)施例是一種微電子設(shè)備,它可以檢測(cè)移動(dòng)和靜止的物體,即使是非導(dǎo)電的固體材料。它通過(guò)感應(yīng)兩個(gè)天線電極產(chǎn)生的極低功率電磁場(chǎng)的微小變化來(lái)工作。它的可調(diào)范圍從幾厘米到 4 米,并且它的操作與對(duì)地阻抗無(wú)關(guān)。
EFPS 和其他電場(chǎng)傳感器提供少量數(shù)據(jù)。與光學(xué)手勢(shì)識(shí)別系統(tǒng)相比,它們更小、重量更輕,并且需要更少的功率。在另一個(gè)實(shí)施例中,手勢(shì)感應(yīng) IC 使用電極來(lái)感應(yīng)電場(chǎng)的變化并計(jì)算手指等物體的位置,提供三維位置數(shù)據(jù)并將運(yùn)動(dòng)模式實(shí)時(shí)分類(lèi)為手勢(shì)(圖3)。通過(guò)使用電場(chǎng)感應(yīng),該系統(tǒng)對(duì)光線、聲音和其他可能干擾其他 3D 手勢(shì)感應(yīng)技術(shù)操作的環(huán)境條件完全不敏感。
這種特定的 3D 手勢(shì)感應(yīng) IC 針對(duì)電池供電設(shè)備進(jìn)行了優(yōu)化,感應(yīng)電極由低壓信號(hào)驅(qū)動(dòng),可選擇 42、43、44、45 和 100 kHz 信號(hào)。由于電場(chǎng)傳感器可以穿透非導(dǎo)電材料,因此它們可以封裝在防風(fēng)雨外殼或建筑物的內(nèi)墻中。除了便攜式手勢(shì)感應(yīng)應(yīng)用外,EFPS 系統(tǒng)目前還部署在各種感應(yīng)應(yīng)用中,包括:
可以確定被抓取物體屬性的機(jī)械手汽車(chē)安全氣囊系統(tǒng)確定座位是否被占用樓宇自動(dòng)化系統(tǒng)可確定房間何時(shí)無(wú)人使用使用激光雷達(dá)
光檢測(cè)和測(cè)距 (LIDAR) 被用于為消費(fèi)和工業(yè)系統(tǒng)中的手勢(shì)識(shí)別帶來(lái)獨(dú)特的性能范圍。一個(gè)示例是基于 940 nm 不可見(jiàn)光垂直腔面發(fā)射激光器 (VCSEL) 的 LIDAR 設(shè)備,該激光器具有集成驅(qū)動(dòng)器和單光子雪崩二極管 (SPAD) 的接收陣列。該系統(tǒng)使用基于飛行時(shí)間 (ToF) 測(cè)量的多區(qū)域測(cè)距。它以集成 6.4mm x 3.0mm x 1.5mm 模塊的形式提供,其中包括 VCSEL(垂直腔面發(fā)射激光器)發(fā)射器和帶有嵌入式 SPAD 和基于直方圖的 ToF 處理引擎的接收器(圖 4)。
這種基于 LIDAR 的模塊的緊湊尺寸和低功耗有望在一系列應(yīng)用中實(shí)現(xiàn)非觸摸手勢(shì)識(shí)別的集成,包括 AR/AV 耳機(jī)、平板電腦、手機(jī)和住宅產(chǎn)品,如廚房電器、恒溫器和其他智能家居控制,以及電梯控制、交互式標(biāo)牌和票務(wù)以及自動(dòng)售貨機(jī)等設(shè)備。該傳感器可以在 4×4(16 區(qū)域)快速測(cè)距模式下提供高達(dá)每秒 60 幀的幀數(shù)。在高分辨率模式下,傳感器測(cè)量 64 個(gè)區(qū)域 (8×8)。
縮小電容式手勢(shì)識(shí)別
基于微型碳納米管紙復(fù)合電容傳感器的電容式三維手勢(shì)傳感器已被開(kāi)發(fā)用于集成游戲設(shè)備和其他消費(fèi)電子產(chǎn)品。與上一代電容式手勢(shì)傳感器相比,碳納米管紙基設(shè)備的速度提高了 10 倍,體積縮小了 100 倍,并且可以在高達(dá) 20 厘米的更大范圍內(nèi)工作(圖 5)。它們無(wú)需任何手持設(shè)備或其他設(shè)備即可識(shí)別 3D 手勢(shì),并且比紅外傳感器更快、更準(zhǔn)確。此外,它們對(duì)環(huán)境因素(如膚色和照明條件)不敏感。
圖 5:這種基于碳納米管紙的手勢(shì)識(shí)別設(shè)備比前幾代電容式傳感器快 10 倍,小 100 倍。(圖片來(lái)源:Somalytics)
相機(jī)+超聲波觸覺(jué)
專(zhuān)為 VR/AR 耳機(jī)設(shè)計(jì)的新系統(tǒng)將基于紅外攝像頭的手勢(shì)識(shí)別與觸覺(jué)反饋相結(jié)合。該系統(tǒng)使用 IR LED 照亮用戶(hù)的手,LED 的脈沖與相機(jī)幀速率同步。相機(jī)通過(guò)每個(gè)脈沖將當(dāng)前位置信息發(fā)送到處理器。處理器中的手勢(shì)識(shí)別軟件對(duì)骨骼和關(guān)節(jié)以及手部運(yùn)動(dòng)進(jìn)行建模。這使系統(tǒng)能夠準(zhǔn)確地知道拇指或手指的位置,即使它不在視線范圍內(nèi)。該系統(tǒng)可以通過(guò)編程識(shí)別各種手勢(shì),包括抓取、滑動(dòng)、捏合、推動(dòng)等。該手勢(shì)識(shí)別系統(tǒng)有一個(gè)交互區(qū)域,范圍從 10 厘米到 1 米,典型視野為 170° x 170°。
除了識(shí)別手勢(shì)外,該系統(tǒng)還知道人的手在哪里,并且可以使用該信息來(lái)控制基于超聲波的觸覺(jué)反饋。超聲觸覺(jué)系統(tǒng)基于以特定時(shí)間差觸發(fā)的揚(yáng)聲器矩陣,使聲波能夠聚焦在空間中的特定點(diǎn),例如,人手的特定部分所在的位置(圖 6)??梢愿鶕?jù)應(yīng)用程序的需要實(shí)時(shí)更改 3D 焦點(diǎn)。超聲波在焦點(diǎn)處的組合振動(dòng)產(chǎn)生了人體皮膚可以感覺(jué)到的壓力點(diǎn)。
總結(jié)
基于視頻的手勢(shì)識(shí)別仍然是最廣泛使用的手勢(shì)識(shí)別形式。它用于各種應(yīng)用,包括醫(yī)療環(huán)境和汽車(chē)駕駛室。最近,手勢(shì)識(shí)別已應(yīng)用于 AV/VR 系統(tǒng)、樓宇自動(dòng)化系統(tǒng)和機(jī)器人技術(shù)。新的手勢(shì)識(shí)別技術(shù)正在推動(dòng)手勢(shì)識(shí)別的日益增長(zhǎng)的應(yīng)用,包括電場(chǎng)感應(yīng)、基于 VCSEL 的 LIDAR 系統(tǒng)、碳納米管電容設(shè)備以及結(jié)合超聲觸覺(jué)反饋的紅外相機(jī)。
- 5G與Wi-Fi6:哪個(gè)才是連接的未來(lái)?
- 克服醫(yī)療保健數(shù)字化轉(zhuǎn)型挑戰(zhàn)的5種方法
- Meta與AppleVisionPro:誰(shuí)將主宰AR/VR市場(chǎng)?
- 800G相干技術(shù)概述
- 生成式人工智能對(duì)數(shù)據(jù)中心意味著什么
- PON光模塊演進(jìn)趨勢(shì):邁向更快、更智能的光纖接入時(shí)代
- 華為汪濤:AI全面重構(gòu)超寬帶網(wǎng)絡(luò),激發(fā)商業(yè)新增長(zhǎng)
- 全球首屆新通話(huà)×AI挑戰(zhàn)賽揭榜,華為攜產(chǎn)業(yè)伙伴獲得四項(xiàng)大獎(jiǎng)
- 谷歌推出AI模式語(yǔ)音交互對(duì)話(huà)功能;一季度全球智能掃地機(jī)器人市場(chǎng)出貨量同比增長(zhǎng)11.9%——2025年06月20日
- 中國(guó)聯(lián)通攜手華為打造5G-A x AI時(shí)代融智新品,正式開(kāi)啟AI to X新時(shí)代
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。