7月4日- 5日,2018百度AI開發(fā)者大會在北京國家會議中心隆重舉行,大會上展示了眾多落地化成果。此次大會上百度首次舉辦AI設(shè)計論壇,百度設(shè)計體驗委員會主席、百度人工智能交互設(shè)計院院長、百度用戶體驗中心總經(jīng)理關(guān)岱松及設(shè)計團隊分享了百度在AI設(shè)計和用戶體驗方面的經(jīng)驗及思考,共同交流AI智能美學(xué)及創(chuàng)意等方面的最前沿發(fā)展。論壇上百度與湖南大學(xué)的戰(zhàn)略合作正式啟動,整合百度在AI交互設(shè)計領(lǐng)域的優(yōu)勢和湖南大學(xué)先進的科研能力,雙方將共建聯(lián)合創(chuàng)新實驗室及博士后基地,在AI設(shè)計領(lǐng)域進行更多更有價值的合作與探索。
百度人工智能交互設(shè)計院自成立以來,圍繞智能語音交互界面設(shè)計節(jié)點開展了大量人因工程實驗,分享了一系列的研究結(jié)論,這些結(jié)論已經(jīng)被寫入DuerOS的設(shè)備準出準入規(guī)范和設(shè)計指導(dǎo)原則之中,幫助DuerOS和開發(fā)者打造更符合人的需求和習(xí)慣的語音交互流程。進入人機交互研究的2.0階段,百度人工智能交互設(shè)計院分享了他們在外觀、自然交互、情感交互等領(lǐng)域的前沿探索案例,將AI時代做研究的方法升級,打造類人交互的智能體。
以下為演講實錄:
大家好,我是百度AI交互設(shè)計院的研究員李璇,去年11月百度成立了行業(yè)內(nèi)第一個交互設(shè)計研究機構(gòu),很高興借此機會跟大家分享我們的研究成果。面對AI時代為人機交互帶來的巨大變化,如何通過研究引領(lǐng)交互設(shè)計,這是我們持續(xù)在探索的問題,而我們找到的答案,是人因工程。
什么是人因工程?通俗地說就是我們做設(shè)計,要把人知道的、不知道的自己,以做工程的思維,精準、量化、全面地研究得透透的,然后運用給到設(shè)計中。
人因工程不是一個全新的領(lǐng)域。在工業(yè)時代,人使用機器來提高生產(chǎn)效率,人機互動是純物理的機械互動,人因工程研究的是人生理各方面的閾限,基于這些閾限做出在人可以承受的范圍內(nèi)效率最大化的設(shè)計。
在信息時代,人使用機器的替代一部分的認知勞動,人機互動是虛擬的認知交流,人因工程研究人的認知規(guī)律,來優(yōu)化信息傳遞。
過去,人因工程奠定了對人體特征、認知規(guī)律進行研究和并運用于設(shè)計的基礎(chǔ),到了AI時代,因為人機交互方式和關(guān)系的變化,人因工程又有了新的延伸。
首先,AI技術(shù)讓機器越來越像人,機器可以通過語音、手勢、眼神等人類最自然的方式與人進行交流,甚至開始被賦予人的外形。人類不再需要去適應(yīng)機器,而是機器適應(yīng)人。其次,AI技術(shù)讓機器越來越懂人,機器不僅懂我們的語言、肢體,甚至懂我們的動機、文化。此外,當機器越來越像人的時候,人機關(guān)系也會發(fā)生變化。人們過去對機器是冷冰冰的,但現(xiàn)在會將越來越多對人的情感、需求和預(yù)期都投射到機器上,機器帶給人的體驗變得更加復(fù)雜。
所以,AI時代的人因工程,將不僅僅關(guān)乎人的能力、行為、限制和特點,也關(guān)乎社會、文化和心理,是真正以人類為中心的系統(tǒng)工程。那么在這樣的方法論和研究范疇中,我們具體在怎么做呢?
1.0將智能語音作為新交互方式,定義語音交互標準
對于人來說,語音對話是最自然、最高效的交流方式,語音交互是AI時代新交互形態(tài)的開端,但其實整個行業(yè)對語音交互設(shè)計還有很多疑問,為此,定義語音交互的體驗標準是我們工作的開始。
首先,我們梳理出五個節(jié)點,通過喚醒、響應(yīng)、輸入、理解、輸出,人和機器完成每一次的語音對話,為了打造好的語音對話體驗,每一個節(jié)點都會對應(yīng)很多設(shè)計要點需要被研究和定義。我們系統(tǒng)地梳理每個節(jié)點下的設(shè)計要點,并在這個框架下去逐步開展精細的實驗,以確定最優(yōu)的機器參數(shù)和反饋水平。比如從聲學(xué)角度,研究了什么樣的聲音好聽、怎么樣的喚醒詞好發(fā)音;從語言學(xué)角度,研究機器和人對話,什么樣的話術(shù)好;從視覺認知角度,研究不同距離下的字號顯示……最終我們輸出了一系列的研究結(jié)論,并應(yīng)用到了DuerOS的設(shè)備準出準入規(guī)范和設(shè)計指導(dǎo)原則之中,幫助DuerOS和開發(fā)者們打造更符合人的需求和習(xí)慣的語音交互流程。
2.0打造類人交互的智能體
在完成了對大部分語音交互節(jié)點的研究后,我們開始更加深入地去思考如何在此基礎(chǔ)上,讓人機交互更加類人,讓人在面對AI產(chǎn)品的時候更加感知到它是一個智能體而不僅僅是機器。圍繞這一點,在這里想跟大家分享我們認為在不久的未來比較重要的三個方面。
外觀
首先,我們認為作為一個智能體,外觀很重要,它影響著人對AI產(chǎn)品的第一印象和預(yù)期。圍繞外觀,可研究的問題有很多,而經(jīng)常被爭論的一個問題是,智能產(chǎn)品是否應(yīng)該像人及多大程度上像人,即擬人度的問題,分享一點我們的研究。
我們將擬人度分為面部擬人和全身擬人進行拆解,然后通過實驗去研究用戶對不同擬人度的認知和喜好度,得到了一些有趣的結(jié)果。
比如在臉部造型上,兩個眼睛或兩個眼睛加鼻子的五官設(shè)計是相對比較保險的,增加嘴巴容易形成兩極分化,說非常喜歡和非常不喜歡的比例都會增高,所以如果我們要進行擬人的臉部設(shè)計,對是否要“嘴巴”需要慎重。在全身擬人的設(shè)計上,“手”是一個關(guān)鍵部位,如果想要進行全身的擬人,最好將手帶上。
這只是探討外觀的其中一項研究,我們還研究智能產(chǎn)品的設(shè)計風(fēng)格、材質(zhì)、尺寸、形狀等等,并探得了人們對于不同智能產(chǎn)品的外觀的認知要點和心理原型。
自然交互
在當下語音交互體驗持續(xù)優(yōu)化的基礎(chǔ)上,我們認為走向自然交互是人機交互方式的發(fā)展趨勢。所謂的自然交互是以人為中心,參照人類信息輸入輸出通道的交互方式。人類通過視、聽、觸、味、嗅接收信息,通過文字、語音、肢體、眼神、表情等來進行表達。
在人的信息接收方面,視覺和聽覺能夠滿足90%以上的信息需求。所以,機器在自然交互中的信息輸出,最重要的是解決如何有效的讓視覺和聽覺信息相互配合的問題。在這個方面,我們借助眼動儀對用戶視覺資源分配情況進行了量化研究,衡量了不同設(shè)計方案中視聽信息的配合情況。
在人的信息表達方面,語言結(jié)合肢體,尤其手勢是人類最常見、也最自然的表達方式。雖然人們在生活中經(jīng)常使用手勢,但如何將人類自然手勢轉(zhuǎn)化為人機交互語言,目前沒有成熟的交互方案,大家都還沒有經(jīng)驗。
我們邀請用戶來到實驗室,去觀察要實現(xiàn)各種操作時,用戶最自然的手勢反應(yīng)。我們得到了近800個手勢,根據(jù)通用性和可理解性進行篩選,形成一套最優(yōu)手勢集。然后,借助綠野仙蹤的方法,也就是通過后臺人為操作來實現(xiàn)的用戶體驗手勢交互效果,我們讓用戶擺脫遙控器,用語音和手勢來操控設(shè)備,借助腦電、肌電等技術(shù)對操作過程中的情感體驗、心理負荷及操作疲勞進行測量,我們?nèi)ズ饬拷换ゲ僮鞅澈蟮淖匀惑w驗,最終篩選出在不同情境和操作下手勢和語音配合最優(yōu)的設(shè)計方案,也應(yīng)用到了DUEROS的設(shè)計中。
對于自然交互,我們還會去探討更多的感知覺通道,來完善自然交互的設(shè)計。語音交互還是自然交互,對于機器來說都是交互通道的問題,觸碰的是人的感知覺。而繼續(xù)進化的下一步,我們認為是情感交互。這將是一個很大的飛越,它讓機器可以觸碰人的內(nèi)心。
情感交互
情感交互是讓機器具有類似人一樣觀察、理解和表達情緒的能力,而要做到這一點,機器需要對人情緒進行準確地識別和合理的應(yīng)對。
人與人進行交流時,通過表情、內(nèi)容、語氣語調(diào)、肢體四個通道來表達和接受情緒情感。達爾文說過,能夠從表情中識別情緒從而對對方的行為作出預(yù)判,是動物得以生存進化的重要技能。為此表情無疑是最主要也最被廣泛研究的,讓機器識別人類情緒的重要課題,我們正在進行這方面的研究。
在情緒應(yīng)對方面,我們研究高情商的人怎么應(yīng)對憤怒、挫敗等負面情緒,研究咨詢師怎么開導(dǎo)痛哭流涕的來訪者,研究好朋友和陌生人在表達關(guān)心時候的差別,從中提取好的應(yīng)對策略賦予機器。為了驗證這些應(yīng)對策略,我們在實驗中通過VR模擬場景誘發(fā)用戶的情緒,然后讓AI去平復(fù)。關(guān)于情緒識別和應(yīng)對的研究,也應(yīng)用到了機器人的交互設(shè)計之中,期待未來跟大家分享更多。
最后,作為專注于研究的團隊,我們還想分享在面對這些全新領(lǐng)域時,研究方法上的一些心得。
第一,因為研究領(lǐng)域越來越前沿,我們需要在研究中去創(chuàng)造體驗交互和場景。
第二,由于我們追求的是更加多元、立體的體驗,我們需要越來越多的引入生理測量來度量交互體驗,目前腦電、肌電和眼動是相對成熟的工具。
第三,人臉、聲紋、語氣等識別技術(shù)幫助我們獲得大量隱藏在行為背后的數(shù)據(jù),如用戶的情緒、需求、動機等,而大數(shù)據(jù)的運算幫助我們構(gòu)建常模。
過去我們?yōu)榛A(chǔ)語音交互定義標準,未來我們將投入更多的精力去打造能夠進行自然交互、情感交互的智能體。
而基于心理學(xué)對人的構(gòu)建,認知、情感和意志,所以在更超前的地方,我們還可以研究探討如何賦予機器意志、讓他可以有目的、有動機地進行主動交互,以及在類人互動下的人機關(guān)系,甚至人和機器兩個物種之間的倫理問題。
未來的路還很長,百度AI交互設(shè)計愿意與大家進行持續(xù)的交流和探討,一起成為AI交互設(shè)計領(lǐng)域的開路者和探路者。謝謝大家!
- 為什么年輕人不愛換手機了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應(yīng)欠薪有補償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進,核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。