原標(biāo)題:OPPO的航船:小布生命體將駛向怎樣的科技彼岸?
智能助手走進(jìn)人類生活已達(dá)十年之久。在某彈幕網(wǎng)站,我很喜歡看用戶“調(diào)戲”各種智能助手,問它們一些奇葩的問題,讓它們替自己接電話,每次都能讓人忍俊不禁。同時,看著大家吐槽智能助手依然“人工智障”,也難免有一絲遺憾。
數(shù)字技術(shù)不斷進(jìn)步,智能助手及其產(chǎn)業(yè)是否還有新的機(jī)會,能否迎來向前進(jìn)一步的發(fā)展契機(jī)?在今年的OPPO開發(fā)者大會上,我們看到小布助手呈現(xiàn)出的更多可能性。
基于“端云一體的數(shù)智大腦”Andeverse的技術(shù)能力,小布助手在元空間發(fā)布會上,打造出了一個虛實共生的數(shù)字平行世界,重磅發(fā)布4.0年度版本,集成小布空間等多個創(chuàng)新產(chǎn)品功能,讓用戶得以提前領(lǐng)略虛實融合的數(shù)字體驗。
(OPPO數(shù)智工程事業(yè)部總裁劉海鋒的數(shù)智人亮相小布元空間發(fā)布會)
從中,我們能讀到OPPO在人工智能、虛擬數(shù)智人等領(lǐng)域的技術(shù)突破,同時,也可以把握移動生態(tài)和移動交互在新背景下的脈動,當(dāng)用戶們開始熟悉并喜愛智能助手,依賴其完成更多生活體驗,小布如同一艘航船,正在成為更多人前往數(shù)智新世界的載具。
小布從來沒有停止過進(jìn)化,也代表了智能助手的持續(xù)探索,與我們每個人有著千絲萬縷的聯(lián)系。讓我們從小布的進(jìn)化路線圖出發(fā),一窺數(shù)智人的彼岸風(fēng)景。
渡海:不斷上升的海平面
首先需要明確一下,為什么智能助手的進(jìn)化,是理解數(shù)智未來的一個重要參照點?;仡櫃C(jī)器智能的歷史,早在上個世紀(jì),機(jī)器人專家漢斯·莫拉維克就繪制了“人類能力地形圖”,中低地代表著“算數(shù)”和“死記硬背”,丘陵代表著“定理證明”和“下象棋”,高聳的山巒代表著“運動”“手眼協(xié)調(diào)”和“社交互動”。隨著人類對機(jī)器智能的不斷推進(jìn),海平面也在逐漸上升,低處的人類能力開始不再獨特,逐漸地,一些更高級的能力也可以由智能生命來完成。比如隨著預(yù)訓(xùn)練技術(shù)的發(fā)展成熟,機(jī)器對話在某些場景下甚至達(dá)到了類人的水平。
技術(shù)不斷拓展著人工智能的能力,智能助手的智慧程度近年來也取得了很大的發(fā)展,也意味著智能生命體將在我們的生活中扮演越來越重要的角色,熟悉并掌握數(shù)智生活已經(jīng)不再是一種選擇,而是一種必備的生活技能。因此漢斯·莫拉維克提出:我們應(yīng)該建造一艘方舟,盡快適應(yīng)航海生活!
智能助手作為連接物理世界和數(shù)字世界的交互入口,很適合成為那艘普羅大眾都可以搭乘的數(shù)智航船。
造舟:AI支撐下的小布身心靈進(jìn)化
渡過時代之海,我們首先要看看小布助手4.0這艘航船究竟是怎樣建成的,有怎樣的能力。
小布4.0版本全新升級的5大能力,從主動式智能到情感化交互,再到數(shù)智多模態(tài)、智慧新體驗和多設(shè)備協(xié)同。從技術(shù)角度出發(fā),我們可以將其歸納為三個方面,構(gòu)成了小布助手4.0這一生命體的核心。
靈魂:漢斯·莫拉維克認(rèn)為,社交互動、情感交互等是人類最高級的能力之一,也是“人類能力地形圖”中尚未被淹沒的山巔。而小布作為OPPO AI應(yīng)用的集中體現(xiàn),4.0全新版本正在不斷抵達(dá)這些山峰,表現(xiàn)出更加智慧的一面。
智慧是一種抽象的、虛無縹緲的東西,機(jī)器要展現(xiàn)出類人般的智能,理論上要從三個角度完成進(jìn)化:一是記憶,人類能夠把很多長期狀態(tài)的信息編入大腦的算法內(nèi),在未來某一天來調(diào)用它,而穩(wěn)定的長期記憶是機(jī)器智能的一大挑戰(zhàn),表現(xiàn)在智能助手上,就是難以在多輪對話中流暢而自然地交流;二是計算,人腦的并行計算能力非常強(qiáng)大,擅長解決復(fù)雜的任務(wù),如分析、決策。在算法和算力的快速發(fā)展下,AI也開始在決策智能上展現(xiàn)出類人的能力,讓智能助手得以從“命令式被動響應(yīng)”進(jìn)化為“貼心式主動服務(wù)”;三是學(xué)習(xí),IBM的深藍(lán)計算機(jī)在1997年戰(zhàn)勝國際象棋冠軍加里·卡斯帕羅夫時,最大的優(yōu)勢是記憶能力和計算能力,到了2016年AlphaGo擊敗李世石,深度學(xué)習(xí)讓機(jī)器實力有了實質(zhì)性的飛躍。擁有學(xué)習(xí)能力之后,智能助手能夠自我進(jìn)化與迭代,解決互動程式化、類人感低的問題。
具體到小布助手4.0版本中,我們已經(jīng)可以看到在記憶、計算、學(xué)習(xí)這三個層面,小布正在帶來真實可感的體驗變革。
記憶方面,適當(dāng)?shù)挠洃洓Q定了智能助手的交互體驗是否自然順暢。對于人類來說,根據(jù)之前的信息來作出即時反應(yīng),幾乎是一種本能,根本不需要特別調(diào)動記憶模塊,但這么簡單的事對于AI智能體來說卻是很困難的。在長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)出現(xiàn)之前,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)沒有記憶功能,無法處理較長序列數(shù)據(jù),簡單來說就是記不住長距離數(shù)據(jù)的信息,表現(xiàn)在智能助手身上,用戶跟它說完“吃完晚飯跟我聊會兒天”,它還會問一句“吃了沒”,妥妥地煞風(fēng)景。要避免用戶說“前門樓子”AI說“胯骨軸子”這種前言不搭后語的情況,就需要智能助手很好地理解上下文,以此來生成更自然、情感化的表達(dá),這就離不開強(qiáng)大的記憶能力。所以,研究人員特別為小布研發(fā)了記憶能力,讓AI在聊天過程中能夠理解一些更長距離的關(guān)鍵數(shù)據(jù),不至于學(xué)過就忘,從而生成有趣、有用的聊天內(nèi)容,用戶不必反復(fù)強(qiáng)調(diào)一些說過的內(nèi)容,人機(jī)交流也就更加輕松愉快。有了記憶,智能助手才有了可持續(xù)成長的人格化基礎(chǔ)。
計算方面,在端側(cè)算力的支持下,小布助手得以搭載更強(qiáng)大的算法應(yīng)用,基于自研的情感識別算法,讓小布助手具備智趣單輪、技能引導(dǎo)、話題多輪、情緒感知等基礎(chǔ)能力,再引入較為前沿的預(yù)訓(xùn)練技術(shù),通過1億~10億參數(shù)級別的大模型來提升語言理解的泛化能力,緩解因“意圖理解不到位”而造成的“智障”問題。同時,注重AI與知識計算的結(jié)合,構(gòu)建了精品知識圖譜,規(guī)模達(dá)到億級別的實體和百億級別的關(guān)系,讓小布具備足夠的知識儲備,能夠解答用戶各種各樣的疑問,在知識問答方面帶來了2%~4%的效果提升。一番技術(shù)打磨之下,小布助手對于口語化表達(dá)的理解、用戶意圖的分析、有溫度的情感化交互,就得到了有效的提升。
不止于此,小布助手還能夠準(zhǔn)確判斷用戶需求、結(jié)合上下文場景,進(jìn)而主動提供服務(wù)。將數(shù)字服務(wù)的各個“斷點”串聯(lián)起來,讓服務(wù)呈現(xiàn)連貫性,用戶感受到的是符合行為慣性的絲滑與順暢,比如感知到用戶的出行需求后,小布會在用戶出行前就提供行李準(zhǔn)備、酒店預(yù)訂、交通情況、防疫政策等基礎(chǔ)提醒,提前為旅程做好充分的準(zhǔn)備。
學(xué)習(xí)方面,小布更智慧的一面還體現(xiàn)在持續(xù)學(xué)習(xí)和發(fā)展進(jìn)化的能力上。對內(nèi),小布會根據(jù)用戶的行為反饋不斷學(xué)習(xí)進(jìn)化,變得越來越“懂你”:如果發(fā)現(xiàn)用戶的需求沒有被滿足,會反復(fù)修改自己的話術(shù)進(jìn)行重試;收到用戶的表揚,也會根據(jù)口碑滿意度體系來進(jìn)一步優(yōu)化,持續(xù)提升自己。對外,小布會持續(xù)學(xué)習(xí)多場景、跨終端帶來的數(shù)據(jù)資源,不斷擴(kuò)展自身的能力邊界和服務(wù)場景。比如通過場景理解,支持一句話多指令,讓查天氣、定鬧鐘、打電話等常規(guī)服務(wù)更加便捷高效,只需對小布說一句“打開健康碼”指令,能省去手動操作的一系列繁瑣流程。另外,小布可以支持手機(jī)、手表、電視、Pad等OPPO自有設(shè)備控制,以及小布生態(tài)的第三方品牌,跨端、跨設(shè)備執(zhí)行指令,打破了數(shù)據(jù)壁壘,既讓用戶享受到全場景服務(wù)無縫切換的絲滑;又能夠通過多終端數(shù)據(jù)協(xié)同反哺算法,為小布助手的自主學(xué)習(xí)提供多維度的數(shù)據(jù)養(yǎng)分,進(jìn)一步提升小布的智慧水平和服務(wù)能力。
沿著記憶、計算、學(xué)習(xí)的路線圖,小布正一步步向“人類能力地形圖”的山巔攀爬。
身體:很長一段時間以來,智能助手都如同科幻電影《HER》中的女主角一樣,只有語音而沒有形體,近年來隨著數(shù)智技術(shù)的進(jìn)步,一些智能助手開始整合語音交互、自然語言理解、圖像識別等AI能力,外觀形象變得更加鮮活,比如微軟小冰、OPPO小布、騰訊云小微等……今年的小布也在技術(shù)支撐下進(jìn)一步迭代。
一方面,小布4.0進(jìn)行了互動層面的全新升級,支持用戶通過手機(jī)屏幕的多點觸控,與數(shù)智人實時互動,如可以戳戳小布的肚子、摸摸小布的頭和屁股,小布數(shù)智人都可以給出相應(yīng)的反饋。小布4.0版本推出的小布數(shù)智人3D聊天功能,則更進(jìn)一步,通過3D場景、AI驅(qū)動的數(shù)智人和故事設(shè)定,支持多模態(tài)互動的同時,還能創(chuàng)造出真實自然的聊天場景,識別用戶情緒,讓用戶獲得以聊天互動為主、兼具游戲娛樂的沉浸式聊天新體驗。
另一方面,小布空間為數(shù)智人提供了交互的場域,更具沉浸感和互動趣味。盡管XR設(shè)備尚未普及應(yīng)用,但OPPO已經(jīng)基于小布助手APP打造了虛實融合的元空間概念產(chǎn)品,讓用戶可以在手機(jī)界面下體驗虛實融合的魅力。小布空間支持用戶在其中創(chuàng)建自身形象,3D視覺效果和真實角色設(shè)置讓數(shù)字生活更具沉浸感和真實感,運用“第二分身”與數(shù)智人和真人在廣場社交互動,解鎖更多創(chuàng)新玩法,比如一起去展廳觀看會議直播,足不出戶完成線上參會等,提前體驗“模擬人生”。
物理學(xué)家邁克斯·泰格馬克提出,1.0版的生命,其硬件和軟件都是靠進(jìn)化獲得的,無法改變。而以人工智能為代表的生命3.0階段,生命不僅可以自行設(shè)計軟件(文化),還可以自行設(shè)計硬件(身體),從碳基走向硅基。顯然,小布數(shù)智人所表現(xiàn)出的“身體”形象的可設(shè)計、可塑造,正是智能生命向3.0階段發(fā)展的必然過程,也讓我們提前感受到了與硅基生命互動的樂趣。
OPPO“科技為人”的理念,推動了小布助手身心靈向更智慧的方向發(fā)展迭代,成為秀外慧中的智能生命。有了堅實的身心基礎(chǔ),也就有了進(jìn)一步探索虛實融合未來的底氣。
啟航:數(shù)智世界的技術(shù)彼岸
夯實智能助手的能力只是第一步,此次創(chuàng)新的第二個價值點在于:數(shù)智人的世界探尋。
客觀而坦率地說,移動互聯(lián)網(wǎng)發(fā)展了十多年,用戶對于人機(jī)交互的新鮮感也極大下降,大家渴望新體驗,而新體驗必將建立起移動終端市場的新秩序。而當(dāng)下,技術(shù)指向已經(jīng)十分明顯,那就是一個被反復(fù)提及的名詞——虛實融合。
此次OPPO開發(fā)者大會,可以很清晰地看到OPPO對技術(shù)路徑和產(chǎn)業(yè)方向的判斷,小布元空間發(fā)布會打造一個現(xiàn)實世界與虛擬世界相互交織、自然融合的交流共享空間,小布4.0集感知和交互為一體的視覺效果。
沿著小布助手和數(shù)智人的航線,究竟會駛向一個怎樣的技術(shù)彼岸?從OPPO的舉措,我們可以看到三個正在被釋放出的紅利。
1.技術(shù)紅利。數(shù)智人的應(yīng)用場景不斷拓展,但技術(shù)門檻依然高企,一個具備高互動性的數(shù)智人,需要領(lǐng)先的AI算法來對唇形、表情、動作等進(jìn)行生成和驅(qū)動,比如NLP算法生成的語句要跟口型精密匹配,才能讓用戶有跟真人對話的既視感。要讓交互不枯燥,有新鮮感,不能來來回回就是幾個固定動作,就需要GAN生成算法等參與構(gòu)建并驅(qū)動數(shù)智人的動作。數(shù)智人要進(jìn)入銀行、醫(yī)院、學(xué)校、高鐵站等各種場景提供服務(wù),不可能所有企業(yè)都要靠自己來研發(fā)基礎(chǔ)能力,通過小布數(shù)智人平臺和OPPO開放生態(tài)合作,避免在底層技術(shù)上反復(fù)造輪子,能夠降低技術(shù)門檻,加速數(shù)智人的產(chǎn)業(yè)化進(jìn)程。
2.產(chǎn)業(yè)紅利。隨著多模態(tài)人機(jī)交互被廣泛接受,對數(shù)智人的產(chǎn)業(yè)需求也越來越多,但個性化外形和技能呈現(xiàn),需要美術(shù)設(shè)計、3D建模、骨骼綁定、貼圖捏臉等一系列操作,高企的制作門檻阻礙了數(shù)智人的規(guī)?;涞?。目前,小布也在數(shù)智人平臺沉淀了相應(yīng)的能力,提供個性化、高表現(xiàn)力、多場景的數(shù)智人服務(wù),減少落地應(yīng)用門檻,助力數(shù)智人深入到B端市場的更多場景。
3.生態(tài)紅利。豐富繁榮的數(shù)智人應(yīng)用與服務(wù),離不開個人開發(fā)者和企業(yè)開發(fā)者的創(chuàng)新智慧,讓開發(fā)者的創(chuàng)意和精力快速轉(zhuǎn)化為商業(yè)回報,OPPO在AIoT領(lǐng)域的全面布局和生態(tài)建設(shè)提供了豐沃的成果轉(zhuǎn)化土壤,前面提到小布助手支持手機(jī)、手表、電視、Pad等OPPO自有設(shè)備控制,也支持第三方品牌,覆蓋全品類硬件,這意味著相關(guān)應(yīng)用和服務(wù)能夠在多端部署、覆蓋OPPO生態(tài)內(nèi)的用戶,開發(fā)者借助OPPO收獲商業(yè)價值,又進(jìn)一步吸引更多人共建虛實融合的數(shù)智世界,OPPO創(chuàng)新生態(tài)也就進(jìn)入了良性循環(huán)。
不難看出,隨著小布助手的潛力不斷釋放,未來不僅僅會在OPPO萬物互融的生態(tài)體系中,扮演交互入口的重要角色,還將在整個移動生態(tài)內(nèi)擴(kuò)散智能生命體的價值,成為更多企業(yè)和用戶與數(shù)字世界的交接點。萬物互融、虛實融合的大趨勢下,小布的存在價值正前所未有地顯現(xiàn)出來。
未來生命研究所的邁克斯·泰格馬克認(rèn)為:有人工智能相伴的生命未來是我們這個時代最重要的對話。小布助手正帶著我們參與到與AI生命溫暖而有趣的對話中,有理由相信,生于這個人工智能極大發(fā)展時代的人們,都應(yīng)該與智能助手共同成就更好的彼此。
一段精彩的旅程正等待著我們揚帆出海,不妨從一句“小布小布”開始吧。
- 世間將再無松下電視:松下官宣解散家電子公司并徹底放棄電視機(jī)業(yè)務(wù)
- 雅迪集團(tuán)與南都電源簽署協(xié)議:攜手共繪固態(tài)電池未來藍(lán)圖
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。