4月25日消息,今日,騰訊云智能小樣本數(shù)智人生產平臺首次對外發(fā)布,平臺可實現(xiàn)“自助式”數(shù)智人生產制作。
據(jù)介紹,騰訊云智能依托自研小樣本數(shù)智人驅動前沿技術框架,以及基于自監(jiān)督機制的通用多模態(tài)模型,讓用戶實現(xiàn)提交少數(shù)樣本數(shù)據(jù)進行AI訓練,例如3分鐘真人口播視頻、100句語音素材,即可獲得與真人形象、語音近似的數(shù)智人,生產周期縮短至天級別。
騰訊云智能數(shù)智人產品總經理陳磊表示,小樣本數(shù)智人支持半身、全身形象展示,手勢動作會根據(jù)內容靈活調整,也支持錄制背景任意更換,適用于直播帶貨等更廣泛的商用場景。相較于2D真人精品數(shù)字人,小樣本數(shù)智人無需專業(yè)影棚錄制素材,成本更低;相較于照片生成、僅能呈現(xiàn)面部形態(tài)的數(shù)字人,小樣本數(shù)智人可根據(jù)文本設計手勢,唇動、口型、表情復現(xiàn)真人風格。
為了加速數(shù)智人服務普及,騰訊云智能還提出自動化“AI+數(shù)智人工廠”的方向。依托騰訊云TI平臺,內置超過10項AI算法能力。未來,無需任何算法、研發(fā)經驗,只要在平臺導入視頻、語音訓練素材,即可通過“自助式”服務,完成大批量數(shù)智人形象、音色定制。
據(jù)悉,通過構建大規(guī)模高質量音色數(shù)據(jù)的預訓練基底模型,未來小樣本數(shù)智人還將支持用戶只錄制普通話,即可合成英文及方言語音。
此外,針對數(shù)智人運營,騰訊云智能提供播報數(shù)智人平臺、交互數(shù)智人平臺服務。播報數(shù)智人平臺支持通過文字、語音輸入快速生成數(shù)智人視頻;交互數(shù)智人平臺可打造“超長待機”的數(shù)智員工,可定制專屬問答庫,提供7*24小時人機雙向交互服務。同時,也可實現(xiàn)數(shù)智人直播服務,直播間7*24小時斷檔,自由切換真人語音接管,與用戶問答互動。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )