雷鋒網(wǎng)消息,今天百度研究院官網(wǎng)更新了一條新聞,但顯示需要密碼方可查看內(nèi)容。
文章標(biāo)題為《Protected: Deep Speaker: an End-to-End System for Large-Scale Speaker Recognition》。從標(biāo)題上看, Deep Speaker 應(yīng)該是百度即將發(fā)布的新一代語(yǔ)音識(shí)別技術(shù),且為一個(gè)端到端大規(guī)模識(shí)別系統(tǒng)。
雷鋒網(wǎng)第一時(shí)間聯(lián)系了百度 AI 研究院的相關(guān)人士,對(duì)方表示本次更新為百度美國(guó)研究院發(fā)起,據(jù)他了解,“主要是聲紋識(shí)別方向的進(jìn)展”。
據(jù)百度美國(guó)研究院的消息透露,這一內(nèi)容將在北京時(shí)間凌晨公布。
聲紋識(shí)別是語(yǔ)音識(shí)別里一個(gè)比較窄的分支,通過(guò)對(duì)一種或多種語(yǔ)音信號(hào)的特征分析達(dá)到對(duì)未知聲音辨別的目的,也就是說(shuō),可以通過(guò)聲紋技術(shù)判斷某句話是否為某個(gè)人所說(shuō)。聲紋識(shí)別的理論基礎(chǔ)在于每個(gè)聲音都有自己的特征,并能對(duì)不同的聲源進(jìn)行有效區(qū)分。
目前,聲紋識(shí)別的任務(wù)主要有兩種,一是聲紋確認(rèn)技術(shù),即比對(duì)兩份樣本是否為同一人所說(shuō);另一個(gè)則是聲紋識(shí)別技術(shù),即判斷某句話是樣本庫(kù)中的哪個(gè)人所說(shuō)的。
今年年初,百度小度在“最強(qiáng)大腦”中也展示了采用聲紋識(shí)別技術(shù),從一群唱歌的參與者中找到擁有說(shuō)某句話(樣本為一段簡(jiǎn)短的通話)的那個(gè)人。百度官方在接受采訪時(shí),也指出本次節(jié)目的聲紋識(shí)別難度比一般的聲紋識(shí)別要難,主要采用的是“聲學(xué)特征提取”與“說(shuō)話人特征提取”兩種方式,并用“DNN-ivector”及基于端到端深度學(xué)習(xí)的說(shuō)話人信息提取算法進(jìn)行訓(xùn)練和鑒別。
此前雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))曾經(jīng)報(bào)道過(guò)百度在語(yǔ)音技術(shù)上的進(jìn)展。語(yǔ)音識(shí)別層面上,百度早在2010年就已經(jīng)進(jìn)行智能語(yǔ)音及相關(guān)技術(shù)研發(fā)。并從2012年開(kāi)始逐步采用 DNN、Sequence Discriminative Training(序列區(qū)分度訓(xùn)練)、 LSTM 模型、CTC 及 Deep CNN 等神經(jīng)網(wǎng)絡(luò)進(jìn)行語(yǔ)音的相關(guān)研究。在語(yǔ)音識(shí)別領(lǐng)域,百度相繼于 2014 年及2015 年年底發(fā)布了 Deep Speech 和Deep Speech 2,并憑借深度語(yǔ)音識(shí)別技術(shù)于2016 年入選 MIT 十大突破技術(shù)。基于 Deep Speech 2 ,2017年百度推出了一款基于人工智能的轉(zhuǎn)錄應(yīng)用 SwiftScribe。而在語(yǔ)音合成上,百度于今年正式推出 Deep Voice,一個(gè)實(shí)時(shí)語(yǔ)音合成的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。
那么,本次如此神秘的 Deep Speaker 到底有哪些重大的更新,它又可能在哪些方面有所突破?雷鋒網(wǎng)將會(huì)及時(shí)跟進(jìn)消息。
- 全球智能攝像頭市場(chǎng)增速放緩,小米逆勢(shì)增長(zhǎng),中國(guó)廠商主導(dǎo)新格局
- 飛利浦 Hue 美漲價(jià):關(guān)稅壓力下的市場(chǎng)挑戰(zhàn)
- 小米AI眼鏡:科技與生活的無(wú)縫連接,1999元起探索未來(lái)新視界
- 小米 AI 眼鏡打破常規(guī),驍龍 AR1+BES2700H雙芯方案引領(lǐng)科技新潮流
- 2025惠普商用AI戰(zhàn)略暨AI PC新品發(fā)布,智領(lǐng)辦公新未來(lái)
- 智能眼鏡散熱新革命:xMEMS“芯片風(fēng)扇”來(lái)勢(shì)洶洶,明年初量產(chǎn)引領(lǐng)行業(yè)新風(fēng)向
- 揭秘AI硬件新動(dòng)態(tài):OpenAI與Jony Ive秘密研發(fā)非穿戴設(shè)備
- 小米智能門鎖2大屏貓眼版上架:實(shí)用又時(shí)尚,指紋識(shí)別+智能貓眼,價(jià)格親民!
- 小米新品米家恒溫電水壺3:實(shí)用與設(shè)計(jì)并存,兼顧溫度與容量,親民價(jià)格值得關(guān)注
- vivo WATCH 5 eSIM 版即將發(fā)布,專業(yè)網(wǎng)球模式解鎖,運(yùn)動(dòng)健康新篇章
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。