9月27日消息,奇富科技受邀出席在希臘舉辦的國際語音通信與信號處理頂級會議——INTERSPEECH 2024,并發(fā)表了題為/Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition/的主旨演講,全面展示了其在語音識別技術(shù)領域的成就,為中國語音技術(shù)走向世界、參與全球競爭樹立了新的標桿。
奇富科技介紹了可同時支持20多種方言的新一代奇富語音識別系統(tǒng)“QiFree”,這是國內(nèi)金融行業(yè)內(nèi)字錯率最低的中文語音識別系統(tǒng)。在中文口音與方言語音識別領域的權(quán)威測試集KeSpeech的對比中,奇富科技憑借其在自動語音識別(Automatic Speech Recognition, ASR)領域的深厚積累,實現(xiàn)了方言口音分類準確率的顯著提升,達到了79.10%,遠超KeSpeech的基線水平61.13%。同時,在衡量識別錯誤率的關(guān)鍵指標——CER(Character Error Rate, 字符錯誤率)上,奇富科技更是以8.08%的成績,遠優(yōu)于KeSpeech的10.38%,展現(xiàn)了其在中文方言識別領域的高效與精準。
奇富科技“QiFree”性能效果與KeSpeech Baseline對比
奇富科技自研的中文語音識別系統(tǒng)“QiFree”,打破了單一模型只能識別特定單一方言的困境,通過創(chuàng)新的層自適應融合結(jié)構(gòu),借助共享信息編碼模塊更高效的提取方言信息,實現(xiàn)了即說即譯,進一步增強了語音機器人的實時交互能力。值得一提的是,“QiFree”不僅在普通話識別領域的CER上保持領先地位,更在冀-魯、江淮、膠-遼、蘭-銀等多個方言區(qū)域的識別性能上,相比過往最佳成績實現(xiàn)了超過15%的顯著提升。這一突破性成果得到了INTERSPEECH三位獨立審稿人的高度認可,他們一致認可奇富科技論文《Qifusion-Net:基于特征融合的流式/非流式端到端多口音語音識別框架》所展現(xiàn)的系統(tǒng)框架創(chuàng)新性與識別性能的卓越表現(xiàn),并一致授予其“ACCEPT”的評定。
資料顯示,INTERSPEECH是全球語音科學界最負盛名的年度會議之一,匯聚了來自世界各地的頂尖學者、研究人員及行業(yè)領袖,共同探討語音技術(shù)的最新進展、挑戰(zhàn)與未來趨勢。這一平臺不僅代表了語音技術(shù)領域的最高學術(shù)水平,也是新技術(shù)、新理念交流與碰撞的絕佳場所。
- 《黑神話:悟空》PS5國行版將于6月18日正式發(fā)售,建議零售價268元起
- 報告:2029年美國AI搜索廣告支出將達260億美元,占比13.6%
- 重塑內(nèi)生安全體系 實現(xiàn)AI時代安全突圍 ——2025北京網(wǎng)絡安全大會(BCS)開幕
- 門禁憑證技術(shù)進化簡史:開啟更加安全和便利的未來
- Google I/O 大會:科技盛宴,引領未來創(chuàng)新潮流
- 馬蜂窩端午出行大數(shù)據(jù):短途周邊游是主流,非遺民俗關(guān)注度持續(xù)走高
- 微軟裁員6000人原因揭曉 AI沖擊首當其沖
- 騰訊音樂2025Q1業(yè)績持續(xù)高質(zhì)量增長:在線音樂服務收入達58億元,同比增長15.9%
- 硅谷巨頭庭審吐真言:未來10年Meta、谷歌搜索、iPhone或成歷史
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。