不論是“勒是霧都”的重慶,還是遍地“靚女靚仔”的廣東,“吳儂軟語”的江浙,方言都是各地極具特色文化名片。一方面,方言附著極大的親切感,另一方面,方言也承載著各地強烈的情感認同與文化價值。
科技發(fā)展中的語言交流,不能遮蔽地方性的文化和知識。
考慮方言識別存在文化保護的更高立意,同時也在將老年、弱勢群體并入科技生活。思必馳放大全鏈路語音系統(tǒng)應用在方言的識別、理解、合成上,在家居、銀行大廳等應用場景落地,形成了能聽懂“方言”的醫(yī)療陪伴音箱、智能客服機器人等多樣化的產品,可識別粵語、四川話等多種方言。
語音識別的“軟肋”-口音、方言
語音識別好比機器的“聽覺系統(tǒng)”,讓機器通過識別、理解,將語音信號轉變?yōu)榭衫斫獾奈谋?。漢語語音識別的研究起始于70年代,經歷四十余年發(fā)展,得益于技術的演進和海量數據的積累,一般場景下普通話識別都能達到較好的識別效果。但“口音、方言”仍是全球諸多人機交互公司共同面對的挑戰(zhàn)。
為了探究方言、口音對語音識別系統(tǒng)的影響,2018 年華盛頓郵報,Globalme 、Pulse Labs (語音研究公司)合作,對市場主流智能音箱進行測試,事實證明智能音箱不能對方言“通吃”。
方言識別究竟難在哪?
多音多義,使用情境各不同。以中文為例,不僅是在文字使用習慣上(例如,“老后悔了”),讀音上也存在差異性(“插”讀“擦”,“胡”讀“福”)。標準普通話由21個聲母和39個韻母組成,上海方言中卻包含34個聲母和54個韻母,不同方言就是不同數量的聲韻母組合。同時,語音識別是一個強場景關聯的技術,不同使用情境,方言識別效果存有差異。針對性的聲學模型+語言模型訓練是一個長期的過程。
需要豐富的語料用以訓練。可以理解為機器的“詞匯量”,思必馳基于多年語音交互領域的研究,積累了大量基于場景化的數據,銖積寸累地汲取方言語料,不斷更新、完善語音數據資源庫的建設。
需要持續(xù)地研究文化、語素、音素,專業(yè)人士、方言專家的參與,會讓方言識別效果事半功倍。
低資源環(huán)境,如何保證識別準確率?
面對低資源環(huán)境,如何提升語音識別準確率?思必馳研發(fā)了多種跨語言預訓練、聯合學習、遷移學習的技術,使用較少的數據,來實現方言識別效果的提升。
跨語言預訓練模型
跨語言預訓練,簡言之,就是利用大量的有監(jiān)督或無監(jiān)督文本,例如用普通話來作為它的基底得到通用的預訓練模型,在此基礎上疊加少量的方言數據進行模型訓練。伴隨后期積累起來的方言、垂直場景數據。“煉丹爐”就可以不斷提高模型性能表現,從而提升識別率。
多語言聯合學習,例如考慮到貴州、四川地理位置上的接近性,因而語言近似性較高。在方言數據樣本低資源下,思必馳將近似性語言進行聯合學習,從而降低模型的識別難度。
自研的小樣本遷移學習技術,用較少的數據量,可以快速實現場景體驗優(yōu)化。例如使用少量帶標注的文本數據,即可對標點斷句進行優(yōu)化,相對傳統(tǒng)模式調優(yōu),節(jié)省了83%的數據量。
使用聯合學習和遷移學習的識別后處理技術
在實際應用中,滿足大規(guī)模快速自定制的模型,是企業(yè)方的切實需求,一是低門檻快速定制,二是能擁有足夠的自主權。思必馳方言識別技術,同時具備快速高效的場景化定制能力。通過數據的快速收集和場景模擬,結合自主研發(fā)的識別模型自訓練系統(tǒng),短時間內顯著提升方言識別模型在應用領域的效果,滿足業(yè)務需求。
對于有多語言混合需求的集成商,思必馳運用多混合識別模型,在完成識別特定方言的同時,還可識別普通話,最多支持十多種方言的識別。例如,中川混讀模型可以同時識別四川話和普通話。
目前,思必馳提供基于云+端混合引擎的連續(xù)語音識別,支持四川話、粵語、上海話、閩南語、陜西話、山東話等十幾種方言識別。
輕松識別方言,讓交互更有溫度
探索人機交互的自然、流暢發(fā)展,語言的交流一定要足夠人性化。
重慶農商行客服機器人刷屏朋友圈,TA能聽懂四川話,順暢完成余額查詢、轉賬等操作,面對說慣了四川話的老一輩人們,這個功能太友好。
基于廣泛的生活場景,思必馳與合作伙伴一起將人性化交互的主動權交給用戶,聆聽更多“新聲”。
在家里,美的空調/熱水器烤箱等產品均支持多種方言(粵語,四川話,山東話,上海話)識別,方言轉普通話等模式,各色鄉(xiāng)音無縫交流。思必馳智能醫(yī)療音箱亦能聽懂方言、重口音普通話,充當家庭醫(yī)生安心相伴。
汽車里,支持四川話的語音識別服務,導航都略帶一絲“麻辣味”。某城市地鐵站內,自助售票機支持普通話/中英混合/英語/粵川滬等多語種及方言的識別,準確識別“
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )