智能音箱如何識別方言?
時間:2025-12-10 17:23:52 來源:桑間濮上網
導讀:盡管機器學習使語音識別技術的音箱發展突飛猛進,如今這些語音識別系統還是何識不夠完美,最嚴重的別方青島外圍(外圍女)外圍上門(電話微信199-7144-9724)全國1-2線熱門城市快速安排30分鐘到達問題就是有地域歧視性。
自從IBM的音箱Shoebox和Worlds of Wonder的玩具娃娃Julie doll發布以來,語音識別技術一直在不斷地發展。何識到2018年底,別方Google Assistant支持超過30種不同的音箱語言。
高通也開發了一款可以識別單詞和短語的何識語音識別系統,其準確率高達95%。別方此外,音箱微軟的何識智能語音客服比人工呼叫服務更加準確高效。
然而,別方盡管機器學習使語音識別技術的音箱青島外圍(外圍女)外圍上門(電話微信199-7144-9724)全國1-2線熱門城市快速安排30分鐘到達發展突飛猛進,如今這些語音識別系統還是何識不夠完美,最嚴重的別方問題就是有地域歧視性。
華盛頓郵報最近進行的一項研究結果顯示,谷歌和亞馬遜研發的流行智能語音助手識別非美國本地口音的準確率要比美國本地口音低30%。
像IBM和微軟這樣的公司都會通過Switchboard語料庫來降低語音助手的出錯率。但是事實證明,語料庫也無法徹底解決語音助手的口音識別問題。
“數據是混亂的,因為數據反映了人性,”埃森哲的全球責任AI監理Rumman Chowdhury說,“這就是算法最擅長之處:尋求人類行為模式。”
算法偏差表示機器學習模型對數據或者設計產生偏見的程度。很多新聞報道都對面部識別系統(尤其是亞馬遜網絡服務的圖像識別Rekognition)產生了不小的偏見。

而且,算法偏差還會出現在其他方面,比如預測被告是否會在未來犯罪的自動化系統以及谷歌新聞等app背后的內容推薦算法。
微軟以及包括IBM、高通和Facebook在內的AI行業領導者已經開發出自動化工具,用于檢測并減少AI算法中產生的偏差,但很少有人能夠提出口音識別問題的具體解決方案。
真正提出解決方案的只有兩家公司。一個是Speechmatics,另一個便是Nuance。
解決口音差距問題
Speechmetrics是一家專門研究企業語音識別軟件的劍橋科技公司,它于12年前就開始實施了一項雄心勃勃的計劃,旨在開發比市場上任何產品更準確全面的語言識別系統。
該公司最初是研究統計語言建模和循環神經網絡。它開發了一種可以處理內存輸出序列的機器學習模型。2014年,它利用一個十億字節的語料庫加速其統計語言建模的發展,從此邁出了第一步。
到了2017年,它又邁向了另一個里程碑:與卡塔爾計算研究所(QCRI)合作開發了阿拉伯語言文字轉換服務。
“我們已經發現我們需要開發一款語音識別系統,只需一種模式便能適用于所有語言,不再有口音問題,并且它識別澳大利亞口音的準確度和轉錄蘇格蘭口音一樣高。”Speechmatics首席執行官Benedikt vonThüngen說。
他們在今年七月成功研發了一款這樣的語音識別系統Global English。它擁有40多個國家的數千小時的語音數據和數百億單詞,支持所有英語口音的語音文本轉換功能。
此外,Global English的建立還離不開Speechmatic的Automatic Linguist,這是一種人工智能框架,通過利用已知語言中識別的模式來學習新語言的語言基礎。
“假設你一邊要和美國人交談,另一邊還要和澳大利亞人交流,而且這個美國人曾經住在加拿大,所以有加拿大口音,這時大多數的語音識別系統都會很難識別這種帶有不同口音的語言,但是我們的語音識別系統就完全不用擔心這個問題。”Speechmatics公司產品副總裁Ian Firth在一次采訪中說。
在測試中,Global English在識別特定的口音方面表現的比谷歌的Cloud Speech API和IBM的Cloud還要出色。Thüngen表示,在高端領域中,它的準確率比其他產品還要高23%到55%。
Speechmatics并不是唯一一家想要解決口音識別問題的公司。
總部位于馬薩諸塞州柏林頓的Nuance表示,它將采用多種方法,確保其語音識別系統能夠識別將近80種語言,并且準確率都一樣高。
在其英國語言模型中,它收集了20個特定方言區域的語音和文本數據,包括每種方言獨有的單詞(比如使用單詞“cob”特指面包卷)及其發音。因此,這款Nuance的語音識別系統便能識別出“Heathrow”的52種不同表達方式。
如今,Nuance語音識別系統又有了新的發展。更新版本的Dragon是Nuance研發的定制語音文本轉換軟件組合,其機器學習模型可根據用戶的口音在幾種不同的方言中自動切換。
與沒有方言自動切換功能的舊版本相比,新版本的語音識別系統識別帶有西班牙口音的英語的準確率要高22.5%,識別美國南部方言的準確率要高16.5%,識別東南亞英語的準確率要高17.4%。
數據越多越好
歸根結底,語音識別的口音問題是由于數據不足產生的。語料庫的質量越高,語言模型越多種多樣,那么至少從理論上來說語音識別系統的準確率越高。
在華盛頓郵報的研究中,Google Home智能語音助手識別美國南部語言的準確率要比識別美國西部語言的準確率低3%。而亞馬遜的Echo識別美國中西部語言的準確率要低2%.
亞馬遜的一位發言人告訴華盛頓郵報,隨著更多的用戶用不同的口音說話,Alexa的語音識別能力會不斷提高。并且,谷歌在一份聲明中表示,他們將通過擴大自己的數據庫,不斷改進Google Assistant的語音識別技術。
隨著使用語音識別系統的用戶越來越多,它們的功能會進一步提升。根據市場研究公司Canalys數據顯示,到2019年之前,將近1億智能語音系統在全球銷售。并且,在2022年之前,大約55%的美國家庭都會擁有一個智能語音系統。
不要指望有徹底解決口音問題的方案。“按現在的技術發展,你不可能研發出準確率最高并且適用于全世界用戶的語音識別系統,”Faith說。“你能做的最好的事情便是保證這些語音識別系統能夠準確識別那些正在使用它們的用戶的口音。”
自從IBM的音箱Shoebox和Worlds of Wonder的玩具娃娃Julie doll發布以來,語音識別技術一直在不斷地發展。何識到2018年底,別方Google Assistant支持超過30種不同的音箱語言。
高通也開發了一款可以識別單詞和短語的何識語音識別系統,其準確率高達95%。別方此外,音箱微軟的何識智能語音客服比人工呼叫服務更加準確高效。
然而,別方盡管機器學習使語音識別技術的音箱青島外圍(外圍女)外圍上門(電話微信199-7144-9724)全國1-2線熱門城市快速安排30分鐘到達發展突飛猛進,如今這些語音識別系統還是何識不夠完美,最嚴重的別方問題就是有地域歧視性。
華盛頓郵報最近進行的一項研究結果顯示,谷歌和亞馬遜研發的流行智能語音助手識別非美國本地口音的準確率要比美國本地口音低30%。
像IBM和微軟這樣的公司都會通過Switchboard語料庫來降低語音助手的出錯率。但是事實證明,語料庫也無法徹底解決語音助手的口音識別問題。
“數據是混亂的,因為數據反映了人性,”埃森哲的全球責任AI監理Rumman Chowdhury說,“這就是算法最擅長之處:尋求人類行為模式。”
算法偏差表示機器學習模型對數據或者設計產生偏見的程度。很多新聞報道都對面部識別系統(尤其是亞馬遜網絡服務的圖像識別Rekognition)產生了不小的偏見。

而且,算法偏差還會出現在其他方面,比如預測被告是否會在未來犯罪的自動化系統以及谷歌新聞等app背后的內容推薦算法。
微軟以及包括IBM、高通和Facebook在內的AI行業領導者已經開發出自動化工具,用于檢測并減少AI算法中產生的偏差,但很少有人能夠提出口音識別問題的具體解決方案。
真正提出解決方案的只有兩家公司。一個是Speechmatics,另一個便是Nuance。
解決口音差距問題
Speechmetrics是一家專門研究企業語音識別軟件的劍橋科技公司,它于12年前就開始實施了一項雄心勃勃的計劃,旨在開發比市場上任何產品更準確全面的語言識別系統。
該公司最初是研究統計語言建模和循環神經網絡。它開發了一種可以處理內存輸出序列的機器學習模型。2014年,它利用一個十億字節的語料庫加速其統計語言建模的發展,從此邁出了第一步。
到了2017年,它又邁向了另一個里程碑:與卡塔爾計算研究所(QCRI)合作開發了阿拉伯語言文字轉換服務。
“我們已經發現我們需要開發一款語音識別系統,只需一種模式便能適用于所有語言,不再有口音問題,并且它識別澳大利亞口音的準確度和轉錄蘇格蘭口音一樣高。”Speechmatics首席執行官Benedikt vonThüngen說。
他們在今年七月成功研發了一款這樣的語音識別系統Global English。它擁有40多個國家的數千小時的語音數據和數百億單詞,支持所有英語口音的語音文本轉換功能。
此外,Global English的建立還離不開Speechmatic的Automatic Linguist,這是一種人工智能框架,通過利用已知語言中識別的模式來學習新語言的語言基礎。
“假設你一邊要和美國人交談,另一邊還要和澳大利亞人交流,而且這個美國人曾經住在加拿大,所以有加拿大口音,這時大多數的語音識別系統都會很難識別這種帶有不同口音的語言,但是我們的語音識別系統就完全不用擔心這個問題。”Speechmatics公司產品副總裁Ian Firth在一次采訪中說。
在測試中,Global English在識別特定的口音方面表現的比谷歌的Cloud Speech API和IBM的Cloud還要出色。Thüngen表示,在高端領域中,它的準確率比其他產品還要高23%到55%。
Speechmatics并不是唯一一家想要解決口音識別問題的公司。
總部位于馬薩諸塞州柏林頓的Nuance表示,它將采用多種方法,確保其語音識別系統能夠識別將近80種語言,并且準確率都一樣高。
在其英國語言模型中,它收集了20個特定方言區域的語音和文本數據,包括每種方言獨有的單詞(比如使用單詞“cob”特指面包卷)及其發音。因此,這款Nuance的語音識別系統便能識別出“Heathrow”的52種不同表達方式。
如今,Nuance語音識別系統又有了新的發展。更新版本的Dragon是Nuance研發的定制語音文本轉換軟件組合,其機器學習模型可根據用戶的口音在幾種不同的方言中自動切換。
與沒有方言自動切換功能的舊版本相比,新版本的語音識別系統識別帶有西班牙口音的英語的準確率要高22.5%,識別美國南部方言的準確率要高16.5%,識別東南亞英語的準確率要高17.4%。
數據越多越好
歸根結底,語音識別的口音問題是由于數據不足產生的。語料庫的質量越高,語言模型越多種多樣,那么至少從理論上來說語音識別系統的準確率越高。
在華盛頓郵報的研究中,Google Home智能語音助手識別美國南部語言的準確率要比識別美國西部語言的準確率低3%。而亞馬遜的Echo識別美國中西部語言的準確率要低2%.
亞馬遜的一位發言人告訴華盛頓郵報,隨著更多的用戶用不同的口音說話,Alexa的語音識別能力會不斷提高。并且,谷歌在一份聲明中表示,他們將通過擴大自己的數據庫,不斷改進Google Assistant的語音識別技術。
隨著使用語音識別系統的用戶越來越多,它們的功能會進一步提升。根據市場研究公司Canalys數據顯示,到2019年之前,將近1億智能語音系統在全球銷售。并且,在2022年之前,大約55%的美國家庭都會擁有一個智能語音系統。
不要指望有徹底解決口音問題的方案。“按現在的技術發展,你不可能研發出準確率最高并且適用于全世界用戶的語音識別系統,”Faith說。“你能做的最好的事情便是保證這些語音識別系統能夠準確識別那些正在使用它們的用戶的口音。”
相關內容
- ·第一人稱生存射擊《紅移點》現已上架發售時間待定
- ·《戰盾正在線》上線Steam 足游移植的大年夜型多人正在線角色扮演游戲
- ·為了電競級游戲體驗 vivo到底支出了哪些 -
- ·《敗北2:故鄉的轟叫聲》上線Steam 繪量簡樸的FPS游戲
- ·《Apex英雄》通行證調整 30天內好評率跌至10%
- ·《奇同之歌》上線Steam 以音樂為主題的RPG游戲
- ·《殯葬師的故事(A Mortician's Tale)》上架Steam商展 正在殯儀館直里逝世者
- ·《Reverie》上線Steam 環境好好的意境類游戲
- ·《夜幕降臨》登陸steam 通過氣氛渲染恐怖效果
- ·別覺得5G與您無閉 英特我掀示將去糊心 -
- ·游仄易遠晨播報:阿誰被V社移除遠200個游戲的工做室做出回應 《星際公仄易遠》眾籌再創新下
- ·靜態視頻游戲《變體少女(Morph Girl)》 回念被貞子安排的驚駭
- ·蒼藍境界12月8日版本更新匯總:四個新角色登場
- ·小島秀婦深夜講:做游戲是一件既辛苦又煩瑣的工做
- ·周齊屏VS開疊屏 哪個才是我們的將去? -
- ·《同形橄欖球聯盟》上線Steam 充謙血腥暴力的橄欖球游戲
最新內容
- ·動作冒險《擔架人》上線Steam首發特惠32.4元截至8月5日
- ·一張圖讀懂光枯Play 掀秘嚇人的烏科技 -
- ·游戲奇跡群+止業大年夜咖 阿里一個大年夜文娛逝世態再進級
- ·PSVR《Fate/Grand Order VR feat.瑪建·基列萊特》游戲12月6日免費配疑 瑪建性感退場
- ·齊服活動贏大年夜獎!魔域心袋版8月卡諾薩活動會掀幕!
- ·光枯潮配即將退場 顏值超下/或可測心率 -
- ·游戲代碼埋出禍利圖文 10個出售數年才被找到的彩蛋
- ·《脫越蟲洞》上線Steam 科幻氣勢的飛翔射擊類游戲
- ·《勇者斗惡龍 VR》預告視頻公布 4月27日發售
- ·分享您的游戲挨動 育碧公布《刺客疑條》十周年記念活動
推薦內容
- ·廣州越秀找服務找小姐找外圍vx《189-4143》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- ·濟南歷城全套按摩(同城附近約vx《189-4143》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- ·蘇州虎丘找酒店上門服務電vx《189-4143》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- ·合肥包河外圍(洋馬)外圍vx《189-4143》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- ·武漢外圍商務模特妹子上門【微電192=1819=1410(外圍空姐)
- ·合肥廬陽高端外圍女vx《189-4143》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- ·青島李滄外圍女酒店上門電vx《189-4143》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- ·武漢青山同城(上門服務)vx《189-4143》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- ·廣州白云外圍美女服務vx《189-4143》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- ·廣州番禺區美女一條龍(365-*2895vx
熱點內容
- ·日本手游周收入排行榜:米哈游新作《絕區零》登頂
- ·第一人稱版《暗中之魂》+中世紀版《遁逝世》 真幻4可駭游戲《逝世寂》尾曝預報
- ·《六耳獼猴》上線Steam 較成心機的回開制戰役游戲
- ·《海我瑪:天國去的惡棍》上線Steam 像素氣勢的復古射擊游戲
- ·星際戰甲1999事件前傳 《星際戰甲》8月更新"The Locust Eaters"
- ·《盡天供逝世:大年夜遁殺》國區游戲內置減快器告白 遭玩家刷好評
- ·游仄易遠眾評“您評我支”第27期 可駭神做再臨
- ·真幻4引擎吃雞游戲《猖獗公理(Crazy Justice)》公布 能夠PC/主機互聯
- ·虛幻4開放游戲《AQP之城》公布 海灘環境不錯
- ·華為P20/三星S9/小米7 第一季度新機日歷 -
