新闻

乘胜势跃雄关夺新巅：皇派门窗2026年经销商大会...

战鼓催征，旌旗猎猎。市场浪潮奔涌向前，真正的强者勇于在惊涛骇浪中劈波斩浪、稳立潮头。回望20...

香港创意之作席卷2025中国国际漫画节动漫游戏展引...
10月2日至10月5日，中国内地动漫游戏领域的重要盛会，2025中国国际漫画节动漫游戏展将在广州保利世贸博览馆盛大开幕。作为国家文化发展规划重点支持的三大动漫会展之一，中国国际漫画节诞生于2008年，经过十数年...

财经

金融支持文化产业复苏主攻六方面

21日，北京市文化改革和发展领导小组办公室印发《关于加强金融支持文化产业健康发展的若干措施》，这是...

创新

发挥技术优势主动参与抗疫

传递信息助力抗疫，支持企业线上运营，开放直播与行业融合……快手科技第一时间投身疫情防控阻击战，向武...

智能无人开采：能源供应的硬核力量
“知道它厉害，没想到这么厉害!”4月9日，谈及智能化无人采矿，国家能源集团宁夏煤业枣泉煤矿党委书记、矿长翟文，对着记者连说几个“没想到”。大年初三，枣泉煤矿收假复工的日子，不料新冠疫情将一部分回老家过...

从“知音”到“知心”，云从科技语音技术刷新多项世界纪录

发布时间：2021/04/16 新闻 浏览：520

　　4月14日，记者从云从科技获悉，通过针对语音技术难点，创新提出的新模型，在语音识别、语义纠错、深度学习降噪等领域刷新多项国际、国内语音识别权威纪录，推动技术朝更智能地“听”迈进了一大步。

　　据了解，近年来整个人工智能语音领域取得快速发展，但目前常见语音交互场景多是在安静环境下的单人交互，在日常应用仍有诸多问题亟待突破：例如在多人场景的语音、噪声混合中，如何追踪并识别至少一个声音、正常在嘈杂环境下正常交流，也就是“鸡尾酒会问题”，仍是研究者们致力解决的难题。针对这些技术难点，云从在语音识别、语义纠错、深度学习降噪等多个方向上，创新性提出新模型，并在多个数据集上刷新最优成绩。

　　在语义纠错技术上，字错率降低代表使语音更准确地转换文字，纠正语义的错误。针对常见的语法纠错、拼写纠错与语音识别系统转写的错误分布差异较大、传统模型不适合直接使用等问题，云从科技提出一种基于BART预训练模型的语义纠错技术方案，不仅可以对数据中常见的拼写错误进行纠正，还可以对一些常识错误、语法错误，甚至一些需要推理的错误进行纠正。在权威中文语音识别数据集Aishell和清华大学语音Thchs30测试集上，云从科技将字错率(Character Error Rate，CER)第一遍WFST解码以及第二遍RNN重打分结果分别相对降低21.7%和10.3%。

　　语义纠错技术的提升意味着让AI更加“听得懂”，而语音识别技术的提升意味着让AI“听得出”，即将每个人同“指纹”一样独有的“声纹”识别出来，指标提升意味着更精准识别出说话者。

　　语音识别技术刷新Aishell纪录，将字错率降低到4.34%，较过去最好成绩降低了8%;云从团队提出的新模型，巧妙融合了语音识别和说话人识别，提高识别率的同时，极大提升了在不同说话人场景下的鲁棒性。

　　深度学习降噪模型针对在嘈杂环境去除噪声，使语音更清晰。云从科研团队提出一种基于U-Net和注意力机制attention的深度学习神经网络模型CARN模型，在国际顶会Interspeech2020 DNS Challenge比赛数据集上取得了目前最好的结果。

上一篇: 山东港口：区块链技术打破数据壁垒

下一篇: 新智能IT引擎依托“端-边-云-网-智”全域智能化架构打造

发布时间: