美国当地时间2016年9月13日,国际多通道语音分离和识别大赛(CHiME)组委会在美国旧金山Google公司揭晓了第四届CHiME-4的大赛结果:科大讯飞包揽了本届CHiME赛事全部三个项目的最好成绩。三个项目分别是六麦克风、双麦克风和单麦克风场景下的语音分离和英文识别任务。本次CHiME大赛夺冠,再次证明了科大讯飞在语音识别和多麦克风阵列语音信号处理领域内国际顶尖的技术实力,也表明科大讯飞在中文语音识别系统保持绝对领先的同时,其英语语音识别系统同样达到国际领先水平。
CHiME(Computational Hearing in Multisource Environments)比赛始办于2011年,由法国计算机科学与自动化研究所、英国谢菲尔德大学、美国三菱电子研究实验室等知名研究机构所发起,比赛的目的是希望学术界和工业届针对高噪声和混响等现象影响下的实际场景提出全新的语音识别解决方案,以进一步提升语音识别的实用性和普适性,属于国际语音识别评测中的高难度比赛。目前CHiME比赛已经举办四届,成为业界影响力最大、参赛队伍最多、水平最高的多通道噪声鲁棒性语音识别比赛。往届的比赛参赛队伍包括了英国剑桥大学、美国卡内基梅隆大学、日本的NTT、德国的RWTH亚琛大学等知名研究机构,国内也有清华大学、中科院声学所、上海交通大学等知名高校和研究所参与。本届CHiME赛事由Google承办,并且Google也安排了相关人员参与了比赛。
科大讯飞今年首次参加该项赛事,通过和中国科学技术大学杜俊教授团队、西北工业大学陈景东教授、佐治亚理工大学李锦辉教授、等国内外知名专家的深入合作和讨论,斩获全部三个项目的桂冠并大幅刷新了各项目的历史最好记录。科大讯飞在六麦克风场景下创造的2.24%的词错误率记录,得到了大赛组办方的高度赞扬,其认为在基于多通道中小词汇规模的复杂场景语音识别任务上,科大讯飞的系统已经给出了接近完美的解决方案。这也是科大讯飞继在语音合成、说话人识别、语种识别、机器翻译、认知智能等领域国际评测获奖后的另一崭新成就。
以下为ChiME-4国际大赛三个项目的详细结果(词错误率越低,说明系统性能越好):
【比赛结果页面请戳】