近日,第六届国际权威声学场景和事件检测及分类竞赛(Detection and Classification of Acoustic Scenes and Events, DCASE 2020)公布了比赛结果,由公司陈建峰教授指导,博士生白吉生、硕士生陈晨参与的声学感知团队再创佳绩。在Task5基于时空语境的城市声音标注(Urban Sound Tagging with Spatiotemporal Context)赛事中斩获国际第二,国内第一的成绩;在Task2机器异常声音的无监督检测(Unsupervised Detection of Anomalous Sounds for Machine Condition Monitoring)赛事斩获国内第二,国际第十八的成绩。
由电气和电子工程师协会(IEEE)声学信号处理技术委员会(AASP)组织的DCASE已经开展到了第六届,引起了国内外众多尖端声学研究界的广泛关注,包括谷歌、康奈尔大学、卡耐基梅隆大学等,越来越多的研究者也加入到声学研究当中来。
2018年,公司智能声学与临境通信研究中心博士生王谋组建DCASE参赛团队,该团队由智能声学与临境通信研究中心、声学感知团队和计算机学院音频语音与语言处理研究组三个课题组的音频信号处理方向员工组成,陈建峰、张晓雷和付中华三位教授进行指导,智能声学与临境通信研究中心提供GPU等运算资源。在DCASE2018和DCASE2019挑战赛中,团队积极筹备,攻克艰难,连续两年取得了丰硕的成果,同时也积累了丰富的参赛经验。
本次DCASE 2020比赛,共设置六个任务,包括声学场景识别、异常机器声音的非监督识别、声学事件检测、声学事件分离、城市声音标记和自动为音频生成标题纪要。
任务2
异常声音检测(ASD)是用来识别目标机器发出的声音是正常的还是异常的。任务2是在只提供正常声音样本作为训练数据的情况下,检测机器的异常声音。机械故障自动检测是第四次工业革命的一项重要技术,包括基于人工智能的工厂自动化。
图一:Task2开发和评估数据集概述
本次参加任务2的研究机构有亚马逊,三星,IBM以及英特尔等国际顶级研发机构和清华大学,伊利诺伊大学香槟分校,电子科技大学这样的国内外知名高校。最终公司声音感知团队从参赛的40多支队伍中脱颖而出,获得国内第二、国际第十八的名次,国际第一由亚马逊声学实验室摘得。
图二:Task2比赛排名
任务5
基于时空语境的城市声音标注任务是在包含音频以及录音时间地点的条件下,在10秒的声音中检测噪声污染源是否存在,这些噪声污染源分为8个粗类,23个细类别,例如引擎声、机械/非机械冲击声、电锯声、警报声、音乐声、人声等。这项任务的动机是建立机器监听工具的现实问题,以协助监测、分析和减轻城市噪音污染。
图三:Task5基于时空语境的城市声音标注系统概述
今年是纽约大学第二次举办任务5,公司声音感知团队再进一步,最终获得国际第二,国内第一的名次。城市环境声音分类检测技术的发展将会帮助解决城市噪声污染问题,推动智慧城市形态的进步与发展。
图四:Task5比赛排名
附:公司团队历年来年比赛成绩
图五:公司团队历年来年最佳比赛排名(国际)
审核:孙华强