2020/05/21 16:26 IT产业网
近日,“智源 — MagicSpeechNet 家庭场景中文语音数据集挑战赛”正式落下帷幕。该比赛由北京智源人工智能研究院主办,biendata人工智能竞赛平台承办,北京爱数智慧科技有限公司协办,吸引了140多名来自学术界和产业界的研究者和从业者参加。经过3个多月的激烈角逐,来自华南理工大学、深圳大学、中国科学院自动化研究所、斗鱼直播、网易、小米等学校和企业的队伍进入复赛并取得较好成绩。
举办比赛被认为是解决具体问题的重要方式。随着智能语音技术的成熟,该领域的比赛也在逐渐增多,比较知名的有对话类识别比赛CHiME、语音合成比赛Blizzard、说话人识别比赛NIST等。但目前来看,对话类识别的赛事较少,以中文对话为语料的比赛则更少。因此,该赛事自开赛起就备受关注。
主办方智源研究院是北京人工智能领域优势单位共建的新型研发机构,为研究者们勇闯人工智能科技前沿“无人区”,推动人工智能理论、方法等取得变革性、颠覆性突破提供平台。赛事数据由知名AI数据服务商爱数智慧提供,为反应真实家庭环境下的混响,该数据在不同结构和家装材料的房间进行录制。比赛过程中,主办方还邀请了中科院研究人员进行了2次赛题思路分享,为参赛选手提供指导。
语音识别一直被视为人工智能和机器学习的难题之一,因为说话人、环境、设备都会影响识别效果。而在对话类语音识别中,上下文、对话目的等因素的影响,进一步提高了识别的难度。“比赛结果超出了我们的预期,面对这些不确定因素,参赛者们发现并验证了一些新方法,提高了模型的性能。比如有选手创造性地将多个通道的数据融合起来训练模型,大大提高了识别的准确率。”在接受采访时,主办方人员如是说。
近年来,中国人工智能技术研发和商业化发展取得了令人瞩目的成果,国际上也有了更多的“中国声音”。这些成果离不开人工智能研发人员和从业者的努力。这是智源研究院举办的第一届对话类语音识别挑战赛。爱数智慧在初赛中提供的训练集是经过LDC(知名的数据存储与发放平台)认证的数据,保证了比赛的数据品质。智源研究院举办的系列比赛也将变成集众智的平台,为人工智能从业者提供更多探索科技前沿的机会。
榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。