大模型兴起,语音深度鉴伪技术竞赛开启
我国加强语音鉴伪技术研发,助力防范AI生成语音欺诈风险
近日,主题为语音深度鉴伪识别的第九届信也科技杯全球人工智能算法大赛总决赛在上海举行。本次比赛旨在推动语音鉴伪技术的创新与发展,鼓励参赛者运用深度学习和人工智能对抗技术,开发出能够准确识别虚假语音的模型。
随着语音合成技术的发展,AI生成的虚假语音越来越逼真,给语音鉴伪技术带来了巨大挑战。为此,业界呼吁跨学科联合攻坚鉴伪技术。在第九届信也科技杯全球人工智能算法大赛总决赛上,选手们展示了运用不同算法模型和训练思路识别虚假语音的创新成果。
据了解,此次比赛的语音数据集主要由传统端到端TTS(文字转语音)生成的假语音组成,识别难度相对较低。然而,复赛数据集新增了基于最新大模型生成的假语音、翻录假语音以及由真假语言拼接而成的样本,涵盖了英语、法语、西班牙语等多种语言,比赛难度得以提高。
信也科技算法科学家吕强指出,解决翻录问题和真假对抗具有重要学术价值。此外,结合文本、视频等多模态信息有助于提升语音鉴伪效果,大模型和多模态将成为语音鉴伪的重要发展方向。
信也科技副总裁陈磊强调,语音大模型的研究应把应用问题抽象提炼成学术问题,并在解决学术问题后通过工程化实现具体业务场景的需求。未来,鉴伪技术将在软硬件层面实现融合,借助硬件溯源声音采集,从硬件层面预防假语音风险。
最后,陈磊呼吁建立生成式AI的治理规则,遵循监管层顶层设计,加强产业生态共建,共同防范系统性风险。