腾讯会议背后又一黑科技浮出水面。7月7日,为了应对复杂声学场景下的实时语音通信技术挑战,解决企业会议室开会难题,腾讯会议旗下天籁实验室推出天籁语音模组方案,由腾讯AI Lab多项技术加持,实现了12米超长距离拾音,消除超过200种会议噪声。
当下,在线会议成为企业高效办公的标配。据腾讯相关专家介绍,视频会议功能将成为大部分会议室的标配,未来“线上+线下”的混合会议将超过90%。随之而来的是会议室场景下面临的声学挑战,一方面,在远场情景下,麦克风采集到的有效信号逐渐减弱,信噪比降低。另一方面则经常因为会议室场地空旷,各类噪声也会严重影响到开会质量。
腾讯会议基于会议室的特定场景,推出天籁语音模组方案(以下简称“方案”),首次结合房间声场感知、采集和空间声场重建技术,解决了会议室复杂场景下,远场多人音频通信、多讲话人实时追踪、多人自动取景等实时音视频技术难题。
例如,同一会议室中,随着人与音视频设备的距离变远,声音在传播过程中也会逐渐减弱,常常听不清甚至听不到。方案将多个MEMS麦克风板嵌入到会议大屏中,结合音频处理器,能够实现180度广角、12米超长距离拾音,相当于参会者即使相隔4层楼的距离,也能做到像面对面交流般清晰。
针对多人同时说话时声音明显失真现象,方案能有效确保多人讨论时,每个人的声音都听得见、听得清、听得真。方案还基于深度学习模型,可以将空调声、风扇声等平稳噪声的降噪深度提高至40dB,还能对会议室场景下超200种各种突发噪声进行针对性消除。在采访现场,团队进行了降噪方面的演示,无论是键盘噪音、桌椅碰撞、空调噪声、翻纸张的声音、塑料瓶的声音,还是雨打在窗户上的声音、工地噪音等都可以通过天籁算法消除掉。(记者 陈姝)