菜单导航

腾讯会议推出天籁语音模组方案,构建开放的视

作者: 精装之家 来源: 精装之家 发布时间: 2021年07月27日 05:16:53

无论视频会议还是线下会议,我们总是被外界各种噪音所困扰,从而影响沟通进度。对此,为了应对复杂声学场景下的实时语音通信技术挑战,解决企业会议室开会难题,腾讯会议推出天籁语音模组方案,12m超长距离拾音,一次性解决你开会时的各种噪声。

1. 听不清:参加培训,因为主讲人讲话离麦克风太远,参与培训的人员经常听得一头雾水,会议中如果多人同时说话,声音也会明显失真。

2. 常卡顿:通过视频会议进行工作汇报,往往会遇到声音延迟、卡顿、忽快忽慢,或者和对方同时安静或者说话的尴尬情况,影响沟通进度。

3. 有混响和噪音。要是会议场地很空旷,声音经常出现反射或混响,各类噪声也会严重影响开会质量。

针对这些情况,腾讯会议旗下天籁实验室有一个新命题:攻克复杂声学场景下远场拾音的技术挑战,解决企业会议室以及视频会议的开会难题。

现在,天籁实验室推出天籁语音模组方案,由腾讯AI Lab多项技术加持,可以实现12米超长距离拾音,打造会议室里的“顺风耳”。

视频会议

不仅如此,天籁语音模组基于深度学习模型,对数百种常见噪声进行消除训练,可以将空调声、风扇声以及会议室场景下特定的各种突发噪声进行针对性消除。

针对多人同时说话时声音明显失真现象,天籁语音模组方案则能有效实现双讲无剪切、无回声泄露、无近端语音抑制,有效确保多人讨论时,每个人的声音都听得见、听得清、听得真。

天籁语音模组,由腾讯会议旗下顶尖音频实验室——天籁实验室研发而成。基于软硬一体的声学硬件设计,在腾讯AI Lab多项技术加持下,通过麦克风阵列和多模态深度学习技术相融合,首次结合房间声场感知,采集和空间声场重建技术,开创性地解决会议室复杂场景下,远场多人音频通信、语音助手、多人讲话语音转写、多人讲话实时追踪,和多人自动取景等实时音视频技术难题,实现在远场复杂物理空间下通信体验的突破性提升。

划重点,这一方案已授权开放给腾讯会议硬件认证合作伙伴,并率先应用在腾讯会议Rooms专款机型上,助力打造会议室场景高清、纯净、流畅的开会体验。

视频会议

腾讯会议一直致力于构建开放的视频会议生态。未来,腾讯会议将持续开放音视频认证标准和技术能力,联合硬件设备厂商,共同为企业量身打造软硬一体的云视频会议解决方案,让企业更会开会。