Appearance
声学结构
声学结构决定声音进入麦克风、离开扬声器以及在设备内部串扰的方式。很多语音效果问题看起来像算法不稳,根因却是开孔、腔体、密封、麦克风位置或扬声器漏音路径不合理。
基本组成
| 组成 | 作用 | 常见问题 |
|---|---|---|
| 声源 | 产生声音的人、设备或环境 | 距离变化、方向变化、多人同时说话 |
| 传播空间 | 声音传播和反射的环境 | 混响、遮挡、驻波、背景噪声 |
| 麦克风 | 把声压变化转成电信号 | 灵敏度不一致、底噪、饱和、开孔堵塞 |
| 扬声器 | 把电信号转成声压变化 | 失真、破音、漏音、箱体共振 |
| 腔体和导声结构 | 控制声音进出设备的路径 | 密封不良、频响凹陷、风噪放大 |
| 结构材料 | 影响吸声、反射、阻尼和机械振动 | 共振、异响、低频泄漏 |
声源与声场
人声不是单点理想声源。说话时,口腔、鼻腔、胸腔和头部都会影响辐射方向。高频更有方向性,低频绕射更强,所以设备在侧后方听到的人声会更闷,辅音更容易丢失。
声场可以粗略分为三类:
| 声场 | 特点 | 场景 |
|---|---|---|
| 自由场 | 声音基本不反射,声压随距离衰减 | 消声室、开阔户外 |
| 扩散场 | 声音从多方向反射到达,方向性弱 | 混响较强的室内 |
| 近场 | 声源距离麦克风很近,距离和角度变化影响大 | 耳机、手机、遥控器 |
远场语音通常指说话人与设备距离超过 1 米的场景。远场不只是“声音小”,还会叠加混响、噪声、遮挡和播放回声。
麦克风结构
单麦
单麦结构简单、成本低,适合近场拾音、遥控器、录音笔、简单通话设备。它无法从空间维度区分目标人声和噪声,只能依赖频谱、统计模型或神经网络做降噪。
单麦设计重点:
- 开孔不能被外壳、胶水、泡棉或防尘网堵住。
- 声孔到麦克风声口的导声路径要短、直、密封。
- 麦克风远离马达、风扇、按键、扬声器和高速数字线。
- 留出防风、防水、防尘结构时,要重新测频响和灵敏度。
麦克风阵列
麦克风阵列利用不同麦克风之间的时间差和相位差估计方向,从目标方向增强语音、从其他方向抑制噪声。
| 阵列 | 特点 | 适用场景 |
|---|---|---|
| 线性阵列 | 结构简单,主方向清晰 | 电视、会议条形设备 |
| 环形阵列 | 360 度拾音,方向覆盖均衡 | 智能音箱、会议终端 |
| 平面阵列 | 可做更复杂方向估计 | 机器人、车载顶棚 |
阵列间距不是越大越好。间距过小,低频方向差异弱;间距过大,高频会出现空间混叠。语音阵列常见间距在几厘米量级,需要结合目标频段、外形尺寸和算法能力一起定。
阵列一致性
阵列算法默认每路麦克风的增益、相位、延迟稳定一致。如果装配偏差大,波束形成、声源定位和 AEC 都会变差。
需要关注:
- 每颗麦克风灵敏度差异。
- 各路 ADC 或 PDM 时钟是否同步。
- 声孔长度是否一致。
- 结构装配是否导致某一路被遮挡。
- 标定数据是否被写入设备并正确加载。
扬声器与腔体
扬声器结构影响播放效果,也影响麦克风采集质量。语音设备里,扬声器播放的声音会通过空气和结构件回到麦克风,形成声学回声。
扬声器设计重点:
- 腔体容积影响低频响应,容积太小会低频不足。
- 密封不良会导致低频泄漏、杂音和结构振动。
- 扬声器到麦克风的直达路径越强,AEC 压力越大。
- 设备外壳共振会让某些频段异常突出。
- 大音量播放时的非线性失真会显著增加回声消除难度。
声学隔离
声学隔离的目标不是完全阻断声音,而是让“不该进来的声音”尽量少、尽量稳定。
典型措施:
- 麦克风与扬声器之间增加距离或隔离筋。
- 麦克风导声腔独立密封,避免内部串音。
- 使用泡棉、硅胶套、防尘网时控制一致性。
- 避免扬声器后腔漏到麦克风腔。
- 对风口、散热孔和装饰孔做声学评估。
常见结构问题
| 现象 | 可能原因 | 排查入口 |
|---|---|---|
| 录音发闷 | 声孔被遮挡、防尘网阻尼过大、高频衰减 | 对比裸麦和整机频响 |
| 单路麦克风明显偏小 | 开孔堵塞、焊接异常、密封偏差 | 分路录音、扫频、灵敏度测试 |
| 播放时唤不醒 | 喇叭到麦克风漏音强、AEC 参考不准 | 录近端和参考信号,查 ERLE |
| 远距离识别差 | 阵列孔位不准、混响大、目标方向被遮挡 | 做不同距离和角度录音 |
| 大音量破音 | 功放削顶、扬声器超行程、腔体共振 | 看波形削顶和 THD+N |
| 户外风噪大 | 声孔迎风、缺少防风结构 | 对比不同风向录音 |
结构评审清单
- 麦克风声孔、麦克风声口、导声腔是否对齐。
- 每个声孔是否有独立密封,是否存在内部串音。
- 麦克风到扬声器的路径是否过短或直通。
- 阵列几何尺寸是否与算法配置一致。
- 防水、防尘、防风材料是否改变频响。
- 喇叭腔体是否密封,是否存在异响和共振。
- 整机装配后是否做过分路录音、扫频和一致性测试。
总结
声学结构是语音算法的输入条件。结构不稳定时,算法调参只能掩盖部分问题,无法保证批量一致性。新设备立项时应先确定拾音距离、播放声压、结构空间和目标环境,再反推麦克风、扬声器和腔体方案。
