
分享几个典型案例 。第一 , 音频技术提高音质体验 。这是一个简单的音频传输系统 , 采集、预处理、AEC/ANS/AGC、编码、网络传输(FEC/NACK技术)、对端(Jitter Buffer/NETEQ)、解码、重采样 。要实现高音质体验 , 我们在每个环节都需要做非常细致的工作:采集中做高保真 , 双声道处理(Alidenoise、回声抑制、智能美声) , 编码中做自适应码率(HE-AAC) , 传输过程要保障传输质量QOS(FEC/NACK) , 接收中还需要原音频数据(PLC/NETEQ) , 播放中应用各种音效技术(3D音效、空间音效、重低音)来提升收听体验 。
直播内容中 , 对音频的适配也非常重要 。(陈老师提到一个例子:如果是音乐直播间 , 用普通模板做音质会很差 , 所以需要几套针对不同类型直播间的声音模板 。)在这样的系统上 , 我们支持淘宝直播 , 语音聊天室等业务 。
4.2 AliDenoise——让声音更清晰

淘宝自研的AliDenoise技术是一个智能降噪技术 , 可以使声音更清晰 。传统的降噪是根据时域傅里叶变换+维拉增益来做 , 痛点是对非平稳噪声抑制差 , 在低信噪比失效 , 而AliDenoise根据端到端的语音降噪 , 用数据驱动方式 , 基于先验信噪比方法做模型训练 。还有Cache Buffer的流式处理以及1D卷积+模型小型化的工作 , 核心优势是降噪能力强、语音保真度高(我们做了一些竞品对比 , AliDenoise的主客观指标都超过竞品)、极轻量小模型(1.6M的模型可以在普通手机实现降噪 , 且CPU消耗只有6%)、延时可控(可根据设备能力做延时调节) 。
有三段音频 , 第一段是街边的场景 , 是原声;第二段是RTC处理后的效果(汽车走过的声音比较明显);第三段是AliDenoise处理后的效果 , 可以听出它对非平稳噪声的抑制很好 , 且人声保留度高 。
街边场景-原声
RTC处理后的效果
AliDenoise处理后的效果
推荐阅读
- 远程桌面软件有哪些好用 免费手机远程控制软件推荐
- 工程造价预算软件有哪些 免费工程造价软件排名
- 流程图画图工具有哪些 免费流程图制作软件介绍
- 怎样将图片转换成word文档 图片转换成word格式
- lol软件辅助推荐 永久免费脚本辅助工具
- 一休哥图片 一休是真的存在还是杜撰出来的呢
- 一休哥图片 用50字和一张图片证明你是80后
- 金不换图片 农村田野边常见的“土大黄”有什么用途
- 蜘蛛痣图片初期症状 手背出现的红色点点,你知道是什么吗?
- 古代建筑物图片 中国古代至今还在持续使用的建筑有哪些
