免费淘宝图片处理软件 淘宝图片制作教程( 七 )



免费淘宝图片处理软件 淘宝图片制作教程

分享几个典型案例 。第一 , 音频技术提高音质体验 。这是一个简单的音频传输系统 , 采集、预处理、AEC/ANS/AGC、编码、网络传输(FEC/NACK技术)、对端(Jitter Buffer/NETEQ)、解码、重采样 。要实现高音质体验 , 我们在每个环节都需要做非常细致的工作:采集中做高保真 , 双声道处理(Alidenoise、回声抑制、智能美声) , 编码中做自适应码率(HE-AAC) , 传输过程要保障传输质量QOS(FEC/NACK) , 接收中还需要原音频数据(PLC/NETEQ) , 播放中应用各种音效技术(3D音效、空间音效、重低音)来提升收听体验 。
直播内容中 , 对音频的适配也非常重要 。(陈老师提到一个例子:如果是音乐直播间 , 用普通模板做音质会很差 , 所以需要几套针对不同类型直播间的声音模板 。)在这样的系统上 , 我们支持淘宝直播 , 语音聊天室等业务 。
4.2 AliDenoise——让声音更清晰
免费淘宝图片处理软件 淘宝图片制作教程

淘宝自研的AliDenoise技术是一个智能降噪技术 , 可以使声音更清晰 。传统的降噪是根据时域傅里叶变换+维拉增益来做 , 痛点是对非平稳噪声抑制差 , 在低信噪比失效 , 而AliDenoise根据端到端的语音降噪 , 用数据驱动方式 , 基于先验信噪比方法做模型训练 。还有Cache Buffer的流式处理以及1D卷积+模型小型化的工作 , 核心优势是降噪能力强、语音保真度高(我们做了一些竞品对比 , AliDenoise的主客观指标都超过竞品)、极轻量小模型(1.6M的模型可以在普通手机实现降噪 , 且CPU消耗只有6%)、延时可控(可根据设备能力做延时调节) 。
有三段音频 , 第一段是街边的场景 , 是原声;第二段是RTC处理后的效果(汽车走过的声音比较明显);第三段是AliDenoise处理后的效果 , 可以听出它对非平稳噪声的抑制很好 , 且人声保留度高 。
街边场景-原声
RTC处理后的效果
AliDenoise处理后的效果

推荐阅读