第347章 强得有点超模了。。&內部掣肘(2 / 4)
其一,语音编解码技术。
当前主流的语音编解码算法,如amr、spee、ilbc、celt等,基本都已开源或標准化。
在开源算法的基础上,进行定製化开发,或是直接使用成熟的语音处理库,开发一套“语音对讲”系统,说不上容易,但也没什么太大的难度。
一两个月的事儿而已。
但想要达到微信的水平,几乎不可能。
微信应该是採用了已开源的celt算法,结合某种自研的增强算法,自研了混合型解编码器。
使得微信在强网环境下,使用celt的高音质模式:
弱网时,自动切换至抗丟包模式,音质下降,但传输稳定性增强。
中间似乎还夹著层自研的“前向纠错算法”,可恢復部分丟包数据。
其二,传输协议。
这一点就不用多说了。
微信几乎完全重构了实时通信底层逻辑,大幅降低了延迟和丟包率,提升了宽带利用率。
这种硬核底层技术,所带来的用户体验上的差距,是没有捷径可走的,只能一步步追赶。
好在,总部那边已经加大投入研发了。
其三,音频处理技术。
微信採用了某种全链路降噪技术,以及实时回声消除技术。
前端似乎是通过自適应滤波算法,结合语音端点检测,降低了嘈杂环境下的背景噪声。
如地铁、商超、公交车等等。
后端则是在伺服器端,对语音进行二次降噪,同时抑制回声,以解决语音中的“啸叫”、“炸麦”问题。
这一部分,微信用的是什么算法模型,张晓龙完全看不出来。
深度学习模型吗?
但这年头哪来的用移动端深度学习框架啊。。
可话又说回来,这种不科学的现象,出现在极光身上,似乎还挺合理的。。
最后,流量优化技术。
微信似乎是採用了某种算法,对编码后的语音数据,进行了二次压缩,同时对协议层进行了优化,超精简协议头。
使得其能在保持音质的情况下,大幅降低了流量消耗。
跟核心团队一番分析下来,张晓龙惊嘆之余,也有些头皮发麻。
通过混合编解码+重构通信协议栈+智能优化的组合,微信在音质、流量、延迟等核心指標上,有著近乎统治级的竞爭力。
產生的最直接的效果就是一一消息及时,音质清晰,流量省一半。
朴实无华。 ↑返回顶部↑
当前主流的语音编解码算法,如amr、spee、ilbc、celt等,基本都已开源或標准化。
在开源算法的基础上,进行定製化开发,或是直接使用成熟的语音处理库,开发一套“语音对讲”系统,说不上容易,但也没什么太大的难度。
一两个月的事儿而已。
但想要达到微信的水平,几乎不可能。
微信应该是採用了已开源的celt算法,结合某种自研的增强算法,自研了混合型解编码器。
使得微信在强网环境下,使用celt的高音质模式:
弱网时,自动切换至抗丟包模式,音质下降,但传输稳定性增强。
中间似乎还夹著层自研的“前向纠错算法”,可恢復部分丟包数据。
其二,传输协议。
这一点就不用多说了。
微信几乎完全重构了实时通信底层逻辑,大幅降低了延迟和丟包率,提升了宽带利用率。
这种硬核底层技术,所带来的用户体验上的差距,是没有捷径可走的,只能一步步追赶。
好在,总部那边已经加大投入研发了。
其三,音频处理技术。
微信採用了某种全链路降噪技术,以及实时回声消除技术。
前端似乎是通过自適应滤波算法,结合语音端点检测,降低了嘈杂环境下的背景噪声。
如地铁、商超、公交车等等。
后端则是在伺服器端,对语音进行二次降噪,同时抑制回声,以解决语音中的“啸叫”、“炸麦”问题。
这一部分,微信用的是什么算法模型,张晓龙完全看不出来。
深度学习模型吗?
但这年头哪来的用移动端深度学习框架啊。。
可话又说回来,这种不科学的现象,出现在极光身上,似乎还挺合理的。。
最后,流量优化技术。
微信似乎是採用了某种算法,对编码后的语音数据,进行了二次压缩,同时对协议层进行了优化,超精简协议头。
使得其能在保持音质的情况下,大幅降低了流量消耗。
跟核心团队一番分析下来,张晓龙惊嘆之余,也有些头皮发麻。
通过混合编解码+重构通信协议栈+智能优化的组合,微信在音质、流量、延迟等核心指標上,有著近乎统治级的竞爭力。
產生的最直接的效果就是一一消息及时,音质清晰,流量省一半。
朴实无华。 ↑返回顶部↑