Bootstrap
音视频详细学习路线和权威资料

随着5G时代的到来,未来传播信息的方式主要以视频传播为主,所以音视频开发还是很有前途。

AI不仅可以把李焕英带回2021,还能告诉你贾玲更像爸爸还是妈妈

春节档电影《你好,李焕英》大火,截至目前实时总票房已突破 50 亿。这部电影除了为亿万观众带去了欢声笑语外,正如这部电影的译名《HI,MOM》所表达,大家也被影片中真挚的母女情所打动,小编更是在电影院哭湿了口罩。

Talk to AI,揭秘背后的语音识别数据

语音识别正在进入我们日常生活的方方面面。

如何用JavaScript实现2+2=5?

我大学毕业找工作时,经常做一些稀奇古怪的面试题。这不,给大家分享一道整蛊的面试题,它其实不能算一道正式的面试题,大家可以用它来捉弄你们那些程序员朋友。

漫画通信:有了它,终于可以放心买买买了

神算李开始试水自营电商,但是频繁接到用户投诉,说个人信息遭受泄露!神算李十分疑惑:客户信息究竟在哪个环节泄露的?怎么能保障客户信息安全呢?且看阿里云通信隐私面单锦囊妙计如何为他答疑解惑。

anyRTC小程序SDK 4.0上线

anyRTC 4.0 SDK 自6月份上线以来,已经有上百家老用户迁移至新平台,为了满足使用小程序和终端互动的用户,anyRTC在近日隆重上线了4.0 小程序SDK,该版本性能上比3.0有了质的改变。

anyRTC - 模仿微信音视频通话功能

呼叫邀请的场景既然这么多,那市面上的这种场景是怎么做的呢?下面我们就来分析一下吧。

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中,离不开语音合成技术的与时俱进。

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中,离不开语音合成技术的与时俱进。

Talk to AI,揭秘背后的语音识别数据

语音识别正在进入我们日常生活的方方面面。

anyRTC云端录制功能上线

云端录制,是 anyRTC针对音视频通话、直播研发的录制组件,与 anyRTC SDK 兼容,通过简单的操作方法,帮助开发者集成录制服务,实现一对一、一对多的音视频通话或直播的录制。

anyRTC无人机图传方案

近年来,随着无人机的发展,无人机巡检在各个领域输中也迅速普及,通过无人机巡检航线规划、数据采集、结果分析处理的全过程自主化、智能化和标准化作业,

音视频社交的应用和优势

随着5G的来临,传输更高速、资费更便宜、耗电发热更低,会彻底改变即时通讯的“带宽”,带来高可靠超低延时的通讯体验。这让视频这种社交媒介有了具备普及的基础要求。也给超高清视频和虚拟现实技术的应用铺平了道路。音视频社交,也就是基于音视频展开的实时

音视频面试题

音视频面试题

anyRTC Native 4.1.0.1与Web SDK 4.0.11上线

anyRTC Native 4.1.0.1与Web SDK 4.0.11已于今日正式上线,新版本采用全新的系统架构和智能感知编码传输技术

音视频面试题

音视频面试题

Talk to AI,揭秘背后的语音识别数据

语音识别正在进入我们日常生活的方方面面。

一文读懂阿里云通信的产品体系、技术架构与智能化应用场景实践

在企业使用云通信的过程中,依旧会面临到技术门槛高、系统维护治理难、业务场景适配挑战大等问题,阿里云通信是如何围绕用户需求,打造场景化产品服务体系,面向用户构建安全、易用、稳定、智能的技术系统,用AI能力赋能企业降本提效?

漫画通信:有了它,终于可以放心买买买了

神算李开始试水自营电商,但是频繁接到用户投诉,说个人信息遭受泄露!神算李十分疑惑:客户信息究竟在哪个环节泄露的?怎么能保障客户信息安全呢?且看阿里云通信隐私面单锦囊妙计如何为他答疑解惑。

一文读懂阿里云通信的产品体系、技术架构与智能化应用场景实践

在企业使用云通信的过程中,依旧会面临到技术门槛高、系统维护治理难、业务场景适配挑战大等问题,阿里云通信是如何围绕用户需求,打造场景化产品服务体系,面向用户构建安全、易用、稳定、智能的技术系统,用AI能力赋能企业降本提效?

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中,离不开语音合成技术的与时俱进。

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中,离不开语音合成技术的与时俱进。

什么?语音合成开源代码不会跑,Follow me!

摘要:本文描述的深度神经网络模型结构:NaturalTTS synthesis by conditioning Wavenet on MEL spectogram predictions。

什么?语音合成开源代码不会跑,Follow me!

摘要:本文描述的深度神经网络模型结构:NaturalTTS synthesis by conditioning Wavenet on MEL spectogram predictions。

什么?语音合成开源代码不会跑,Follow me!

摘要:本文描述的深度神经网络模型结构:NaturalTTS synthesis by conditioning Wavenet on MEL spectogram predictions。

解析WeNet云端推理部署代码

摘要:WeNet是一款开源端到端ASR工具包,它与ESPnet等开源语音项目相比,最大的优势在于提供了从训练到部署的一整套工具链,使ASR服务的工业落地更加简单。

基于RNN和CTC的语音识别模型,探索语境偏移解决之道

​​​​​​​​摘要:在本文介绍的工作中,我们展示了一个基于RNN和CTC的语音识别模型,在这个模型中,基于WFST的解码能够有效地融合词典和语言模型。

基于RNN和CTC的语音识别模型,探索语境偏移解决之道

​​​​​​​​摘要:在本文介绍的工作中,我们展示了一个基于RNN和CTC的语音识别模型,在这个模型中,基于WFST的解码能够有效地融合词典和语言模型。

Talk to AI,揭秘背后的语音识别数据

语音识别正在进入我们日常生活的方方面面。

基于RNN和CTC的语音识别模型,探索语境偏移解决之道

​​​​​​​​摘要:在本文介绍的工作中,我们展示了一个基于RNN和CTC的语音识别模型,在这个模型中,基于WFST的解码能够有效地融合词典和语言模型。

解析WeNet云端推理部署代码

摘要:WeNet是一款开源端到端ASR工具包,它与ESPnet等开源语音项目相比,最大的优势在于提供了从训练到部署的一整套工具链,使ASR服务的工业落地更加简单。

一文读懂阿里云通信的产品体系、技术架构与智能化应用场景实践

在企业使用云通信的过程中,依旧会面临到技术门槛高、系统维护治理难、业务场景适配挑战大等问题,阿里云通信是如何围绕用户需求,打造场景化产品服务体系,面向用户构建安全、易用、稳定、智能的技术系统,用AI能力赋能企业降本提效?

语音合成(TTS)技术在有道词典笔中的应用实践

目前,有道 TTS 语音合成技术已应用在许多内部和外部的在线场景和嵌入式场景,并表现出了相对传统方案更加稳定、更加鲁棒的合成效果。

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中,离不开语音合成技术的与时俱进。

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中,离不开语音合成技术的与时俱进。

其他标签