语音合成

音视频详细学习路线和权威资料

随着5G时代的到来，未来传播信息的方式主要以视频传播为主，所以音视频开发还是很有前途。

AI不仅可以把李焕英带回2021，还能告诉你贾玲更像爸爸还是妈妈

春节档电影《你好，李焕英》大火，截至目前实时总票房已突破 50 亿。这部电影除了为亿万观众带去了欢声笑语外，正如这部电影的译名《HI,MOM》所表达，大家也被影片中真挚的母女情所打动，小编更是在电影院哭湿了口罩。

Talk to AI，揭秘背后的语音识别数据

语音识别正在进入我们日常生活的方方面面。

如何用JavaScript实现2+2=5？

我大学毕业找工作时，经常做一些稀奇古怪的面试题。这不，给大家分享一道整蛊的面试题，它其实不能算一道正式的面试题，大家可以用它来捉弄你们那些程序员朋友。

漫画通信：有了它，终于可以放心买买买了

神算李开始试水自营电商，但是频繁接到用户投诉，说个人信息遭受泄露！神算李十分疑惑：客户信息究竟在哪个环节泄露的？怎么能保障客户信息安全呢？且看阿里云通信隐私面单锦囊妙计如何为他答疑解惑。

anyRTC小程序SDK 4.0上线

anyRTC 4.0 SDK 自6月份上线以来，已经有上百家老用户迁移至新平台，为了满足使用小程序和终端互动的用户，anyRTC在近日隆重上线了4.0 小程序SDK,该版本性能上比3.0有了质的改变。

anyRTC - 模仿微信音视频通话功能

呼叫邀请的场景既然这么多，那市面上的这种场景是怎么做的呢？下面我们就来分析一下吧。

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中，离不开语音合成技术的与时俱进。

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中，离不开语音合成技术的与时俱进。

Talk to AI，揭秘背后的语音识别数据

语音识别正在进入我们日常生活的方方面面。

anyRTC云端录制功能上线

云端录制，是 anyRTC针对音视频通话、直播研发的录制组件，与 anyRTC SDK 兼容，通过简单的操作方法，帮助开发者集成录制服务，实现一对一、一对多的音视频通话或直播的录制。

anyRTC无人机图传方案

近年来，随着无人机的发展，无人机巡检在各个领域输中也迅速普及，通过无人机巡检航线规划、数据采集、结果分析处理的全过程自主化、智能化和标准化作业，

音视频社交的应用和优势

随着5G的来临，传输更高速、资费更便宜、耗电发热更低，会彻底改变即时通讯的“带宽”，带来高可靠超低延时的通讯体验。这让视频这种社交媒介有了具备普及的基础要求。也给超高清视频和虚拟现实技术的应用铺平了道路。音视频社交，也就是基于音视频展开的实时

音视频面试题

anyRTC Native 4.1.0.1与Web SDK 4.0.11上线

anyRTC Native 4.1.0.1与Web SDK 4.0.11已于今日正式上线，新版本采用全新的系统架构和智能感知编码传输技术

音视频面试题

Talk to AI，揭秘背后的语音识别数据

语音识别正在进入我们日常生活的方方面面。

一文读懂阿里云通信的产品体系、技术架构与智能化应用场景实践

在企业使用云通信的过程中，依旧会面临到技术门槛高、系统维护治理难、业务场景适配挑战大等问题，阿里云通信是如何围绕用户需求，打造场景化产品服务体系，面向用户构建安全、易用、稳定、智能的技术系统，用AI能力赋能企业降本提效？

漫画通信：有了它，终于可以放心买买买了

一文读懂阿里云通信的产品体系、技术架构与智能化应用场景实践

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中，离不开语音合成技术的与时俱进。

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中，离不开语音合成技术的与时俱进。

什么？语音合成开源代码不会跑，Follow me！

摘要：本文描述的深度神经网络模型结构：NaturalTTS synthesis by conditioning Wavenet on MEL spectogram predictions。

什么？语音合成开源代码不会跑，Follow me！

摘要：本文描述的深度神经网络模型结构：NaturalTTS synthesis by conditioning Wavenet on MEL spectogram predictions。

什么？语音合成开源代码不会跑，Follow me！

摘要：本文描述的深度神经网络模型结构：NaturalTTS synthesis by conditioning Wavenet on MEL spectogram predictions。

解析WeNet云端推理部署代码

摘要：WeNet是一款开源端到端ASR工具包，它与ESPnet等开源语音项目相比，最大的优势在于提供了从训练到部署的一整套工具链，使ASR服务的工业落地更加简单。

基于RNN和CTC的语音识别模型，探索语境偏移解决之道

摘要：在本文介绍的工作中，我们展示了一个基于RNN和CTC的语音识别模型，在这个模型中，基于WFST的解码能够有效地融合词典和语言模型。

基于RNN和CTC的语音识别模型，探索语境偏移解决之道

摘要：在本文介绍的工作中，我们展示了一个基于RNN和CTC的语音识别模型，在这个模型中，基于WFST的解码能够有效地融合词典和语言模型。

Talk to AI，揭秘背后的语音识别数据

语音识别正在进入我们日常生活的方方面面。

基于RNN和CTC的语音识别模型，探索语境偏移解决之道

摘要：在本文介绍的工作中，我们展示了一个基于RNN和CTC的语音识别模型，在这个模型中，基于WFST的解码能够有效地融合词典和语言模型。

解析WeNet云端推理部署代码

一文读懂阿里云通信的产品体系、技术架构与智能化应用场景实践

语音合成（TTS）技术在有道词典笔中的应用实践

目前，有道 TTS 语音合成技术已应用在许多内部和外部的在线场景和嵌入式场景，并表现出了相对传统方案更加稳定、更加鲁棒的合成效果。

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中，离不开语音合成技术的与时俱进。

一文读懂「TTS语音合成技术」

人机交互越来越广泛地应用在我们的生活中，离不开语音合成技术的与时俱进。

其他标签

Elsewhere

返回顶部