热门搜索
-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
奇富科技发布2022年ESG报告:扶持3.8万家环保企业,绿色金融破200亿
5月6日消息,日前,奇富科技发布了《2022年度环境、社会及管治报告》。报告显示,在绿色运营方面,奇富科技采取了一系列措施降低碳排放,2022年公司能源消耗总量较上一年度降低约15%...
互联网 2023-05-07 12:42:51 -
奇富科技推出“奇网”,集成数据安全、信息安全、合规自检等能力
4月7日消息,奇富科技(原360数科)宣布推出奇网数字化安全解决方案(下称“奇网”),将数据安全、信息安全、合规自检、系统安全管理系统集成于奇富科技网状系统中,形成全方位、一体化、可对外输出的数字化安全解决方案。据介绍,此前奇富科技已陆续发布了山海平台、诺瓦云盾平台、SRC等五大安全系统...
互联网 2023-04-07 13:08:29 -
360数科更名奇富科技,宣布将全面聚焦金融科技战略
2月14日消息,360数科宣布公司品牌更名为奇富科技,在品牌更名的同时亦宣布公司将全面聚焦金融科技战略,帮助金融机构实现数字化转型。据介绍,奇富科技的品牌含义为“用先进科技,为社会创造财富”,“奇”代表着科技探索、创新实践,这是企业的进步动力,永葆进取之心;而“富”则代表通过提供丰富、高效的金融科技解决方案,满足用户对美好生活的向往,帮助用户实现共同富裕...
互联网 2023-02-14 20:03:18