-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
旗天科技:目前与多家国有大行、股份制银行、城商行共计开展十余个数字人民币营销推广项目
旗天科技5月30日在互动平台表示,公司已关注到《江苏省工业和信息化领域数字人民币试点实施方案》,并将积极关注跟踪数字人民币相关政策等情况。截至目前,公司与多家国有大行、股份制银行、城商行共计开展十余个数字人民币营销推广项目,在数字人民币营销场景业务上积累了丰富经验,并获得银行的一致认可...
区块链 2023-05-30 20:52:10 -
香港大学校长张翔:科技“卡脖子”,是因为以前别人天马行空,我们在忙别的
5月30日消息,2023中关村平行论坛未来科学论坛现场,香港大学校长、美国国家工程院院士、中国科学院院士张翔谈到,为什么中国现在有“卡脖子”问题,是因为30年前,别人做天马行空事情的时候,你还在做其他的事。所以怎样走在时间前,需要我们要在源头真正做一些创新性、颠覆性的研究...
互联网 2023-05-30 15:35:31 -
基于飞桨和文心大模型数链科技发布大宗商品数字供应链系统
【网易科技5月29日报道】近日,数链科技团队推出基于飞桨技术的创新非标单据数字化解决方案,旨在破除大宗商品行业的信息壁垒。此前,大宗商品供应链中的物流票据、合同等交易信息常以实物形式存在,需要人工拍照、存档并进行信息录入,存在不透明和不标准的问题...
智能设备 2023-05-29 22:40:25 -
联发科技宣布与英伟达合作为软件定义汽车提供AI智能座舱方案
5月29日消息,联发科技今天宣布与NVIDIA合作,为软件定义汽车提供完整的AI智能座舱方案。通过此次合作,MediaTek将开发集成NVIDIA GPU 芯粒(chiplet)的汽车SoC,搭载NVIDIA AI和图形计算IP...
业界动态 2023-05-29 16:08:23 -
第三届全国青少年科技教育成果展示大赛北京区域赛在北京亦庄成功举办
5月27日,第三届全国青少年科技教育成果展示大赛北京区域赛在北京亦庄正式拉开序幕。据悉,报名参赛的1067支队伍、2133位(其中线下近2000名)小选手,来自北京市16个区县及北京经济技术开发区的532所学校的选派...
智能设备 2023-05-29 10:29:32 -
以核心技术驱动成本与效率升级京东小家打造IoT智能生态
近日,京东消费及产业发展研究院联合京东家电家居联合推出《智能互联家居及“京东小家”市场研究报告》(以下简称报告),对智能家居、家用IoT的市场和产品进行了梳理。 报告指出,2022年各品类智能家居设备市场均经历了不同程度的产品结构调整和功能升级,为市场后续发展奠定了基础...
智能设备 2023-05-27 17:11:48 -
GPT-4玩《我的世界》15倍速攀科技,不看画面全靠代码操作
克雷西 发自 凹非寺量子位 | 公众号 QbitAI把GPT-4放进一个虚拟世界会怎么样?比如《我的世界》。英伟达开发最新方法Voyager,在游戏中点亮科技树的速度是此前方法的15.3倍,同时获得的独特物品是此前的3...
智能设备 2023-05-27 16:02:52 -
嘉楠科技公布第一季度财报人工智能收入增长超68%
【网易科技5月26日报道】今日,嘉楠科技公布了2023年第一季度财报,数据显示,经营性亏损环比收窄31%。其总收入为5523.2万美元,显示出比特币挖矿行业的复苏迹象。销售算力增长了126...
智能设备 2023-05-26 20:51:42 -
荣耀90/Pro系列手机核心配置曝光
IT之家 5 月 25 日消息,荣耀手机官方微博已宣布,荣耀 90 系列手机将于 5 月 29 日 14:30 发布,宣传视频中展示了荣耀 90 系列新手机的设计,采用后置上下环状相机模组,预计后面板还将采用特别的水晶设计,并带来新的配色,采用撞色设计的不同纹理,拥有星钻银和冰羽蓝等配色。IT之家曾报道,官方称荣耀 90 系列手机搭载“2 亿像素写真相机”,搭载了“零风险调光护眼屏”,并且内置 5000mAh 电池。微博博主 @数码闲聊站 现在爆料了荣耀 90 系列的核心配置。荣耀 90 手机搭载 6.7 英寸的 1...
手机互联 2023-05-25 14:14:24 -
OpenAICEO:马斯克教会我投资科技领域但对移民火星不感兴趣
5月25日消息,当地时间周四,人工智能研究公司OpenAI联合创始人兼首席执行官萨姆·奥特曼(Sam Altman)在伦敦大学学院发表演讲,谈到了他与埃隆·马斯克(Elon Musk)的关系。奥特曼非常感激马斯克教会他如何投资科技领域,但他对移民火星不感兴趣...
业界动态 2023-05-25 07:47:58