-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
任天堂Switch模拟器YuzuEmulator登陆安卓平台
IT之家 5 月 31 日消息,近日 Yuzu 开发团队宣布,他们的任天堂 Switch 模拟器已经正式支持安卓平台。Yuzu 是目前 PC 上最受欢迎的 Switch 模拟器之一,能够让用户在更强大的硬件上玩自己喜爱的 Switch 游戏,现在其终于登陆了安卓平台...
智能设备 2023-05-31 10:53:51 -
不锈钢材质,苹果早期AppleWatch原型曝光
IT之家 5 月 31 日消息,原型收藏家 Kosutami 在分享 MagSafe 磁吸充电器原型的时候,还分享了一款不锈钢材质的 Apple Watch 手表金属外壳。他在推文中表示,这款 Apple Watch 是早期“头脑风暴”开发过程中的产物,其尺寸并非 38mm 或者 42mm,而是介于两者之间...
手机互联 2023-05-31 07:54:43 -
骁龙778G+神U加持!vivoS17现身Geekbench网站
vivo即将于5月31日发布S17系列手机,其中包括S17、S17 Pro两款机型。最新曝光的型号为V2283A的vivo S17已经跑上了Geekbench,并显示单核分数817,多核分数2607。预计该机搭载骁龙778G+芯片,内存容量为12GB,运行Android 13操作系统。此外,vivo S17系列手机将搭载智慧柔光环、超感知光谱传感器、前置5000万广角柔光、专业长焦人像镜头等多项高端配置。全系标配6.78英寸1...
手机互联 2023-05-30 00:54:09 -
苹果iPhone将于7月26日关闭“我的照片流”,推荐使用iCloud
苹果公司宣布将于2023年7月26日关闭“我的照片流”服务,这是一项允许用户在多个苹果设备之间共享照片的服务。这项服务的优点是可以自动将用户拍摄的照片同步到所有的设备上,用户可以随时在不同的设备上查看和分享这些照片...
手机互联 2023-05-29 11:08:32 -
摩托罗拉Razr40手机亮相Geekbench,确认搭载高通骁龙7Gen1
IT之家 5 月 28 日消息,摩托罗拉新一代折叠屏手机将于 6 月 1 日正式面向全球发布,预计是摩托罗拉 Razr 2023 机型,预计将包括摩托罗拉 Razr 40 和 Razr 40 Ultra。IT之家发现,摩托罗拉 Razr 40 已经出现在了 Geekbench 跑分数据库中,并且还通过了国家 3C 质量认真...
手机互联 2023-05-28 11:08:25 -
首块全3D打印柔性OLED显示屏问世
科技日报北京1月12日电 (记者刘霞)美国研究人员在最新一期《科学进展》杂志上撰文指出,他们使用定制的打印机,打印出了首块柔性有机发光二极管(OLED)显示屏,这种由3D打印制成的显示屏,无须以往昂贵的微加工设备。 OLED显示技术使用有机材料层将电转换为光,其使用范围广泛,既可用作电视屏和显示器等大型设备,也可用作智能手机等手持电子设备,因其重量轻、节能、轻薄柔韧、视角宽、对比度高而广受欢迎。 最新研究资深作者、明尼苏达大学机械工程系米歇尔·麦卡尔平说:“OLED显示屏通常在庞大、昂贵、且超清洁的制造设施中生产,我们想看看是否能压缩工艺流程,利用我们定制的桌面3D打印机(‘身价’与一辆特斯拉S型汽车差不多)打印出来。” 研究团队此前曾尝试使用3D打印机打印OLED显示屏,但无法实现发光层均匀一致。在最新研究中,他们另辟蹊径,结合两种不同的打印模式来打印6个设备层,最终打印出了首块完全由3D打印机制造的柔性OLED显示屏。其中,电极、互连、绝缘和封装层均采用挤压印刷获得,活性层采用相同的3D打印机在室温下喷涂印刷而成。显示器原型边长约3.8厘米,有64个像素,每个像素都能正常工作。 最新研究第一作者、明尼苏达大学机械工程博士毕业生苏芮涛(音译)说,新的3D打印显示屏很柔韧,可封装在其他材料内,这使它可以广泛应用于多个领域。实验表明,该显示屏历经2000次弯曲仍保持稳定,这表明全3D打印OLED或可用于柔性电子设备和可穿戴设备内。 研究人员接下来计划利用3D打印机打印拥有更高分辨率和更高亮度的OLED显示屏。...
智能设备 2023-05-27 17:11:27 -
这个比ChatGPT情商还高的AI,我可以和它聊三天三夜
狂拿考试高分让学生瑟瑟发抖,加入联网功能叫传统搜索战战兢兢,升级工作全家桶搞得打工人又悲又喜....
智能设备 2023-05-27 16:02:52 -
腾讯任天堂Switch推出延长保修计划限时优惠,售109元
IT之家 5 月 27 日消息,腾讯发文宣布,自 6 月 1 日-30 日,腾讯任天堂 Switch 延长保修计划推出限时优惠,原价 159 元 / 年的延长保修服务计划只需 109 元。IT之家注:腾讯任天堂 Switch 延长保修计划首次发布于 2022 年 12 月下旬,该计划适用于新购机或目前仍然在保修期内的“任天堂 Switch”、“任天堂 Switch(OLED 版)”,用户可付费参与计划延长 1 年的保修时间...
手机互联 2023-05-27 15:23:29 -
已在40多个国家和地区上线,OpenAI在更多市场推出官方版ChatGPT
IT之家 5 月 26 日消息,OpenAI 宣布已经在 40 多个国家和地区,推出了适用于 iPhone 和 iPad 的官方 ChatGPT 应用程序。官方版 ChatGPT 于上周率先在美国市场推出,OpenAI 承诺未来几周内会继续扩展到更多国家和地区...
智能设备 2023-05-26 11:18:38 -
Mudra表带开启预订,一个响指手势搞定AppleWatch交互
IT之家 5 月 26 日消息,Wearable Devices Ltd.(WLDS)今天宣布,适用于 Apple Watch 的 Mudra 表带开启预订,售价 249 美元,限时优惠售价为 199 美元(IT之家备注:当前约 1409 元人民币)。这款 Mudra 表带最大的亮点在于满足生活场景中,不利于双手操作 Apple Watch 的情况下,通过一个响指手势,实现切换曲目、调整音量、接听来电、关闭闹钟、拍照等各种操作。其工作原理是获得专利的 SNC(表面神经传导)传感器,通过将皮肤表面的离子电活动转换为电压(离子交换)来感知手腕发出的生物电势。当移动手指时,Mudra Band 中的电极会捕捉到从你的大脑发出的神经信号,通过手腕传给你的手指。实时准确地通过 SNC 传感器捕捉神经信号,以及深度学习 AI 算法破译信号模式,对正在移动的手指进行分类。 ...
智能设备 2023-05-26 11:18:31 -
研究揭示ChatGPT美国用户人群画像:年轻、富裕、受过良好教育
5月25日消息,美国皮尤研究中心(Pew Research Center)最近开展的一项调查发现,58%的美国成年人熟悉ChatGPT,那些年轻富裕、受过良好教育的美国人更了解ChatGPT。调查显示,拥有研究生学位的高收入人士更熟悉ChatGPT...
业界动态 2023-05-25 08:08:16