-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
任天堂Switch模拟器YuzuEmulator登陆安卓平台
IT之家 5 月 31 日消息,近日 Yuzu 开发团队宣布,他们的任天堂 Switch 模拟器已经正式支持安卓平台。Yuzu 是目前 PC 上最受欢迎的 Switch 模拟器之一,能够让用户在更强大的硬件上玩自己喜爱的 Switch 游戏,现在其终于登陆了安卓平台...
智能设备 2023-05-31 10:53:51 -
Meta头显设备首次亮相,或成苹果最大竞争对手
Apple Inc.头显的推出无疑将成为今年混合现实领域的最大新闻。但苹果不会独占市场。Meta Platforms Inc...
手机互联 2023-05-30 11:43:58 -
实时处理照片和视频等,英特尔演示MeteorLake上的VPU能力
IT之家 5 月 30 日消息,英特尔在近日召开的 Computex 2023 大会上,展示了 Meteor Lake 处理器原型,重点演示了该处理器中协处理器 VPU 的一些功能。Meteor Lake 处理器不再使用单片式设计(monolithic design),而是采用分散式设计,组合通过的 chiplets 来满足不同工作任务。Meteor Lake 中提供的多功能处理单元(VPU),主要技术来自于英特尔 2016 年收购的 Movidius 公司。英特尔通过引入 VPU,可以加速处理 AI 算法和机器学习模型相关的任务。Meteor Lake 中的 VPU 主要任务包括实时处理照片和视频、过滤应用、自动模糊背景、缩放应用、替换图像等等,此外 VPU 还具备实时识别用户眼球运动和手势的能力。IT之家此前报道,这颗处理器是在两周前完成的,拥有 16 核 22 个线程、1.6 MB 的 L1 缓存、18 MB 的 L2 缓存和 24 MB 的 L3 缓存。 ...
智能设备 2023-05-30 10:51:49 -
古尔曼称苹果推出首款头显利好Meta,助其提高市场份额
IT之家 5 月 28 日消息,彭博社马克・古尔曼在最新一期 Power On 时事通讯中表示,苹果在未来会掌控高端 AR / VR 头显市场,首款头显的推出,会让 Meta 从中受益。古尔曼认为苹果在推出首款头显之后,势必会带火 AR / VR 头显市场...
智能设备 2023-05-29 10:15:41 -
百度何俊杰:全线拥抱AI,百度移动生态要为十亿用户打造“PersonalAI”
5月25日消息,2023万象·百度移动生态大会上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰提出,要以AI原生思维重构百度移动生态,全面“刷新”百度搜索、百度APP、百度文库、百度电商等产品与服务的用户体验,推动人机交互、内容生产、营销与商业三重变革。他表示,之前文心一言、ChatGPT等大语言模型是在让AI变“大”,移动生态的这次重构,就是要致力于让AI变“小”,变得更具体,变得人人可用。百度集团副总裁、搜索平台负责人肖阳提出基于“语义检索技术+大语言模型”的双重能力,引领搜索代际变革体验。百度搜索基于大模型创新打造的极致满足、“AI伙伴”、“AI BOT”等功能目前也正在内测中。搜索体验变革主要体现在三方面。在用户需求满足上,百度基于大语言模型和AI技术积累,让更多、更复杂的问题在第一条搜索结果中得到全面满足;在用户表达上,“AI伙伴”可以实现智能对话、多轮交互,极大降低了用户的输入表达门槛和成本;在信息边界的突破上,AI BOT为创作者、商家、机构、品牌等领域的内容、服务提供者们制作虚拟的AI分身,助力生态伙伴提升创作和服务效率。在过去一年,百度APP月活已达到6.57亿。百度信息分发平台总经理李小婉表示,百度APP今年将推出智能首页模式“一人一世界”,用户可以根据自己心意和习惯选择默认首页、大图首页、视频首页、小说首页等,满足更多元的个性化需求。 同时,她还首次展示了内测产品NEW APP,用新概念、新功能,以及一人一模型的未来远景。 目前产品的核心使用场景是对话,提问、聊天、发送指令等,用户还可指定不同“人设”的私人助理,了解用户的喜好和需求,随时对话交流,还可以给予有效建议,处理大小事务。此外,百度输入法也创新打造了AI“高情商沟通助手”,根据不同社交场景给出高情商聊天建议,为用户带来更加智能、高效的社交体验。2022年万象大会上,百度推出“创作者AI助理团”,至今已有45万创作者使用,产出超700万篇内容,累计分发量超过200亿。而在今年万象大会上,百度移动生态事业群组内容生态平台副总经理宋健介绍了全新升级的百度内容生态AIGC创作工具,AI笔记、AI成片、AI作画、AI BOT等功能将面向创作者开启内测体验,更多AI写作、AI数字人功能也即将上线,为创作者提供一站式AI创作方案,推动生产方式根本性变革。截止目前,超过600万创作者在百度创作与分享,创作者多元收入规模同比增长397%,商单收入、电商收入、付费订单量等多元业务均呈现高速增长态势。对创作者,百家号升级为“百度AI创作经营平台”,帮助创作者在AI提效、内容分发、多元变现、影响力建设等多个维度实现跨越性的突破。同时,百度推出创作者成长扶持计划“AI共创计划”,计划扶持10万创作者收入超30亿。“未来,谁拥有最佳的跟客户沟通的方式,谁就会拥有这个客户”,何俊杰指出。营销行业是AIGC的“先行示范区”,有机构预测,2022年,大型组织的营销信息2%由AI生成,到2025年,这一数据将上升到30%。据悉,百度从2014年开始,就在尝试“AIGC文本创意”。到目前,单条创意耗时从30分钟降到4分钟,AI辅助创作的文本创意每天生产14亿条,近七成企业都用到这个功能,近三分之一的创意展现都有AIGC参与。对于商家,百度副总裁、百度电商总经理平晓黎表示同步推出智能电商新品牌“百度优选”,发布了包含AI导购助手、电商AI主播制作平台、商家经营能力模型、商家成长体系、智能经营平台等一系列创新技术和智能商家经营方案。为助力商家和合作伙伴成长,平晓黎还发布百度电商超级生态计划,将助力1000个千万GMV爆款商品,100个年销售额过亿的商家,以及15个GMV过亿的服务商合作伙伴,与百度电商共同实现更大的生意机会。(一橙) ...
业界动态 2023-05-25 13:06:05 -
Meta已启动最后一轮裁员约6000个岗位被裁撤
①最新一轮也是最后一轮裁员开始了,预计将主要裁撤Meta业务部门的成员,人数为6000人; ②投资者对公司裁员措施和押注人工智能领域表示满意。截止周三,Meta股价年内飙升逾100%。 财联社5月25日讯(编辑 牛占林)据Meta员工和知情人士透露,Meta周三已开始实施最后一轮裁员,这是3月份宣布的裁撤1万个职位计划的一部分。自去年11月以来,这家Facebook的母公司已表示将裁员2.1万人,占其员工总数的近四分之一。当月,Meta率先宣布裁员1...
智能设备 2023-05-25 11:03:34 -
索尼发布新机Xperia1V,搭载双层晶体管像素堆叠式CMOS影像传感器
5月24日消息,在“Sony Expo 2023”展前媒体发布会上,索尼(中国)有限公司总裁吉田武司提出了索尼在华发展的愿景:“激发灵感与热情,与追梦者共创感动。”他表示,“中国有很多对未来充满热情和憧憬的追梦者,他们虽来自不同年龄层,不同领域,但他们都拥有勇于创新,不断突破极限的可贵的精神,这同样是索尼创业以来,传承至今的精神...
业界动态 2023-05-24 18:49:55 -
可创建3D人像、沉浸式交流,微软Teams应用本周推出Mesh
IT之家 5 月 24 日消息,微软在今天召开的 Build 2023 开发者大会上,宣布为 Microsoft Teams 应用引入 Mesh 平台,允许会议参与者使用 Avatar 公仔形象,构建和分享沉浸式体验。微软表示 Windows 和 macOS 版本 Teams 应用用户,可以为自己创建 3D 头像,从而在没有相机或者网络摄像头的情况下,在会议中使用这些 3D 头像...
智能设备 2023-05-24 10:54:53 -
微软宣布将于明日发布Win11“Moment3”更新,需手动检查安装
IT之家 5 月 23 日消息,Windows 11 用户将迎来最新的功能更新,经过数月在 Windows Insider 计划中的测试,Windows 11“Moment 3”更新已经准备好明日公开发布。这次功能更新还没有官方名称(微软似乎不再喜欢像“Fall Creators Update”这样的奇怪名字),但外界称之为“Moment 3”...
智能设备 2023-05-24 10:54:49 -
Meta回应Instagram宕机:正在努力尽快恢复正常
5月22日,据美国科技博客The Verge消息,社交媒体Instagram在全球范围内宕机。对此,Meta发言人Dave Arnold回应称,已得知一些用户在访问Instagram时遇到了问题,正在努力尽快恢复正常,对由此带来的不便深表歉意。监测网络状况的网站DownDetector数据显示,第一批故障报告在美国东部时间5月21日下午6点左右开始,峰值时超过18.6万份,目前还没有解决的迹象。 ...
智能设备 2023-05-22 11:04:40 -
首批名额仅600名:魅族17系列迎来Flyme10内测招募
快科技5月21日消息,今天魅族官方宣布,Flyme 10即将面向魅族17系列开启内测招募。此次招募将在明天11:00正式开启,届时魅族17系列的用户可以前往"系统设置 - 系统更新 - 公告栏 - Flyme 10 内测招募"参与报名。需要注意的是,此次招募为限量招募,魅族17与魅族17 Pro各300个名额,在名额报满后将无法再提交报名。值得一提的是,早些时候,魅族18系列已经开启了Flyme 10的内测招募,在规则上与魅族17系列略有差异。快科技延伸阅读:作为魅族回归后全新推出的系统版本,Flyme 10带来了全新的OneMind 10.0超算AI引擎,通过纳秒级动效计算,有效减少帧异常抖动,卡顿帧比例减少78%。此外,新系统日常使用丢帧率减少50%,感知卡顿次数减少97%,稳定性测试标准提升10倍,通过了泰尔实验室的48个月流畅度五星认证。 ...
手机互联 2023-05-22 07:35:52