-
精确率提升7.8%!首个多模态开放世界检测大模型MQ-Det登NeurIPS2023
新智元报道编辑:LRS【新智元导读】MQ-Det在已有基于文本查询的检测大模型基础上,加入了视觉示例查询功能,同时保留了高泛化性能和细粒度多模态查询,在ODinW-35基准上实现SOTA性能。目前的开放世界目标检测模型大多遵循文本查询的模式,即利用类别文本描述在目标图像中查询潜在目标,但这种方式往往会面临「广而不精」的问题。论文链接:https://arxiv.org/abs/2305...
智能设备 2023-10-19 02:15:01 -
PSAI修图免费平替来了!StabilityAI又放大招,核弹级更新一键扩图
新智元报道编辑:编辑部【新智元导读】Stability AI再放大招,Uncrop Clipdrop一键扩图+重构图片,Photoshop Generative Fill免费平替来了。此前,PS的重建图像功能就让人无比振奋,让无数人惊呼今天,Stability AI又放大招了。它联合Clipdrop推出了Uncrop Clipdrop——一个终极图像比例编辑器。从Uncrop这个名字上,我们就能看出它的用途。它是一个AI生成的「外画」工具,通过创建扩展背景,这个工具可以补充任何现有照片或图像,来更改任何图像的比例。敲黑板:通过Clipdrop网站,就可以免费试用这个工具了,无需登录!比例任意调,满意为止Uncrop基于Stability AI的文本到图像模型Stable Diffusion XL构建。通过先进的算法和深度学习技术,Uncrop会自动分析上传图像中的内容,然后生成视觉上合理的产出。这可解了许多修图师和画手的燃眉之急了。拍了一张近乎完美的照片,就是构图不尽人意,怎么办?Uncrop给你一键解决!很多时候,为了让图像显示在横幅或大画布上,我们都需要调整图像大小,把它调到合适的尺寸,而且不能扭曲,不能丢失重要的细节,Uncrop完全解决了这样的烦恼。拍出的横图想变竖图?Uncrop帮你解忧。竖图变横图?也是易如反掌。比例不合适的照片,可以随意拉到你想要的比例。不过呢,Uncrop也有自己的局限性。如果是极端的未剪裁图像,或者大量缺失内容的图像,会产生不太准确的结果。因此,我们需要尽可能确保原始图像的高质量,才能获得最佳效果。另外,Uncrop是依靠算法来分析周围的像素、填补空白,它的精度可能会因为场景的复杂性而不同。效果演示官方的介绍效果视频:网友们分享了自己做的外画效果实例:上手体验看到效果这么好,小编忍不住手痒了,立马上手实测了一波。实操起来感受就是:操作非常方便。就像上边的GIF展示的那样,选好一张图片,拖拽到页面中的指定区域。就可以像下图这样选择自己想要扩展的范围,然后等几秒钟,平台就会生成4张扩展完成的图片供你挑选保存。而且还可以针对某一张生成的图片结合Clipdrop的AI修图进行再加工。去除背景。锐化。再让AI对处理过的图片进行风格重构。经过几次AI的套娃生成加工之后,图片不仅仅被扩展了,还可以根据用户的具体需求进行风格和内容上的彻底「进化」。这时候,就是设计师们发挥自己的创造力的时候了!我们也针对人像,运动场景,静物场景做了一些测试。人像原图扩展效果扩展出来的部分效果确实挺自然。不过因为不能用Prompt指引方向,扩展的效果比较随机。重构效果扩展后重构效果AI生成人物图像的老问题手指解决的还是不理想。而且重构之后小姐姐的身体比例稍微有点问题,颜值也感觉降低了。静物原图扩展效果扩展效果比较自然,几乎看不出什么违和感。扩展重构效果但是重构之后线条扭曲的比较明显,整个画面的风格会有比较大的变化。运动场景原图扩展效果很敏感地捕捉到了图片的动态风格,扩展效果不错。扩展后重构效果重构之后主体已经消失,只留下动态的模糊画面,AI对于内容要点把握的还不好。当我尝试想让一张风景照无限扩展变成一张全景照片时。发现对于已经被扩展过的部分,Uncrop的扩展功能是不能继续套娃的。开源版SD-XL4月,Stability AI将Stable Diffusion XL开始面向公众测试。值得一提的是,开源的SD-XL就已经达到了Midjourney水平,能够图像细节等方面表现更好,几乎完全可控。关于Stable Diffusion XL模型的具体信息,官方并没有透露太多,目前只知道是一个与v2模型架构相似、但规模和参数量更大的模型。SD-v2.1包括9亿参数,SD-XL大约有23亿参数,Emad表示正式版可能会额外发布一个更小的蒸馏版本。SD-XL相比之前版本的改进如下:使用较短的描述性prompt即可生成高质量图像可以生成更贴合prompt的图像图像中的人体结构更合理与 v2...
智能设备 2023-06-13 10:59:19 -
苹果准备在iOS17Beta之后为iPhone带来iOS16.5.1更新
IT之家 6 月 13 日消息,根据日志中的证据,苹果似乎正在为 iPhone 准备新的 iOS 16.5...
手机互联 2023-06-13 10:58:42 -
Web3「最大震荡」,美监管铁拳砸向币安、Coinbase
综合报道7min readWeb3「最大震荡」,美监管铁拳砸向币安、Coinbase芯芯2023/06/07摘要136 页报告,刀刀致命。Web3 熊市未了,监管铁拳奔袭而至。当地时间 6 月 5 日和 6 日,美国证券交易委员会(SEC)对币安、Coinbase 两家全球最知名的加密币交易所,提出了一系列指控。在长达 136 页的报告中,SEC 对币安、及其创始人赵长鹏提出了多项证券法违规指控。「我们指控赵长鹏和币安实体涉嫌进行了一系列欺骗、利益冲突、缺乏披露和有计划地规避法律。」SEC 主席 Gary Gensler 表示,「公众应当警惕不要将他们辛苦赚来的资产投资到这些非法平台上。」6 日,SEC 又宣布了一系列新的指控,针对的是总部位于美国的 Coinbase。指控称,Coinbase 经营一家未经许可的证券交易所、经纪和清算机构,非法地促进了数十亿美元的加密资产证券买卖。对币安的重要指控:1「无牌交易所」2「无牌发行加密资产」3「允许美国用户在网站交易」4「误导投资者」5「挪用资产风险」打击结果:1 投资者从币安及其子公司账户撤出 7.9 亿美元资金;2 Coinbase 股价当日应声下跌超过 12%。去年,加密帝国 FTX 崩盘引发币圈巨震,比特币的价格在短短几天内下跌了近 25%。自那以来,监管机构开始对加密货币加大调查,当初赵长鹏的竞争对手——FTX 创始人 Sam Bankman-Fried 也被指控犯有证券欺诈、洗钱等罪行。如今,SEC 的两项执法行动将目标瞄准币圈两大巨头,币圈的寒冬要到来了吗?「无牌交易所」SEC 执法部门主管 Gurbir S...
区块链 2023-06-07 18:08:24 -
iOS17Beta测试版已推送:首批果粉更新反馈已出炉!
自从iOS17发布之后,已经有很多果粉迫不及待的进行更新尝试,也有的用户做起了等等党,看看这个版本会带来什么样的惊喜。不过这次的尝鲜难度比较大,注册了开发者账号的账户才能安装体验,如果没有的话,也就无法进行尝鲜...
手机互联 2023-06-07 01:28:58 -
苹果WWDC23即将召开,Meta抢先发布新款VR头戴式装置
《华尔街日报》6月2日消息,Meta首席执行官扎克伯格发布了该公司最新版的虚拟现实头戴式装置Meta Quest 3。产品采用高通新芯片,装置本身比前一代薄了40%,显示屏和分辨率也有所提升...
智能设备 2023-06-02 11:23:41 -
微软继续加注!与初创公司CoreWeave签署AI算力协议
①微软已经与CoreWeave签署人工智能算力协议,价值可能高达数十亿美元; ②CoreWeave写道,该公司提供的计算能力“比传统云提供商便宜80%”。 财联社6月2日讯(编辑 牛占林)对OpenAI的巨额投资,让微软在这场人工智能(AI)竞赛中捷足先登。与此同时,这家软件巨头还试图借助其他领域推动其人工智能业务的发展。美东时间周四,据知情人士透露,微软已经与初创公司CoreWeave签署人工智能算力协议,用于云计算基础设施,价值可能高达数十亿美元。CoreWeave周三宣布,已获得2亿美元融资。就在一个多月前,该公司获得了20亿美元的估值。CoreWeave周三宣布获得对冲基金Magnetar Capital的融资,是4月份2.21亿美元融资的延续。此外,英伟达在该公司之前的融资中投资了1亿美元。据悉,CoreWeave成立于2017年,最初是一家以太坊采矿企业,目前则专门提供基于图形处理单元(GPU)的云计算服务。CoreWeave旨在通过比超大规模企业更快的创新来主导人工智能技术,为蓬勃发展的行业提供支持。在人工智能热潮中,CoreWeave向这些人工智能公司出售算力,与微软Azure和亚马逊的AWS等云计算服务提供商展开竞争。CoreWeave在其网站中写道,该公司提供的计算能力“比传统云提供商便宜80%”,使用了一种名为无限带宽(InfiniBand)的网络技术将计算机连接在一起,为人工智能工作构建不同的数据中心。此外,CoreWeave还提供更便宜的Nvidia A40 GPU,主要用于视觉计算,而A100则主要针对人工智能、数据分析和高性能计算。CoreWeave首席执行官Michael Intrator表示,公司为生成式人工智能、大型语言模型和人工智能工厂提供加速计算基础设施的战略,将有助于为每个行业带来最高性能、最节能的计算平台。知情人士表示,为了确保ChatGPT未来拥有足够的算力,微软今年早些时候便与CoreWeave签署了协议。除了资金外,OpenAI还依赖微软的Azure云来满足计算需求。英伟达首席财务官Colette Kress在上周的财报电话会议上表示,公司业绩的增长趋势主要由数据中心推动,反映出与生成式人工智能和大型语言模型相关的需求急剧增长。Kress还提到了CoreWeave。3月份,英伟达首席执行官黄仁勋也提到了这家初创公司。CoreWeave联合创始人兼首席战略官Brannin McBee指出,他的公司与英伟达保持着密切的合作关系,在当前人工智能芯片稀缺的市场中,获得芯片供应至关重要,CoreWeave比许多规模更大的竞争对手更早地使用了英伟达的H100芯片。 ...
智能设备 2023-06-02 11:23:39 -
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
苹果首款头显RealityPro高清渲染图曝光:配“数字表冠”
IT之家 6 月 1 日消息,国外科技媒体 9to5Mac 基于现有公开的技术专利、相关报告,并参考部分传闻信息,制作了苹果首款 AR / VR 头显 Reality Pro 的高清渲染图。该媒体认为苹果 Reality Pro 头显采用类似于传统滑雪护目镜的设计,并融入了一些 Apple Watch、AirPods Max 的设计风格。在头显顶部配有两个物理按钮,左侧为一个可按击的按钮,用于开启 / 关闭某项软件功能;右侧为一个名为“Reality Dial”数字表冠,可以切换 AR 和 VR 场景视图。头显还配有一系列传感器和摄像头,但巧妙地伪装在框架中。头显的带子左侧是一体式的,无法取下,只有通过右侧取下。这款头显不内置电池,消费者需要额外佩戴连接到头显的电池组。在右侧还有一个可兼作充电器的扣子。我们想象这看起来很像感应式 Apple Watch 充电器。IT之家此前报道,罗斯・杨在推文中表示,苹果首款头显将配备 2 块 1.4 英寸的屏幕,材质为 Micro OLED(OLED on Silicon),亮度会超过 5000 尼特,像素密度为每英寸 4000 个像素点,每块屏幕的分辨率也达到了 4K。苹果的这款头显凭借着高于 5000 尼特的亮度,可以支持主流头显市场并不具备的 HDR 内容。 ...
智能设备 2023-06-01 10:45:39 -
苹果iOS/iPadOS16.6开发者预览版Beta2发布
IT之家 6 月 1 日消息,苹果今日向 iPhone 和 iPad 用户推送了 iOS/iPadOS 16.6 开发者预览版 Beta 2 更新(内部版本号:20G5037d),本次更新距离上次发布隔了 12 天。 本文由机器人发布,IT之家稍后将为大家带来具体更新内容。附 iOS/iPadOS 16 发布历史: ...
智能设备 2023-06-01 10:45:29 -
任天堂Switch模拟器YuzuEmulator登陆安卓平台
IT之家 5 月 31 日消息,近日 Yuzu 开发团队宣布,他们的任天堂 Switch 模拟器已经正式支持安卓平台。Yuzu 是目前 PC 上最受欢迎的 Switch 模拟器之一,能够让用户在更强大的硬件上玩自己喜爱的 Switch 游戏,现在其终于登陆了安卓平台...
智能设备 2023-05-31 10:53:51