-
PSAI修图免费平替来了!StabilityAI又放大招,核弹级更新一键扩图
新智元报道编辑:编辑部【新智元导读】Stability AI再放大招,Uncrop Clipdrop一键扩图+重构图片,Photoshop Generative Fill免费平替来了。此前,PS的重建图像功能就让人无比振奋,让无数人惊呼今天,Stability AI又放大招了。它联合Clipdrop推出了Uncrop Clipdrop——一个终极图像比例编辑器。从Uncrop这个名字上,我们就能看出它的用途。它是一个AI生成的「外画」工具,通过创建扩展背景,这个工具可以补充任何现有照片或图像,来更改任何图像的比例。敲黑板:通过Clipdrop网站,就可以免费试用这个工具了,无需登录!比例任意调,满意为止Uncrop基于Stability AI的文本到图像模型Stable Diffusion XL构建。通过先进的算法和深度学习技术,Uncrop会自动分析上传图像中的内容,然后生成视觉上合理的产出。这可解了许多修图师和画手的燃眉之急了。拍了一张近乎完美的照片,就是构图不尽人意,怎么办?Uncrop给你一键解决!很多时候,为了让图像显示在横幅或大画布上,我们都需要调整图像大小,把它调到合适的尺寸,而且不能扭曲,不能丢失重要的细节,Uncrop完全解决了这样的烦恼。拍出的横图想变竖图?Uncrop帮你解忧。竖图变横图?也是易如反掌。比例不合适的照片,可以随意拉到你想要的比例。不过呢,Uncrop也有自己的局限性。如果是极端的未剪裁图像,或者大量缺失内容的图像,会产生不太准确的结果。因此,我们需要尽可能确保原始图像的高质量,才能获得最佳效果。另外,Uncrop是依靠算法来分析周围的像素、填补空白,它的精度可能会因为场景的复杂性而不同。效果演示官方的介绍效果视频:网友们分享了自己做的外画效果实例:上手体验看到效果这么好,小编忍不住手痒了,立马上手实测了一波。实操起来感受就是:操作非常方便。就像上边的GIF展示的那样,选好一张图片,拖拽到页面中的指定区域。就可以像下图这样选择自己想要扩展的范围,然后等几秒钟,平台就会生成4张扩展完成的图片供你挑选保存。而且还可以针对某一张生成的图片结合Clipdrop的AI修图进行再加工。去除背景。锐化。再让AI对处理过的图片进行风格重构。经过几次AI的套娃生成加工之后,图片不仅仅被扩展了,还可以根据用户的具体需求进行风格和内容上的彻底「进化」。这时候,就是设计师们发挥自己的创造力的时候了!我们也针对人像,运动场景,静物场景做了一些测试。人像原图扩展效果扩展出来的部分效果确实挺自然。不过因为不能用Prompt指引方向,扩展的效果比较随机。重构效果扩展后重构效果AI生成人物图像的老问题手指解决的还是不理想。而且重构之后小姐姐的身体比例稍微有点问题,颜值也感觉降低了。静物原图扩展效果扩展效果比较自然,几乎看不出什么违和感。扩展重构效果但是重构之后线条扭曲的比较明显,整个画面的风格会有比较大的变化。运动场景原图扩展效果很敏感地捕捉到了图片的动态风格,扩展效果不错。扩展后重构效果重构之后主体已经消失,只留下动态的模糊画面,AI对于内容要点把握的还不好。当我尝试想让一张风景照无限扩展变成一张全景照片时。发现对于已经被扩展过的部分,Uncrop的扩展功能是不能继续套娃的。开源版SD-XL4月,Stability AI将Stable Diffusion XL开始面向公众测试。值得一提的是,开源的SD-XL就已经达到了Midjourney水平,能够图像细节等方面表现更好,几乎完全可控。关于Stable Diffusion XL模型的具体信息,官方并没有透露太多,目前只知道是一个与v2模型架构相似、但规模和参数量更大的模型。SD-v2.1包括9亿参数,SD-XL大约有23亿参数,Emad表示正式版可能会额外发布一个更小的蒸馏版本。SD-XL相比之前版本的改进如下:使用较短的描述性prompt即可生成高质量图像可以生成更贴合prompt的图像图像中的人体结构更合理与 v2...
智能设备 2023-06-13 10:59:19 -
索尼XperiaPro-III曝光:双一英寸大底传感器+16GB内存
索尼XperiaPro-I II曝光:双一英寸大底传感器+16GB内存根据相关的爆料信息显示,索尼 Xperia Pro-I II 的硬件配置非常激进,其中包括两个一英寸大底图像传感器。这将是一项非常重要的改进,因为传统手机的图像传感器通常只有1/1.5英寸到1/2...
手机互联 2023-06-13 10:58:42 -
微软Win11Canary预览版25381.1200发布
IT之家 6 月 7 日消息,微软今天面向 Canary 频道发布了 Windows 11 Build 25381.1200 小型服务更新,具体补丁为 (KB5027849)。Windows Insider Program 官方推特号表示,此特定更新不包含任何新功能,微软表示推出此更新是为了“测试服务管道”。IT之家曾报道,微软此前发布了 Windows 11 Canary 更新 Build 25381,使 SMB 签名成为企业版操作系统的默认设置。微软还发布公告称,新的 SMB 签名默认设置将添加到“未来几个月的专业版、教育版和其他 Windows 版本,以及 Windows Server”。微软表示,这一变化是“为现代环境提高 Windows 和 Windows Server 安全性的活动的一部分”。 ...
智能设备 2023-06-07 10:47:59 -
微软继续加注!与初创公司CoreWeave签署AI算力协议
①微软已经与CoreWeave签署人工智能算力协议,价值可能高达数十亿美元; ②CoreWeave写道,该公司提供的计算能力“比传统云提供商便宜80%”。 财联社6月2日讯(编辑 牛占林)对OpenAI的巨额投资,让微软在这场人工智能(AI)竞赛中捷足先登。与此同时,这家软件巨头还试图借助其他领域推动其人工智能业务的发展。美东时间周四,据知情人士透露,微软已经与初创公司CoreWeave签署人工智能算力协议,用于云计算基础设施,价值可能高达数十亿美元。CoreWeave周三宣布,已获得2亿美元融资。就在一个多月前,该公司获得了20亿美元的估值。CoreWeave周三宣布获得对冲基金Magnetar Capital的融资,是4月份2.21亿美元融资的延续。此外,英伟达在该公司之前的融资中投资了1亿美元。据悉,CoreWeave成立于2017年,最初是一家以太坊采矿企业,目前则专门提供基于图形处理单元(GPU)的云计算服务。CoreWeave旨在通过比超大规模企业更快的创新来主导人工智能技术,为蓬勃发展的行业提供支持。在人工智能热潮中,CoreWeave向这些人工智能公司出售算力,与微软Azure和亚马逊的AWS等云计算服务提供商展开竞争。CoreWeave在其网站中写道,该公司提供的计算能力“比传统云提供商便宜80%”,使用了一种名为无限带宽(InfiniBand)的网络技术将计算机连接在一起,为人工智能工作构建不同的数据中心。此外,CoreWeave还提供更便宜的Nvidia A40 GPU,主要用于视觉计算,而A100则主要针对人工智能、数据分析和高性能计算。CoreWeave首席执行官Michael Intrator表示,公司为生成式人工智能、大型语言模型和人工智能工厂提供加速计算基础设施的战略,将有助于为每个行业带来最高性能、最节能的计算平台。知情人士表示,为了确保ChatGPT未来拥有足够的算力,微软今年早些时候便与CoreWeave签署了协议。除了资金外,OpenAI还依赖微软的Azure云来满足计算需求。英伟达首席财务官Colette Kress在上周的财报电话会议上表示,公司业绩的增长趋势主要由数据中心推动,反映出与生成式人工智能和大型语言模型相关的需求急剧增长。Kress还提到了CoreWeave。3月份,英伟达首席执行官黄仁勋也提到了这家初创公司。CoreWeave联合创始人兼首席战略官Brannin McBee指出,他的公司与英伟达保持着密切的合作关系,在当前人工智能芯片稀缺的市场中,获得芯片供应至关重要,CoreWeave比许多规模更大的竞争对手更早地使用了英伟达的H100芯片。 ...
智能设备 2023-06-02 11:23:39 -
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
苹果首款头显RealityPro高清渲染图曝光:配“数字表冠”
IT之家 6 月 1 日消息,国外科技媒体 9to5Mac 基于现有公开的技术专利、相关报告,并参考部分传闻信息,制作了苹果首款 AR / VR 头显 Reality Pro 的高清渲染图。该媒体认为苹果 Reality Pro 头显采用类似于传统滑雪护目镜的设计,并融入了一些 Apple Watch、AirPods Max 的设计风格。在头显顶部配有两个物理按钮,左侧为一个可按击的按钮,用于开启 / 关闭某项软件功能;右侧为一个名为“Reality Dial”数字表冠,可以切换 AR 和 VR 场景视图。头显还配有一系列传感器和摄像头,但巧妙地伪装在框架中。头显的带子左侧是一体式的,无法取下,只有通过右侧取下。这款头显不内置电池,消费者需要额外佩戴连接到头显的电池组。在右侧还有一个可兼作充电器的扣子。我们想象这看起来很像感应式 Apple Watch 充电器。IT之家此前报道,罗斯・杨在推文中表示,苹果首款头显将配备 2 块 1.4 英寸的屏幕,材质为 Micro OLED(OLED on Silicon),亮度会超过 5000 尼特,像素密度为每英寸 4000 个像素点,每块屏幕的分辨率也达到了 4K。苹果的这款头显凭借着高于 5000 尼特的亮度,可以支持主流头显市场并不具备的 HDR 内容。 ...
智能设备 2023-06-01 10:45:39 -
苹果邀请开发者“编码新世界”,暗示即将推出RealityPro头显
IT之家 5 月 31 日消息,距离苹果公司的全球开发者大会(WWDC)只有不到一周的时间,苹果公司在其开发者网站上发布了一篇博客文章,暗示了即将推出的 Reality Pro 头戴式设备,邀请开发者关注并学习如何“编码新世界(Code new worlds)”。“编码新世界”这一标语是苹果公司今天才开始使用的,明显是对新软件平台的暗示...
智能设备 2023-05-31 10:53:49 -
摩托罗拉MotoGStylus5G(2023)发布,搭载骁龙6Gen1芯片
IT之家 5 月 31 日消息,摩托罗拉推出了其第三代 Moto G Stylus 5G 手机,是首批采用高通骁龙 6 Gen 1 芯片组的设备之一。该设备保留了位于充电端口旁边的标志性手写笔,但不支持三星 Galaxy S23 Ultra 的 S Pen 那样的蓝牙或压感功能。Moto G Stylus 5G (2023) 采用 6.6 英寸 FHD + 分辨率的 IPS LCD 屏幕,刷新率为 120Hz。屏幕上有一个小小的孔洞,用于放置 1600 万像素的前置摄像头。今年的 Moto G Stylus 在后面增加了一颗 5000 万像素的主摄像头(f / 1...
手机互联 2023-05-31 07:54:45 -
百度何俊杰:全线拥抱AI,百度移动生态要为十亿用户打造“PersonalAI”
5月25日消息,2023万象·百度移动生态大会上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰提出,要以AI原生思维重构百度移动生态,全面“刷新”百度搜索、百度APP、百度文库、百度电商等产品与服务的用户体验,推动人机交互、内容生产、营销与商业三重变革。他表示,之前文心一言、ChatGPT等大语言模型是在让AI变“大”,移动生态的这次重构,就是要致力于让AI变“小”,变得更具体,变得人人可用。百度集团副总裁、搜索平台负责人肖阳提出基于“语义检索技术+大语言模型”的双重能力,引领搜索代际变革体验。百度搜索基于大模型创新打造的极致满足、“AI伙伴”、“AI BOT”等功能目前也正在内测中。搜索体验变革主要体现在三方面。在用户需求满足上,百度基于大语言模型和AI技术积累,让更多、更复杂的问题在第一条搜索结果中得到全面满足;在用户表达上,“AI伙伴”可以实现智能对话、多轮交互,极大降低了用户的输入表达门槛和成本;在信息边界的突破上,AI BOT为创作者、商家、机构、品牌等领域的内容、服务提供者们制作虚拟的AI分身,助力生态伙伴提升创作和服务效率。在过去一年,百度APP月活已达到6.57亿。百度信息分发平台总经理李小婉表示,百度APP今年将推出智能首页模式“一人一世界”,用户可以根据自己心意和习惯选择默认首页、大图首页、视频首页、小说首页等,满足更多元的个性化需求。 同时,她还首次展示了内测产品NEW APP,用新概念、新功能,以及一人一模型的未来远景。 目前产品的核心使用场景是对话,提问、聊天、发送指令等,用户还可指定不同“人设”的私人助理,了解用户的喜好和需求,随时对话交流,还可以给予有效建议,处理大小事务。此外,百度输入法也创新打造了AI“高情商沟通助手”,根据不同社交场景给出高情商聊天建议,为用户带来更加智能、高效的社交体验。2022年万象大会上,百度推出“创作者AI助理团”,至今已有45万创作者使用,产出超700万篇内容,累计分发量超过200亿。而在今年万象大会上,百度移动生态事业群组内容生态平台副总经理宋健介绍了全新升级的百度内容生态AIGC创作工具,AI笔记、AI成片、AI作画、AI BOT等功能将面向创作者开启内测体验,更多AI写作、AI数字人功能也即将上线,为创作者提供一站式AI创作方案,推动生产方式根本性变革。截止目前,超过600万创作者在百度创作与分享,创作者多元收入规模同比增长397%,商单收入、电商收入、付费订单量等多元业务均呈现高速增长态势。对创作者,百家号升级为“百度AI创作经营平台”,帮助创作者在AI提效、内容分发、多元变现、影响力建设等多个维度实现跨越性的突破。同时,百度推出创作者成长扶持计划“AI共创计划”,计划扶持10万创作者收入超30亿。“未来,谁拥有最佳的跟客户沟通的方式,谁就会拥有这个客户”,何俊杰指出。营销行业是AIGC的“先行示范区”,有机构预测,2022年,大型组织的营销信息2%由AI生成,到2025年,这一数据将上升到30%。据悉,百度从2014年开始,就在尝试“AIGC文本创意”。到目前,单条创意耗时从30分钟降到4分钟,AI辅助创作的文本创意每天生产14亿条,近七成企业都用到这个功能,近三分之一的创意展现都有AIGC参与。对于商家,百度副总裁、百度电商总经理平晓黎表示同步推出智能电商新品牌“百度优选”,发布了包含AI导购助手、电商AI主播制作平台、商家经营能力模型、商家成长体系、智能经营平台等一系列创新技术和智能商家经营方案。为助力商家和合作伙伴成长,平晓黎还发布百度电商超级生态计划,将助力1000个千万GMV爆款商品,100个年销售额过亿的商家,以及15个GMV过亿的服务商合作伙伴,与百度电商共同实现更大的生意机会。(一橙) ...
业界动态 2023-05-25 13:06:05 -
索尼发布新机Xperia1V,搭载双层晶体管像素堆叠式CMOS影像传感器
5月24日消息,在“Sony Expo 2023”展前媒体发布会上,索尼(中国)有限公司总裁吉田武司提出了索尼在华发展的愿景:“激发灵感与热情,与追梦者共创感动。”他表示,“中国有很多对未来充满热情和憧憬的追梦者,他们虽来自不同年龄层,不同领域,但他们都拥有勇于创新,不断突破极限的可贵的精神,这同样是索尼创业以来,传承至今的精神...
业界动态 2023-05-24 18:49:55 -
英伟达发布GeForceRTX4060/4060Ti:起售价分别为人民币2399元/3199元
英伟达宣布,推出基于Ada Lovelace架构的新一代主流GPU,包括GeForce RTX 4060、RTX 4060 Ti 8GB和RTX 4060 Ti 16GB三款,对应的官方建议零售价分别为299美元/人民币2399元、399美元/人民币3199元和499美元/人民币3899元。其中GeForce RTX 4060 Ti 8GB将于2023年5月23日晚上解禁,并在5月24日21点正式发售,而剩下两款显卡要等到7月份。值得一提的是,GeForce RTX 4060 Ti 8GB会有Founder Edition,也就是公版显卡,由京东商城独家发售。GeForce RTX 4060 Ti搭载了AD106-350(8GB)/351(16GB)GPU,采用PCIe 4.0 x8接口,完整版本芯片拥有36组SM、4608个CUDA核心、36个RT核心和144个Tenor核心,不过RTX 4060 Ti只开启了其中34组SM,也就是4352个CUDA核心、34个RT核心和136个Tensor核心。此外,还带有一个第8代NVENC编码器和一个第5代NVDEC解码器,支持AV1硬件编解码。GeForce RTX 4060 Ti的基础频率为2310 MHz,加速频率为2535 MHz,搭配8GB或16GB的GDDR6显存,显存位宽为128-bit,显存速率为18Gbps频率,显存带宽为288 GB/s,整卡功耗为160W。英伟达表示,通过32MB的L2缓存,显存等效带宽增大至554 GB/s。GeForce RTX 4060搭载了AD107-400 GPU,采用PCIe 4...
智能设备 2023-05-19 11:51:46 -
利润成倍增长后,Tether决定拿出15%增持比特币作为储备资产
界面新闻记者|司马林威5月17日,全球最大的美元稳定币发行商Tether宣布,将从本月开始使用部分利润定期购买比特币 ( BTC ) 作为其稳定币储备,将分配高达约15%的已实现投资利润(不包括其储备资产的任何未实现价格增值)来购买比特币,并将这些代币添加到其储备盈余中。Tether的首席技术官保罗·阿多伊诺 (Paolo Ardoino) 表示:“比特币不断证明其韧性,并已成为具有巨大增长潜力的长期价值储存手段。其有限的供应、分散的性质和广泛的采用使比特币成为机构和散户投资者的首选。”加密稳定币现在是一个市值1310亿美元的资产类别,已成为加密货币基础设施的重要组成部分,通过将其价格锚定在法定货币(通常是美元)上,它充当着法定货币和加密货币之间的交易媒介。而Tether公司发行的USDT目前是为全球最大的美元稳定币,市值约820亿美元。根据其规定,每一枚USDT都将锚定一美元市值。本月初,Tether公司发布了一份与公共会计师事务所BDO Italia审计后的财务报告,报告显示其第一财季净利润为15亿美元,是上一财季的两倍多。其在第一财季结束时的合并总资产为820亿美元,高于2022年底的670亿美元。截至3月底,Tether持有超过690亿美元的现金和现金等价物,其中530亿美元为短期美国国债。在2022年底,Tether持有550亿美元的现金和现金等价物,其中390亿美元为短期国债。Tether目前还持有价值15亿美元的比特币和价值34亿美元的黄金。同时,该公司强调自己的超额储备创造了历史峰值,截至2023年5月9日,该公司管理层声明集团综合总资产至少达818亿美元,综合负债总额为793亿美元,这些负债主要源自其发行的加密稳定币。Tether的超额储备在一季度创造了24.4亿美元的历史新高。Tether的报告是由BDO Italia会计师事务所进行的最新认证的一部分。与全面审计不同,认证只记录公司在某个时间点的财务状况。但该公司最近受到指控,称其准备金索赔“可疑”。前美国证券交易委员会前执法律师约翰·里德·斯塔克 (John Reed Stark) 辩称,该公司定期未经审计的证明“毫无意义”。《华尔街日报》3月份报道称,Tether的公司使用了虚假文件和空壳公司,但Tether称这一指控“完全不准确且具有误导性”。和另一家在美国银行业危机遭遇动荡的稳定币发行商Circle不一样,多年来,Tether因其储备缺乏透明度和有争议的投资决策而在加密行业受到批评。不过,美国区域银行业危机打击了Circle发行的第二大美元稳定币USDC。硅谷银行 (SVB) 的突然倒闭导致USDC的部分现金储备冻结在银行,使得这种稳定币暂时失去了与美元挂钩的能力。而另一家竞争对手,发行了第三大美元稳定币BUSD的Paxos,在美国监管压力下已经放弃了这一业务,因此Tether发行的USDT成为了近期加密稳定币需求的首选。截至发稿前,比特币最新报价为27332美元,24小时涨幅0...
区块链 2023-05-18 11:33:44