-
超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品
白交 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。没关系,有人会出手!那个抢跑GPT-4看图能力几个月的迷你GPT-4升级啦——MiniGPT-v2。△(左边为GPT-4V生成,右边为MiniGPT-v2生成)而且只是一句简单指令:[grounding] describe this image in detail就实现的结果。不仅如此,还轻松处理各类视觉任务。圈出一个物体,提示词前面加个 [identify] 可让模型直接识别出来物体的名字。当然也可以什么都不加,直接问~MiniGPT-v2由来自MiniGPT-4的原班人马(KAUST沙特阿卜杜拉国王科技大学)以及Meta的五位研究员共同开发。上次MiniGPT-4刚出来就引发巨大关注,一时间服务器被挤爆,如今GItHub项目已超22000+星。此番升级,已经有网友开始用上了~多视觉任务的通用界面大模型作为各文本应用的通用界面,大家已经司空见惯了。受此灵感,研究团队想要建立一个可用于多种视觉任务的统一界面,比如图像描述、视觉问题解答等。「如何在单一模型的条件下,使用简单多模态指令来高效完成各类任务?」成为团队需要解决的难题。简单来说,MiniGPT-v2由三个部分组成:视觉主干、线性层和大型语言模型。该模型以ViT视觉主干为基础,所有训练阶段都保持不变。从ViT中归纳出四个相邻的视觉输出标记,并通过线性层将它们投影到 LLaMA-2语言模型空间中。团队建议在训练模型为不同任务使用独特的标识符,这样一来大模型就能轻松分辨出每个任务指令,还能提高每个任务的学习效率。训练主要分为三个阶段:预训练——多任务训练——多模式指令调整。最终,MiniGPT-v2 在许多视觉问题解答和视觉接地基准测试中,成绩都优于其他视觉语言通用模型。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。感兴趣的朋友,可戳下方Demo链接体验:https://minigpt-v2.github...
智能设备 2023-10-19 09:56:05 -
《使命召唤20》测试版听取玩家意见:削弱了新能力
《使命召唤》作为老牌多人游戏系列,在运营的过程中需要不断的进行内容更新,不仅仅是为了添加新内容新玩法,而且需要时常针对环境做出合适的平衡补丁来维护游戏的公平性。在测试开启后,系列粉丝们就开始涌入《现代战争3》测试版,并向开发商Sledgehammer Games提供有关如何改进游戏的反馈...
游戏资讯 2023-10-19 03:34:09 -
梦幻西游175级龙宫10月大改伤害测试潜龙在渊加强连续点杀能力
近日,《梦幻西游》电脑版在测试区上线了关于2023年10月门派大改的相关内容,而龙宫这一门派,则是主要针对“海中蛟虬”和“沧海潜龙”两个流派进行调整,虽说猪队长早在上个月的预测时候就断定龙宫会修改,但万万没想到居然到了这种程度。下面,就带大家看看,这次龙宫的改动,到底意味着什么?一、2023年10月测试服龙宫调整内容本次测试服对于龙宫的门派调整看似较少,但实际上传达了一个新的观念...
游戏资讯 2023-10-19 02:30:29 -
观点|APUS李涛:大模型是AI时代的灵魂,将重塑千行万业
【网易科技10月18日报道】近日,APUS董事长兼CEO李涛在第四届深圳国际人工智能展上发表演讲,表示APUS将坚持“四步走”路线,即内部提效工具、现有产品进化、AI+场景重塑、构建新产业引擎,并指出“大模型是AI时代的灵魂,将重塑千行万业,引领行业革新”的大模型定位。据了解,此次APUS获得了 「最佳人工智能企业」、「最具品牌影响力人工智能企业」双项企业级奖,李涛荣膺「2023年中国人工智能卓越人物奖」,共3项大奖...
智能设备 2023-10-19 02:15:50 -
阿里云AI新产品“通义听悟”宣布公测可体验大模型摘要能力
【网易科技6月1日报道】阿里云宣布通义大模型进展,聚焦音视频内容的AI新品“通义听悟”正式上线。记者获悉,通义听悟接入了通义千问大模型的理解与摘要能力,可成为用户工作学习中的得力AI助手,帮助随时随地高效完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等...
智能设备 2023-06-01 11:32:44 -
钉钉斜杠“/”来了!具备文生文、文生图、应用生成等AI能力
【网易科技5月31日报道】今日,面向企业用户,钉钉斜杠“/”正式启动邀请测试,这是钉钉宣布接入大模型后智能化的最新进展。本次邀测开放了钉钉群聊、文档、视频会议及应用开发等场景,涉及文生文、文生图、摘要总结和应用生成等多种AI能力,输入“/”即可让AI自动进行开发应用、写文章、画画、整理纪要等...
智能设备 2023-05-31 14:16:54 -
实时处理照片和视频等,英特尔演示MeteorLake上的VPU能力
IT之家 5 月 30 日消息,英特尔在近日召开的 Computex 2023 大会上,展示了 Meteor Lake 处理器原型,重点演示了该处理器中协处理器 VPU 的一些功能。Meteor Lake 处理器不再使用单片式设计(monolithic design),而是采用分散式设计,组合通过的 chiplets 来满足不同工作任务。Meteor Lake 中提供的多功能处理单元(VPU),主要技术来自于英特尔 2016 年收购的 Movidius 公司。英特尔通过引入 VPU,可以加速处理 AI 算法和机器学习模型相关的任务。Meteor Lake 中的 VPU 主要任务包括实时处理照片和视频、过滤应用、自动模糊背景、缩放应用、替换图像等等,此外 VPU 还具备实时识别用户眼球运动和手势的能力。IT之家此前报道,这颗处理器是在两周前完成的,拥有 16 核 22 个线程、1.6 MB 的 L1 缓存、18 MB 的 L2 缓存和 24 MB 的 L3 缓存。 ...
智能设备 2023-05-30 10:51:49 -
菜鸟万霖全员信回应上市:加快能力建设建设全球领先数智物流集团
5月19日消息,昨日晚间,在菜鸟启动IPO计划和十周年来临之际,菜鸟集团CEO万霖发出全员信,希望全体菜鸟员工加快能力建设,开启新的创业征程,争取未来十年成为全球领先的综合数智物流集团。当天,阿里巴巴控股集团发布财报,菜鸟将启动探索上市,预计在未来12-18个月内完成...
互联网 2023-05-19 13:39:31 -
OPPOReno10即将发布,FindX6系列影像能力下放,你感兴趣吗?
OPPO Reno10 系列官宣,5 月 24 日正式发布,该机有哪些亮点?看了这个发布会的时间,我心里长长地呼了一口气,多亏是在5月24日发布,不是在5月20日之前发布,OPPO Reno系列一款主打颜值时尚的手机。购买人群比较集中在女性群体,而如今正好到了520这个关口,送礼物就是一个最值得关注的事情,也许很多女孩子们正期望男朋友和老公给换手机!但是优先级肯定是iPhone手机,接着才是OPPO Reno系列和vivoS系列!对于这款手机从官方释放的消息可以看出,大内存是OPPO这两年最大的卖点,16G+256G起步,这款手机的摄像头分布也能看出来是有潜望式镜头要上了!(潜望式镜头总是有着那么明显的标志性,无论是哪家手机厂商采用潜望式,都设计成为了方形的!)乍一看有点OPPO findX6设计师的味道,只是镜头模组地方从占地面积特别大的圆形做成了椭圆形放在侧边设计!不得不感慨一句,设计师可能偷懒了哦,往期的作品reno系列和find X系列还是有一些差异的...
手机互联 2023-05-19 08:49:43 -
WPSAI展示类微软Copilot能力:接入文字、表格、PPT、PDF四大办公组件
5月16日消息, WPS AI正式对外展示了类微软Copilot的能力,继4月18日搭载在轻文档落地后,WPS AI加速进化,接入了文字、海外版表格、PPT演示文稿、PDF四大日常办公组件。WPS AI现已支持输入主题一键生成PPT演示文稿,并且还可以提供进一步细化调节的功能...
互联网 2023-05-16 09:59:22 -
谷歌将在开发者大会上发布PaLM2展示创意写作和编码能力
5月9日消息,据泄露的内部文件显示,人工智能将成为谷歌今年开发者大会GoogleI/O的中心主题,该公司计划发布一系列生成式人工智能(AIGC)功能更新,包括推出通用的大型语言模型(LLM)。这份内部文件显示,谷歌将推出其最新、最先进的LLM——PaLM2...
业界动态 2023-05-09 07:12:32 -
“三项能力超ChatGPT”,科大讯飞星火大模型现场接受挑战
杨净发自合肥量子位|公众号QbitAI“三项能力超过ChatGPT”“1024将整体超过GPT水平!”在科大讯飞星火认知大模型发布会现场,董事长刘庆峰拍着胸脯保证,引起现场掌声雷动!而真机演示效果和多场景产品展示直接把观众们看呆:信息量太大。网友也围观直呼:这个输出速度也太快了!比如这个随机问的问题,人类要被AI笑死...
智能设备 2023-05-07 12:44:05