-
超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品
白交 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。没关系,有人会出手!那个抢跑GPT-4看图能力几个月的迷你GPT-4升级啦——MiniGPT-v2。△(左边为GPT-4V生成,右边为MiniGPT-v2生成)而且只是一句简单指令:[grounding] describe this image in detail就实现的结果。不仅如此,还轻松处理各类视觉任务。圈出一个物体,提示词前面加个 [identify] 可让模型直接识别出来物体的名字。当然也可以什么都不加,直接问~MiniGPT-v2由来自MiniGPT-4的原班人马(KAUST沙特阿卜杜拉国王科技大学)以及Meta的五位研究员共同开发。上次MiniGPT-4刚出来就引发巨大关注,一时间服务器被挤爆,如今GItHub项目已超22000+星。此番升级,已经有网友开始用上了~多视觉任务的通用界面大模型作为各文本应用的通用界面,大家已经司空见惯了。受此灵感,研究团队想要建立一个可用于多种视觉任务的统一界面,比如图像描述、视觉问题解答等。「如何在单一模型的条件下,使用简单多模态指令来高效完成各类任务?」成为团队需要解决的难题。简单来说,MiniGPT-v2由三个部分组成:视觉主干、线性层和大型语言模型。该模型以ViT视觉主干为基础,所有训练阶段都保持不变。从ViT中归纳出四个相邻的视觉输出标记,并通过线性层将它们投影到 LLaMA-2语言模型空间中。团队建议在训练模型为不同任务使用独特的标识符,这样一来大模型就能轻松分辨出每个任务指令,还能提高每个任务的学习效率。训练主要分为三个阶段:预训练——多任务训练——多模式指令调整。最终,MiniGPT-v2 在许多视觉问题解答和视觉接地基准测试中,成绩都优于其他视觉语言通用模型。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。感兴趣的朋友,可戳下方Demo链接体验:https://minigpt-v2.github...
智能设备 2023-10-19 09:56:05 -
饭制PS6主机概念设计线条硬朗颇具工业美感
YankoDesign注意到索尼最新的一份职位招聘内容,该职位要求帮助公司“为未来的PlayStation平台确定和开发技术组合”,而后,YankoDesign就设计了PlayStation 6游戏主机的概念设计图。整体的设计语言相当大胆且激进,主机的线条非常硬朗,具有工业美感...
游戏资讯 2023-10-19 03:32:24 -
传《GTA6》视觉效果大升级顶尖的水面物理
据媒体报道,《GTA6》将有“令人印象深刻的”视觉升级,遥遥领先《荒野大镖客2》比《GTA5》的升级幅度。 消息来自于法国媒体Rockstar Mag,这家媒体报道称开发《GTA》系列新作的RAGE引擎新版本将引入一些重要的升级,这包括物理,时间流逝,渲染品质,AI等方面...
游戏资讯 2023-10-19 03:25:35 -
蛋仔派对编辑器让小白也能轻松DIY!无门槛,趣味地图自由设计
从近年来的发展来看,二创、又称UGC(用户创作内容)已经成为游戏长线运营中不可或缺的一个存在。而其中《蛋仔派对》的成功也印证了这条赛道的巨大潜力,它的乐园工坊编辑器提供了强大的创作便利性,让玩家们能够实现心中那些梦幻般的游戏场景...
游戏资讯 2023-10-19 03:24:47 -
圣莫妮卡分享奎爷黑熊斗篷设计思路:体现出无尽寒冬
圣莫妮卡工作室分享了《战神:诸神黄昏》中黑熊斗篷的设计思路和概念图,一起来了解一下。“随着芬布尔之冬的临近,我们的美术团队想要为奎托斯创造一个实用而真实的设计,从而在没有Huldra兄弟的帮助下呈现出无尽的冬天...
游戏资讯 2023-10-19 03:13:20 -
《往日之影》关卡设计师发长文:感谢玩家支持
《赛博朋克2077》的资料片“往日之影”已经发售了有一段时间,而CDPR的关卡设计师Bartek Pyrko今日在推特发布了长文,分享了一些看法。原文大意:时隔两周再次与大家见面,我想你们中的大多数人现在已经玩了《往日之影》,我一直在等炒作热度降低一些,现在我想和大家分享一些我个人对这款游戏的看法...
游戏资讯 2023-10-19 03:10:32 -
更有气势了!《碧琪公主表演时刻》视觉图调整
任天堂近日悄悄对Switch游戏《碧奇公主表演时刻》的封面视觉图进行了调整,主要集中在碧奇公主面部的微妙表情上。调整后似乎进一步强化了主角碧奇公主的气势,让玩家对游戏的精彩内容有更加直观的预期...
游戏资讯 2023-10-19 03:09:12 -
《漫威蜘蛛侠2》将与跨界明星合作设计新服装
有消息称,《漫威蜘蛛侠2》将在游戏首发之后推出新服装,而且对合作伙伴的选择也有些出人意料。 与首款游戏类似,《漫威蜘蛛侠2》在游戏首发之后也将推出一些新服装...
游戏资讯 2023-10-19 03:08:59 -
任天堂《碧奇公主表演时刻》视觉图进行调整
任天堂近日悄悄对Switch游戏《碧奇公主表演时刻》的封面视觉图进行了调整,主要集中在碧奇公主面部的微妙表情上。调整后似乎进一步强化了主角碧奇公主的气势,让玩家对游戏的精彩内容有更加直观的预期...
游戏资讯 2023-10-19 03:06:22 -
《极限竞速:Motorsport》MOD优化远距离阴影视觉效果
MOD作者Talal26为《极限竞速:Motorsport》发布全新MOD,为游戏的远距阴影进行优化。这个MOD可以明显优化游戏的视觉效果...
游戏资讯 2023-10-19 02:51:39 -
真我GT5Pro手机爆料:后置居中大圆镜头,设计“很影像旗舰”
IT之家 10 月 16 日消息,@数码闲聊站 今日上午放出了 realme 真我新机 —— 真我 GT5 Pro 的进一步消息,“也快登场了”。外观方面,@数码闲聊站 称该机将后置“居中大圆镜头”,主推素皮版本,是一款拥有“很影像旗舰”设计的新旗舰...
手机互联 2023-10-19 02:45:27 -
Analogue3D任天堂N64平替主机原创设计性能加强
一直在致力于复刻平替经典游戏机的Analogue公司日前公布了最新项目,“Analogue 3D”的任天堂N64平替主机,官方表示新主机为弃原版元素的原创设计并性能加强,敬请期待。·据悉,“Analogue 3D”将带来完全弃原版元素的原创设计,采用FPGA设计,在原版解像度模式基础上追加4K级别,支持美、欧、日本所有地狱的100%兼容性,支持蓝牙以及2.4Ghz无线连接,并支持4个控制器使用,还采用公司独创Analogue OS操作系统等等特征。·“Analogue 3D”预定2024年发售,感兴趣的玩家可以关注下了。 ...
游戏资讯 2023-10-19 02:36:15