-
超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品
白交 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。没关系,有人会出手!那个抢跑GPT-4看图能力几个月的迷你GPT-4升级啦——MiniGPT-v2。△(左边为GPT-4V生成,右边为MiniGPT-v2生成)而且只是一句简单指令:[grounding] describe this image in detail就实现的结果。不仅如此,还轻松处理各类视觉任务。圈出一个物体,提示词前面加个 [identify] 可让模型直接识别出来物体的名字。当然也可以什么都不加,直接问~MiniGPT-v2由来自MiniGPT-4的原班人马(KAUST沙特阿卜杜拉国王科技大学)以及Meta的五位研究员共同开发。上次MiniGPT-4刚出来就引发巨大关注,一时间服务器被挤爆,如今GItHub项目已超22000+星。此番升级,已经有网友开始用上了~多视觉任务的通用界面大模型作为各文本应用的通用界面,大家已经司空见惯了。受此灵感,研究团队想要建立一个可用于多种视觉任务的统一界面,比如图像描述、视觉问题解答等。「如何在单一模型的条件下,使用简单多模态指令来高效完成各类任务?」成为团队需要解决的难题。简单来说,MiniGPT-v2由三个部分组成:视觉主干、线性层和大型语言模型。该模型以ViT视觉主干为基础,所有训练阶段都保持不变。从ViT中归纳出四个相邻的视觉输出标记,并通过线性层将它们投影到 LLaMA-2语言模型空间中。团队建议在训练模型为不同任务使用独特的标识符,这样一来大模型就能轻松分辨出每个任务指令,还能提高每个任务的学习效率。训练主要分为三个阶段:预训练——多任务训练——多模式指令调整。最终,MiniGPT-v2 在许多视觉问题解答和视觉接地基准测试中,成绩都优于其他视觉语言通用模型。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。感兴趣的朋友,可戳下方Demo链接体验:https://minigpt-v2.github...
智能设备 2023-10-19 09:56:05 -
《TheFront》steam抢先体验开启开放世界生存建设
Samar Studio工作室制作并发行,一款开放世界生存建设打怪种地无所不能的新游戏《The Front》steam抢先体验今天开启,本作支持中文,感兴趣的玩家可以关注下了。《The Front》是一款战争题材的开放世界生存建造游戏...
游戏资讯 2023-10-19 03:15:21 -
《TheFront》steam抢先体验开启开放世界生存建设
Samar Studio工作室制作并发行,一款开放世界生存建设打怪种地无所不能的新游戏《The Front》steam抢先体验今天开启,本作支持中文,感兴趣的玩家可以关注下了。《The Front》是一款战争题材的开放世界生存建造游戏...
游戏资讯 2023-10-19 03:15:21 -
《VEILEDEXPERTS幕后高手》首个正式赛季开启
由Nexon开发和发行的Steam免费第三人称射击游戏《VEILED EXPERTS 幕后高手》首个正式赛季“STAGE 1 OPERATION 1 – CODENAME: EZ”将在10月12日开启,新赛季包含大量全新游戏内容,不仅有全新战斗通行证、新角色、新地图、新武器和新活动,游戏还会添加新反作弊系统BattlEye,提高反作弊力度,并维护正常游戏环境。在《VEILED EXPERTS 幕后高手》新赛季中,游戏首个全面战斗通行证将正式上线,升级完全免费...
游戏资讯 2023-10-19 03:12:48 -
《TheTaintedLand》Steam页面上线不支持中文
今日(10月12日),2D回合制RPG游戏《The Tainted Land》Steam页面上线,暂不支持简体中文,感兴趣玩家可以点击此处进入商店页面。 游戏介绍: 《The Tainted Land》是一款经典的2D回合制角色扮演游戏,该作讲述了黑暗和恐怖世界中的史诗冒险,作为古代守护者组织的最后一名成员,你必须召集盟友,探索沉睡着过去黑暗时代秘密的荒野,并消灭难以言表的恐怖...
游戏资讯 2023-10-19 03:07:35 -
《我们之中》新地图TheFungle将于10月25日上线
经典太空狼人杀游戏《我们之中》新地图The Fungle将于10月25日上线,这里将是一片有着繁茂蘑菇的圣地,敬请期待。 《我们之中》是一款由Innersloth制作发行的策略休闲游戏...
游戏资讯 2023-10-19 02:54:10 -
《RPGMakerWITH》宣布登陆NS发售时间未公布
Gotcha Gotcha Games宣布角色扮演游戏《RPG Maker WITH》将登陆Switch平台,发售时间暂未公开。《RPG Maker WITH》除了针对主机进行游戏创作之外,游戏还添加了“资源共享”等新元素,可以允许用户和其他玩家一起创作游戏...
游戏资讯 2023-10-19 02:29:16 -
大模型无法替代码农!普林斯顿芝大惊人发现:GPT-4解决GitHub编程问题成功率为0
新智元报道编辑:编辑部【新智元导读】ChatGPT之类的AI编码工具来势汹汹,Stack Overflow又裁员了!不过,普林斯顿和芝大竟发现,面对真实世界GitHub问题,GPT-4的解决率竟是0%。Stack Overflow,已经被ChatGPT创飞了!因为码农大量涌向ChatGPT、Github Copilot,Stack Overflow今天不得已宣布裁员100多人,几乎占员工人数的1/3。所以,ChatGPT这类AI编码工具,真的要颠覆整个行业了?不过最近,普林斯顿和芝大的一项研究发现,LLM想要替代码农,其实没那么容易。论文地址:https://arxiv.org/abs/2310...
智能设备 2023-10-19 02:14:55 -
ProductofThailand,苹果MacPro新增泰国产品标签
IT之家 6 月 13 日消息,根据 FCC 披露的文件信息,苹果新款 Mac Pro 虽然仍在美国完成组装,但产品标签上新增了 1 个“Product of Thailand”的标签。苹果在 2019 年推出上一代 Mac Pro 时主打“美国制造”,其组件由十几家美国公司设计,开发和制造,并交付给美国客户。而在最新 Mac Pro 产品铭牌上,印有一个“Product of Thailand”的标签。国外科技媒体 MacRumors 就此事联系了苹果,目前尚未得到回应。IT之家在此附上在美国销售的 2019 年 Mac Pro 型号的铭牌如下:“Designed by Apple in California. Assembled in USA...
智能设备 2023-06-13 11:00:43 -
索尼XperiaPro-III曝光:双一英寸大底传感器+16GB内存
索尼XperiaPro-I II曝光:双一英寸大底传感器+16GB内存根据相关的爆料信息显示,索尼 Xperia Pro-I II 的硬件配置非常激进,其中包括两个一英寸大底图像传感器。这将是一项非常重要的改进,因为传统手机的图像传感器通常只有1/1.5英寸到1/2...
手机互联 2023-06-13 10:58:42 -
索尼发布新机Xperia1V,搭载双层晶体管像素堆叠式CMOS影像传感器
5月24日消息,在“Sony Expo 2023”展前媒体发布会上,索尼(中国)有限公司总裁吉田武司提出了索尼在华发展的愿景:“激发灵感与热情,与追梦者共创感动。”他表示,“中国有很多对未来充满热情和憧憬的追梦者,他们虽来自不同年龄层,不同领域,但他们都拥有勇于创新,不断突破极限的可贵的精神,这同样是索尼创业以来,传承至今的精神...
业界动态 2023-05-24 18:49:55 -
自动写代码?GoogleColab叫板githubcopilot
【网易科技5月18日报道】近日,谷歌宣布了Google Colaboratory(Colab)将加入全新的AI编码功能。据了解,该功能由全新的「文生代码」模型Codey提供支持,支持20多种编码语言,包括Go、谷歌标准SQL、Java、Javascript、Python和Typescript等...
智能设备 2023-05-18 14:56:18