-
超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品
白交 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。没关系,有人会出手!那个抢跑GPT-4看图能力几个月的迷你GPT-4升级啦——MiniGPT-v2。△(左边为GPT-4V生成,右边为MiniGPT-v2生成)而且只是一句简单指令:[grounding] describe this image in detail就实现的结果。不仅如此,还轻松处理各类视觉任务。圈出一个物体,提示词前面加个 [identify] 可让模型直接识别出来物体的名字。当然也可以什么都不加,直接问~MiniGPT-v2由来自MiniGPT-4的原班人马(KAUST沙特阿卜杜拉国王科技大学)以及Meta的五位研究员共同开发。上次MiniGPT-4刚出来就引发巨大关注,一时间服务器被挤爆,如今GItHub项目已超22000+星。此番升级,已经有网友开始用上了~多视觉任务的通用界面大模型作为各文本应用的通用界面,大家已经司空见惯了。受此灵感,研究团队想要建立一个可用于多种视觉任务的统一界面,比如图像描述、视觉问题解答等。「如何在单一模型的条件下,使用简单多模态指令来高效完成各类任务?」成为团队需要解决的难题。简单来说,MiniGPT-v2由三个部分组成:视觉主干、线性层和大型语言模型。该模型以ViT视觉主干为基础,所有训练阶段都保持不变。从ViT中归纳出四个相邻的视觉输出标记,并通过线性层将它们投影到 LLaMA-2语言模型空间中。团队建议在训练模型为不同任务使用独特的标识符,这样一来大模型就能轻松分辨出每个任务指令,还能提高每个任务的学习效率。训练主要分为三个阶段:预训练——多任务训练——多模式指令调整。最终,MiniGPT-v2 在许多视觉问题解答和视觉接地基准测试中,成绩都优于其他视觉语言通用模型。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。感兴趣的朋友,可戳下方Demo链接体验:https://minigpt-v2.github...
智能设备 2023-10-19 09:56:05 -
Analogue3D任天堂N64平替主机原创设计性能加强
一直在致力于复刻平替经典游戏机的Analogue公司日前公布了最新项目,“Analogue 3D”的任天堂N64平替主机,官方表示新主机为弃原版元素的原创设计并性能加强,敬请期待。·据悉,“Analogue 3D”将带来完全弃原版元素的原创设计,采用FPGA设计,在原版解像度模式基础上追加4K级别,支持美、欧、日本所有地狱的100%兼容性,支持蓝牙以及2.4Ghz无线连接,并支持4个控制器使用,还采用公司独创Analogue OS操作系统等等特征。·“Analogue 3D”预定2024年发售,感兴趣的玩家可以关注下了。 ...
游戏资讯 2023-10-19 02:36:15 -
大模型无法替代码农!普林斯顿芝大惊人发现:GPT-4解决GitHub编程问题成功率为0
新智元报道编辑:编辑部【新智元导读】ChatGPT之类的AI编码工具来势汹汹,Stack Overflow又裁员了!不过,普林斯顿和芝大竟发现,面对真实世界GitHub问题,GPT-4的解决率竟是0%。Stack Overflow,已经被ChatGPT创飞了!因为码农大量涌向ChatGPT、Github Copilot,Stack Overflow今天不得已宣布裁员100多人,几乎占员工人数的1/3。所以,ChatGPT这类AI编码工具,真的要颠覆整个行业了?不过最近,普林斯顿和芝大的一项研究发现,LLM想要替代码农,其实没那么容易。论文地址:https://arxiv.org/abs/2310...
智能设备 2023-10-19 02:14:55 -
任天堂Switch模拟器YuzuEmulator登陆安卓平台
IT之家 5 月 31 日消息,近日 Yuzu 开发团队宣布,他们的任天堂 Switch 模拟器已经正式支持安卓平台。Yuzu 是目前 PC 上最受欢迎的 Switch 模拟器之一,能够让用户在更强大的硬件上玩自己喜爱的 Switch 游戏,现在其终于登陆了安卓平台...
智能设备 2023-05-31 10:53:51 -
苹果的最大竞争对手?外媒上手Quest3头盔:预计10月份发布
5月29日消息,最近,彭博科技的作者马克·古尔曼(Mark Gurman)试用了Meta即将推出的混合现实头戴式设备Quest3。他认为,Quest 3更轻薄,透传功能大幅提升,处理速度更快,可运行的内容也更多,在混合现实领域明显具有很大吸引力...
业界动态 2023-05-29 16:28:37 -
自动写代码?GoogleColab叫板githubcopilot
【网易科技5月18日报道】近日,谷歌宣布了Google Colaboratory(Colab)将加入全新的AI编码功能。据了解,该功能由全新的「文生代码」模型Codey提供支持,支持20多种编码语言,包括Go、谷歌标准SQL、Java、Javascript、Python和Typescript等...
智能设备 2023-05-18 14:56:18 -
微软Surface雷电4Thunderbolt扩展坞开售,国行2565元
IT之家4月12日消息,微软SurfaceThunderbolt4(雷电4)扩展坞现已在官网上架开售,国行售价2565元。据介绍,这款扩展坞是一款USB4/Thunderbolt4扩展坞,可提供超高速数据传输、连接重要的外围设备,并为其充电...
智能设备 2023-04-12 11:36:43 -
郭明錤:QuestPro累计出货30万台,苹果MR头显首发市场反馈存疑
(映维网Nweon2023年04月06日)尽管苹果有望在今年WWDC大会发布首款XR头显,但著名苹果消息人士郭明錤表示这家公司并不认为它在一开始就能够重现“iPhone时刻”,原因包括经济前景,为追求量产而在诸如重量等规格方面的妥协,生态应用准备,以及价格高昂等等。在一条最新的Twitter推文中,郭明錤再次谈到了苹果的XR头显发布会,并指出这次活动是苹果向投资者证明AR/VR有望成为下一个消费性电子明星产品的最后希望...
手机互联 2023-04-06 10:17:20 -
一位AI画家的成长历程丨TECHTUESDAY
都是AI文生图,为何差别这么大。文丨贺乾明编辑丨龚方毅在电脑上输入几个词,等着在屏幕上看到它们被转化成图片,比如山川湖海、鸟兽鱼虫、楼宇院落、人物肖像...
智能设备 2023-03-29 11:06:57 -
微软预告第二代SurfaceHub2S交互式远程工作白板
IT之家3月29日消息,微软今天预告了第二代SurfaceHub2S交互式远程工作白板,并表示将于今年晚些时候上市发售,将会搭载名为“TeamsRoomsonWindows”的全新Windows版本。微软官方并未公布第二代SurfaceHub2S的详细规格,但表示会提供和现有机型相同的50英寸和85英寸版本...
智能设备 2023-03-29 11:06:51 -
类魂游戏但是像素风《DuelCorp》开启Steam预约
类魂游戏《DuelCorp.》现已在Steam上开放了测试申请。游戏的画面风格是像素风,但融合了3D游戏的动作表现...
游戏资讯 2023-03-27 17:13:27 -
余承东:HUAWEI问界全系升级HarmonyOS3
3月23日消息,华为在2023春季旗舰新品发布会上,华为宣布HUAWEI问界M5和问界M5EV高阶智能驾驶版将于4月发布。发布会上,华为终端BGCEO余承东表示HUAWEI问界全系车型升级HarmonyOS3,让问界汽车常用常新...
业界动态 2023-03-24 11:06:47