-
超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品
白交 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。没关系,有人会出手!那个抢跑GPT-4看图能力几个月的迷你GPT-4升级啦——MiniGPT-v2。△(左边为GPT-4V生成,右边为MiniGPT-v2生成)而且只是一句简单指令:[grounding] describe this image in detail就实现的结果。不仅如此,还轻松处理各类视觉任务。圈出一个物体,提示词前面加个 [identify] 可让模型直接识别出来物体的名字。当然也可以什么都不加,直接问~MiniGPT-v2由来自MiniGPT-4的原班人马(KAUST沙特阿卜杜拉国王科技大学)以及Meta的五位研究员共同开发。上次MiniGPT-4刚出来就引发巨大关注,一时间服务器被挤爆,如今GItHub项目已超22000+星。此番升级,已经有网友开始用上了~多视觉任务的通用界面大模型作为各文本应用的通用界面,大家已经司空见惯了。受此灵感,研究团队想要建立一个可用于多种视觉任务的统一界面,比如图像描述、视觉问题解答等。「如何在单一模型的条件下,使用简单多模态指令来高效完成各类任务?」成为团队需要解决的难题。简单来说,MiniGPT-v2由三个部分组成:视觉主干、线性层和大型语言模型。该模型以ViT视觉主干为基础,所有训练阶段都保持不变。从ViT中归纳出四个相邻的视觉输出标记,并通过线性层将它们投影到 LLaMA-2语言模型空间中。团队建议在训练模型为不同任务使用独特的标识符,这样一来大模型就能轻松分辨出每个任务指令,还能提高每个任务的学习效率。训练主要分为三个阶段:预训练——多任务训练——多模式指令调整。最终,MiniGPT-v2 在许多视觉问题解答和视觉接地基准测试中,成绩都优于其他视觉语言通用模型。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。感兴趣的朋友,可戳下方Demo链接体验:https://minigpt-v2.github...
智能设备 2023-10-19 09:56:05 -
虚幻5引擎《吸血鬼:避世血族2》截图画面惊艳
之前我们报道过《吸血鬼:避世血族2》更换了开发商,开发引擎也从虚幻4引擎变成了虚幻5引擎。这将为新作带来技术和视觉上的重大升级...
游戏资讯 2023-10-19 09:24:09 -
华为突然发力,手机销量大洗牌,最大的黑马果然是它!
对于不少用户来说,选择手机的一大原因就是手机品牌,具有影响力的的手机品牌,散发着不可抗拒的选购冲动,这也是为什么有“所谓的”粉丝。“花粉”,“果粉”,应该是代表性最强的手机粉丝群体,毕竟作为手机界的“大哥大”,所展现的实力堪称淋漓尽致,毕竟每款新机发布,老用户回头率确实高。如今,华为突然的到来,猛然一发力,手机销量排行榜迎来了一场大洗牌,其中影响最大的无非是苹果,要知道当年华为手机市场份额大大降低的场景,苹果也是赚得盆满钵满。出来“混”终究是要还的,苹果销量大跌,华为重拾销量,最大的黑马莫过于它,华为Mate60系列。在华为开启新款手机销售,手机市场份额开始逐步上升,相反,苹果手机实际销售额远没有达到预期效果,两种反差形成鲜明的对比。据相关机构消息得知,华为在9月份销量陡增,从W37到W40同比增速达到了91%、46%、83%、95%,市场份额从原先的10%,一跃至19.4%,稳居市场份额榜首。在W40,华为手机销量单周已经突破110...
手机互联 2023-10-19 08:50:06 -
《使命召唤20》测试版听取玩家意见:削弱了新能力
《使命召唤》作为老牌多人游戏系列,在运营的过程中需要不断的进行内容更新,不仅仅是为了添加新内容新玩法,而且需要时常针对环境做出合适的平衡补丁来维护游戏的公平性。在测试开启后,系列粉丝们就开始涌入《现代战争3》测试版,并向开发商Sledgehammer Games提供有关如何改进游戏的反馈...
游戏资讯 2023-10-19 03:34:09 -
LOL-S13:Crownie逆羽输出爆炸斩获五杀,BDS2-0淘汰DFM
北京时间10月11日,英雄联盟S13全球总决赛入围赛第四日,第二场比赛DFM对阵BDS。最终BDS2比0击败DFM,BDS晋级入围赛下一轮,而DFM则是告别了S13全球总决赛...
游戏资讯 2023-10-19 03:10:00 -
新老PS53D模型对比:身体变小但性能依然强大
索尼于此前正式公开了新款PS5,相较于原版PS5,新款的性能并没有改变,不过体积有所变小。Reddit用户NatureCertain发布了新老版本PS5的3D模型对比,该模型是使用PS官方提供的数据进行的建模...
游戏资讯 2023-10-19 03:04:57 -
《吸血鬼幸存者》Steam好评数破20w:制作组感谢玩家
Rougelike射击游戏《吸血鬼幸存者》于2022年10月21日首次登陆Steam,该作即将迎来一周年纪念。近日制作组特别发布一条推文,庆祝游戏好评数突破20万条,并感谢玩家的支持。根据Steam显示,目前该作在全球范围共有21万条评价,好评达到20.7万,好评率高达98%,处于“好评如潮”。目前该作在Steam平台还享受30%OFF折扣优惠,感兴趣的玩家不妨下载体验。 ...
游戏资讯 2023-10-19 02:49:14 -
《暗黑破坏神4》第二赛季玩法预告对抗吸血鬼大军
今日(10月17日)《暗黑破坏神4》官方公布了第二赛季“血之赛季”玩法预告,一起来看看视频吧!第二赛季将于北京时间10月18日凌晨1点上线,赛季内容围绕吸血鬼展开,包含新剧情、新能力、新装备、新事件和新Boss等,此外还有大量玩法改进。全新预告:在黑暗领主的命令之下,一支转化成贪婪吸血鬼的全新大军,正虎视眈眈地盯着圣休亚瑞...
游戏资讯 2023-10-19 02:33:34 -
梦幻西游175级龙宫10月大改伤害测试潜龙在渊加强连续点杀能力
近日,《梦幻西游》电脑版在测试区上线了关于2023年10月门派大改的相关内容,而龙宫这一门派,则是主要针对“海中蛟虬”和“沧海潜龙”两个流派进行调整,虽说猪队长早在上个月的预测时候就断定龙宫会修改,但万万没想到居然到了这种程度。下面,就带大家看看,这次龙宫的改动,到底意味着什么?一、2023年10月测试服龙宫调整内容本次测试服对于龙宫的门派调整看似较少,但实际上传达了一个新的观念...
游戏资讯 2023-10-19 02:30:29 -
魔兽世界:黑翼之巢竞争最大的极品,多彩符文双剑一个CD能拿齐?
盘点六十年代黑翼之巢抢破头的十大极品,竞争压力之大必须金币撑爆兜兜才行,速看!一:奈萨里奥之泪对于黑翼之巢的奈泪来说,核心竞争力就是洞穿版本的保值水准了,毕竟就算是TBC初期他依旧能傲视群雄风采依旧。真真是无数法系DPS抢破头的存在,竞争压力之大让每一位想要拿到的玩家都紧握拳头,生怕今日份金币带的还不够多,就问问在座的各位大佬怀旧服您是顶着多少压力下花了多少金币入坑的呢?二:纯源质指环黄字认证的大钻戒对于治疗玩家是有着致命的吸引力的,智耐精三花齐聚搭配高额的53点治疗效果,必须是阶段性无敌戒指,各系治疗必须要的准牌面装备,更有甚者直接口吐豪言壮志铁定要给自家女神安排上一枚,也是直接燃爆了它的热度,真真是钻石恒久远,一颗永流传啊!三:多彩符文剑多彩与符文剑这对老搭档的话必然是密不可分的存在,所以贴心细节的喵叔果断给他们安排到一起上,毕竟无论狂暴战还是说剑贼大佬,都是拿了多彩想符文,抬走符文盼多彩,如此之下竞争之大可想而知...
游戏资讯 2023-10-19 02:24:48 -
iPhone15价格及参数曝光,可能是近几年升级最大的苹果手机
距离 iPhone 15 系列发布越来越近了,目前参数方面的爆料已经非常丰富,而现在价格方面也终于有了消息。据 Wedbush 知名分析师丹·艾夫斯在一份报告中表示,今年发布的 iPhone 15 系列将比去年的 iPhone 14 系列更贵。艾夫斯对 iPhone 价格的预测准确率一直都挺高,例如去年他就准确预言了 iPhone 会在一些国家或地区抬高售价,当时给出的原因是美元汇率发生了变化。而这次预测 iPhone 15 系列涨价,给出的原因则是市场需求很大。艾夫斯认为,目前大约有 2.5 亿台 iPhone 已经使用了四年以上,这些用户可能会在今年更换新机。同时,他还预测了一波 iPhone 15 的出货量,预计今年能够出货 2...
手机互联 2023-06-13 10:58:35 -
阿里云AI新产品“通义听悟”宣布公测可体验大模型摘要能力
【网易科技6月1日报道】阿里云宣布通义大模型进展,聚焦音视频内容的AI新品“通义听悟”正式上线。记者获悉,通义听悟接入了通义千问大模型的理解与摘要能力,可成为用户工作学习中的得力AI助手,帮助随时随地高效完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等...
智能设备 2023-06-01 11:32:44