-
英伟达AI智能体接入GPT-4,完胜AutoGPT!自主写代码独霸我的世界,无需人类插手
新智元报道编辑:Aeneas 好困【新智元导读】给游戏行业来点GPT-4式震撼?这个叫Voyager的智能体不仅可以根据游戏的反馈自主训练,而且还能自行写代码推动游戏任务。继斯坦福的25人小镇后,AI智能体又出爆款新作了。最近,英伟达首席科学家Jim Fan等人把GPT-4整进了「我的世界」(Minecraft)——提出了一个全新的AI智能体Voyager。Voyager的厉害之处在于,它不仅性能完胜AutoGPT,而且还可以在游戏中进行全场景的终身学习!比起之前的SOTA,Voyager获得的物品多出了3.3倍,旅行距离变长了2...
智能设备 2023-05-27 16:03:18 -
这个比ChatGPT情商还高的AI,我可以和它聊三天三夜
狂拿考试高分让学生瑟瑟发抖,加入联网功能叫传统搜索战战兢兢,升级工作全家桶搞得打工人又悲又喜....
智能设备 2023-05-27 16:02:52 -
GPT-4玩《我的世界》15倍速攀科技,不看画面全靠代码操作
克雷西 发自 凹非寺量子位 | 公众号 QbitAI把GPT-4放进一个虚拟世界会怎么样?比如《我的世界》。英伟达开发最新方法Voyager,在游戏中点亮科技树的速度是此前方法的15.3倍,同时获得的独特物品是此前的3...
智能设备 2023-05-27 16:02:52 -
数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙都会坍缩
克雷西 发自 凹非寺量子位 | 公众号 QbitAI对于ChatGPT的工作原理,一个常见的解释是根据统计学规律预测下一个词。但最近一位叫Jacob Bayless的工程师用数学方法得出惊人结论:若是如此,所需的信息量足以让整个宇宙都坍塌成黑洞。这一数据量是50000^8000,根据贝肯斯坦上限(Bekenstein bound)原理,如果把这些信息分配到空间当中,所需要的信息密度已经远超宇宙能承受的最大值。而这仅仅是把数据存储起来的消耗,更不必说还要进行运算了。而ChatGPT与单纯统计预测的区别,可以做这样的类比:如果天文学家通过历史观测记录推算出月食的周期,这可以算是统计学。但当他们总结出牛顿万有引力定律的时候,就已经超越了统计学。什么是“随机鹦鹉”一个流传很广的说法,所谓大语言模型实际上相当于一个“随机鹦鹉”——与我们观察其输出时的情况相反,语言模型只是将其在庞大的训练数据中观察到的语素胡乱拼接在一起,根据概率生成文本,但不清楚文字背后的任何含义,就像一个随机的鹦鹉。出自论文On The Dangers of Stochastic Parrots: Can Language Models Be Too Big这对过去的语言模型,或许确实成立。比如曾经流行的n-gram算法。比如当我们在搜索引擎中进行搜索时,出现的联想词就能用此方法实现。具体来说,下面的三行文本中,第一行纯粹是随机生成,第二行考虑了单词在英语中整体的出现概率,第三行则考虑了单词在前一个词后面出现的概率。n = 0: RECEIVE FALL SURPRISED FRIDAY INGREDIENT…n = 1: REPRESENTING AND SPEEDILY IS AN GOOD…n = 2: THE CHARACTER OF THIS POINT IS THEREFORE…不难看出,随着n值的升高,文本越来越接近人类语言。而n-gram模型根本不需要掌握其中的语义或理解其中的抽象概念,就能生成像模像样的句子。据此有人猜想,GPT-4会不会也只是一种高级的n-gram呢?Bayless提出,GPT必须学会抽象才能有如今的效果,至少GPT-4肯定如此。GPT-4不只是“随机鹦鹉”要证明这一点,可以先看下棋机器人的例子。如果有一种下棋机器人,存储了巨量棋谱数据,对于每个棋局都能推荐下一步。那它就能通过“背谱法”模仿其他任何棋手或程序的下法比如Stockfish是最先进的国际象棋程序,如果仅通过对战而不看源码,是无法确定Stockfish是否在背谱。但实际上,包含所有情形和步骤的棋谱数据量可能超过2^154。而Stockfish的程序只占用了不到50MB的空间,根本不可能存下需要的所有棋谱。所以Stockfish肯定是通过更高级的方法来实现下棋的。人类语言的复杂度远超过棋类游戏,因此GPT的数据量更是同理。仅在是上一代的GPT-3的token字典中就有超过5万token。如果对每个词都逐一建立统计信息,n-gram模型中n值将高达8000。届时,需要存储的情景数量将达到50000^8000。正如文章开头所提到,这简直是天文数字,足以让整个宇宙坍缩。因此,GPT是“随机鹦鹉”的猜测在理论上得到了一定程度的批驳。“随机鹦鹉”达不到的高度仅在理论上进行说明是不充分的,因此研究人员还进行了两个实验,意图证明大模型在学习过程中已经抽象出了算法。第一个实验关于一道经典的农夫过河问题。一个农夫有一条船,和狼、羊、菜,农夫要把这3样东西运到河到另一边,农夫每次最多只能通过这个船运一样东西,要防止狼吃羊、羊吃白菜(即不能在没有农夫在的情况下同时在同一岸边),该怎么过?研究人员将这个问题中的农夫、船、河分别替换成地球人、虫洞和银河系。狼、羊和菜则分别换成火星人、金星人和月球人。替换的目的是因为互联网上不太可能出现类似语料,可以判断大语言模型是不是真的掌握了通用方法。如果GPT不是“随机鹦鹉”,那么它至少不会犯下只有“随机鹦鹉”才会犯的错误。GPT-4针对替换后的问题给出了正确的回答,GPT-3.5则没有。但它们并没有犯研究人员预想的“鹦鹉”错误——即在回答中出现狼、船、河等已被替换掉的词语。回答中使用的句子,也无法在互联网中被检索到。这些现象都证明了现在的大语言模型的生成方式已经超越了“概率预测”。第二个实验则是数字排序。如果让GPT学习数字排序,它们究竟是只会记住给出过的数字顺序,还是真的研究出排序算法呢?其实只要从GPT的输出当中就可以看出来了。假如从1-100中随机选择10个数字,并将其顺序打乱,将一共有这么多种情形:如果再考虑数字的重复出现,又或者数字的数量发生变化,根本不可能存储如此之多的情形。因此,只要GPT能够针对未知的排序问题给出正确的回答,便可以说明它们是真的研究出了排序算法。研究人员训练了一款特斯拉前AI总监Andrej Kaparthy发明的语言模型nanoGPT,专门让它做数字排序。结果显示,随着训练步数的增加,模型给出的数字顺序越来越完美。虽然在训练步数达到16万左右时突然出现了大量错误,但也很快得到了纠正。这说明这款模型并不是仅仅根据学习的素材对未知的数字进行排序,而是已经掌握了背后的方法。这个测试只是在一台笔记本电脑、算力非常有限的GPU上进行的。更不必说GPT-4了。参考链接:https://jbconsulting...
智能设备 2023-05-27 16:02:19 -
阿里达摩院:GPT-4替代年薪60万数据分析师只要几千块,论文已发
梦晨 发自 凹非寺量子位 | 公众号 QbitAIGPT-4替代初级数据分析师的成本只有0.71%,换成高级数据分析师则是0...
智能设备 2023-05-27 16:02:14 -
已在40多个国家和地区上线,OpenAI在更多市场推出官方版ChatGPT
IT之家 5 月 26 日消息,OpenAI 宣布已经在 40 多个国家和地区,推出了适用于 iPhone 和 iPad 的官方 ChatGPT 应用程序。官方版 ChatGPT 于上周率先在美国市场推出,OpenAI 承诺未来几周内会继续扩展到更多国家和地区...
智能设备 2023-05-26 11:18:38 -
阿里巴巴:网传裁员为谣言,今年预估新招15000人
5月25日消息,阿里巴巴集团官微宣布,2023年六大业务集团总计需新招15000人,其中校招超过3000人。阿里巴巴官微表示,“近日,关于淘宝天猫、阿里云、菜鸟、本地生活各个业务裁员谣言传得很厉害,但谣言就是谣言...
互联网 2023-05-25 20:51:49 -
网易2023Q1财报:营收250亿元,AI助力数字内容生产提效90%
5月25日,网易发布2023年第一季度财报。财报显示,网易一季度业绩保持稳健增长,净收入250亿元,非公认会计准则下归属于公司股东的净利润76亿元,超出市场预期。本季度,网易继续投入AI大模型等自研关键技术,Q1研发投入37亿元,研发投入占比营收达15%。同时,网易利用AI等自研技术,已实现数字内容生产关键环节提效90%,并通过AI工具及内容共创的新模式,全面激发年轻群体创意能力,形成精品内容创作生态,驱动业务可持续发展。一季度,网易专注精品打造与创新,游戏及相关增值服务净收入201亿元,同环比实现双增长。网易云音乐持续健康发展,通过不断创新商业合作模式,包括与中国移动视频彩铃达成合作、升级杜比全景声专区体验、覆盖更多IoT终端等,实现Q1净收入20亿元,毛利率大幅提升至22.4%,去年同期为12...
互联网 2023-05-25 16:41:09 -
微软发布Win1122621.1778更新KB5026446,支持蓝牙低功耗音频
IT之家 5 月 25 日消息,微软今天为 Win11 用户推送了 KB5026446 (操作系统内部版本 22621.1778) 非安全预览更新,也就是“Moment 3”更新,并且还向 DEV 渠道推送了 Build 23466 版本更新,我们现在先来看一下 22621...
智能设备 2023-05-25 11:03:26 -
研究揭示ChatGPT美国用户人群画像:年轻、富裕、受过良好教育
5月25日消息,美国皮尤研究中心(Pew Research Center)最近开展的一项调查发现,58%的美国成年人熟悉ChatGPT,那些年轻富裕、受过良好教育的美国人更了解ChatGPT。调查显示,拥有研究生学位的高收入人士更熟悉ChatGPT...
业界动态 2023-05-25 08:08:16 -
同程旅行一季度营收25.9亿元,同比增50.5%
5月24日,同程旅行发布2023年第一季度业绩报告。报告显示,2023年第一季度,同程旅行实现营收25.9亿元,同比增长50...
互联网 2023-05-24 17:26:34 -
ChatGPT重塑Windows!操作系统全面接入,Bing也能用插件了
金磊 丰色 西风 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,微软彻底重新定义了PC交互。因为这一次,它把Bing和ChatGPT插件的能力,注入到了整个Windows系统!这就是在刚刚结束的Build 2023中,微软重磅推出的Windows Copilot。有了它,想让自己的PC变得更适合工作,就只需要一个简单的动作——问:如何调整我的系统,(以便更好地)来完成工作?然后Windows Copilot“啪的一下”就会给你2个建议:开启Focus Sessions功能(Windows11利于专注工作的新功能)。把系统变成深色模式。此时,若是你觉得建议有用,只需点击一下“yes”,一键就可以让系统变成你想要的样子。把桌面上的PDF“喂”给Windows Copilot,总结文档内容,也就是点下鼠标的事情了。不仅如此,Windows Copilot还可以跟你电脑里所有的App来一个联动。例如问它:什么音乐比较适合工作的时候听?它会立即在Spotify中给你推荐几个音乐播放列表,而我们所要做的,依旧是一个点击的动作而已。并且在各种插件的加持之下,像做logo这样的工作,就变成傻瓜式的“问”、“点击”、“拖拽”。微软在现场也直接道出了此举背后的目的:Make every user a power user.让每个用户都是高级用户。而且对于开发者来说,或许Windows Copilot的玩法会变得更有意思。因为它允许Bing或ChatGPT插件对它进行扩展。如此一番“大秀”之下,引得网友直呼“AI将无处不在”:不过Windows Copilot,也仅仅是微软Build 2023中“上新”的一隅。Bing,引入到ChatGPT了从现在起,不止是Bing里有GPT-4,ChatGPT里也有Bing了。这个模式叫做“使用必应进行搜索(Browsing with Bing)”,和不久前刚刚上线的插件功能在一个列表中。这个功能已经对plus用户开启,免费版的很快也将上线。勾选上该模式之后,你就可以进行一些基于必应的实时查询了。比如问ChatGPT:本周的Build大会,关于...
智能设备 2023-05-24 10:50:10