-
中国工程院院士张平:要构建“许可Web3.0”,发展中国自主元宇宙
5月30日消息,近日在2023年中关村论坛平行论坛“互联网3.0:未来互联网产业发展”上,中国工程院院士、北京邮电大学教授张平提出构建“许可Web3...
业界动态 2023-05-30 11:32:54 -
数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙都会坍缩
克雷西 发自 凹非寺量子位 | 公众号 QbitAI对于ChatGPT的工作原理,一个常见的解释是根据统计学规律预测下一个词。但最近一位叫Jacob Bayless的工程师用数学方法得出惊人结论:若是如此,所需的信息量足以让整个宇宙都坍塌成黑洞。这一数据量是50000^8000,根据贝肯斯坦上限(Bekenstein bound)原理,如果把这些信息分配到空间当中,所需要的信息密度已经远超宇宙能承受的最大值。而这仅仅是把数据存储起来的消耗,更不必说还要进行运算了。而ChatGPT与单纯统计预测的区别,可以做这样的类比:如果天文学家通过历史观测记录推算出月食的周期,这可以算是统计学。但当他们总结出牛顿万有引力定律的时候,就已经超越了统计学。什么是“随机鹦鹉”一个流传很广的说法,所谓大语言模型实际上相当于一个“随机鹦鹉”——与我们观察其输出时的情况相反,语言模型只是将其在庞大的训练数据中观察到的语素胡乱拼接在一起,根据概率生成文本,但不清楚文字背后的任何含义,就像一个随机的鹦鹉。出自论文On The Dangers of Stochastic Parrots: Can Language Models Be Too Big这对过去的语言模型,或许确实成立。比如曾经流行的n-gram算法。比如当我们在搜索引擎中进行搜索时,出现的联想词就能用此方法实现。具体来说,下面的三行文本中,第一行纯粹是随机生成,第二行考虑了单词在英语中整体的出现概率,第三行则考虑了单词在前一个词后面出现的概率。n = 0: RECEIVE FALL SURPRISED FRIDAY INGREDIENT…n = 1: REPRESENTING AND SPEEDILY IS AN GOOD…n = 2: THE CHARACTER OF THIS POINT IS THEREFORE…不难看出,随着n值的升高,文本越来越接近人类语言。而n-gram模型根本不需要掌握其中的语义或理解其中的抽象概念,就能生成像模像样的句子。据此有人猜想,GPT-4会不会也只是一种高级的n-gram呢?Bayless提出,GPT必须学会抽象才能有如今的效果,至少GPT-4肯定如此。GPT-4不只是“随机鹦鹉”要证明这一点,可以先看下棋机器人的例子。如果有一种下棋机器人,存储了巨量棋谱数据,对于每个棋局都能推荐下一步。那它就能通过“背谱法”模仿其他任何棋手或程序的下法比如Stockfish是最先进的国际象棋程序,如果仅通过对战而不看源码,是无法确定Stockfish是否在背谱。但实际上,包含所有情形和步骤的棋谱数据量可能超过2^154。而Stockfish的程序只占用了不到50MB的空间,根本不可能存下需要的所有棋谱。所以Stockfish肯定是通过更高级的方法来实现下棋的。人类语言的复杂度远超过棋类游戏,因此GPT的数据量更是同理。仅在是上一代的GPT-3的token字典中就有超过5万token。如果对每个词都逐一建立统计信息,n-gram模型中n值将高达8000。届时,需要存储的情景数量将达到50000^8000。正如文章开头所提到,这简直是天文数字,足以让整个宇宙坍缩。因此,GPT是“随机鹦鹉”的猜测在理论上得到了一定程度的批驳。“随机鹦鹉”达不到的高度仅在理论上进行说明是不充分的,因此研究人员还进行了两个实验,意图证明大模型在学习过程中已经抽象出了算法。第一个实验关于一道经典的农夫过河问题。一个农夫有一条船,和狼、羊、菜,农夫要把这3样东西运到河到另一边,农夫每次最多只能通过这个船运一样东西,要防止狼吃羊、羊吃白菜(即不能在没有农夫在的情况下同时在同一岸边),该怎么过?研究人员将这个问题中的农夫、船、河分别替换成地球人、虫洞和银河系。狼、羊和菜则分别换成火星人、金星人和月球人。替换的目的是因为互联网上不太可能出现类似语料,可以判断大语言模型是不是真的掌握了通用方法。如果GPT不是“随机鹦鹉”,那么它至少不会犯下只有“随机鹦鹉”才会犯的错误。GPT-4针对替换后的问题给出了正确的回答,GPT-3.5则没有。但它们并没有犯研究人员预想的“鹦鹉”错误——即在回答中出现狼、船、河等已被替换掉的词语。回答中使用的句子,也无法在互联网中被检索到。这些现象都证明了现在的大语言模型的生成方式已经超越了“概率预测”。第二个实验则是数字排序。如果让GPT学习数字排序,它们究竟是只会记住给出过的数字顺序,还是真的研究出排序算法呢?其实只要从GPT的输出当中就可以看出来了。假如从1-100中随机选择10个数字,并将其顺序打乱,将一共有这么多种情形:如果再考虑数字的重复出现,又或者数字的数量发生变化,根本不可能存储如此之多的情形。因此,只要GPT能够针对未知的排序问题给出正确的回答,便可以说明它们是真的研究出了排序算法。研究人员训练了一款特斯拉前AI总监Andrej Kaparthy发明的语言模型nanoGPT,专门让它做数字排序。结果显示,随着训练步数的增加,模型给出的数字顺序越来越完美。虽然在训练步数达到16万左右时突然出现了大量错误,但也很快得到了纠正。这说明这款模型并不是仅仅根据学习的素材对未知的数字进行排序,而是已经掌握了背后的方法。这个测试只是在一台笔记本电脑、算力非常有限的GPU上进行的。更不必说GPT-4了。参考链接:https://jbconsulting...
智能设备 2023-05-27 16:02:19 -
长城举报比亚迪的常压油箱,到底有没有问题?
【网易科技5月27日报道】最近车圈很不太平,比亚迪和长城汽车的事件连冲两次热搜。双方各自发布声明,使得业内和网友间激起千层浪...
智能设备 2023-05-27 11:58:35 -
为什么苹果始终不做无边框全面屏或曲面屏手机,是技术问题吗?
为什么苹果始终不做无边框全面屏,是技术问题吗?作为全球知名的科技巨头,苹果公司一直保持着其独特的产品设计风格。然而,在过去的几年中,与其他手机品牌相比,苹果始终没有推出无边框全面屏和曲面屏手机,这引发了许多用户的疑问...
手机互联 2023-05-25 08:22:45 -
索尼:持续加大在中国的研发投入,中短期聚焦娱乐(元宇宙)领域
5月24日消息,在Sony Expo 2023展前媒体发布会上,索尼(中国)有限公司副总裁,索尼中国研究院院长竹中干雄表示:“索尼中国研究院的使命是通过开展对前端技术的探索和应用, 为索尼业务和中国的社会发展做出贡献。我们于2005年在北京设立了第一个实验室,最近几年又设立了深圳和上海实验室,持续加大在中国的研发投入。”他提到,中国是一个高速发展和充满无限可能性的市场,并且人才济济,在中国做研发能够更贴近本土的实际需求、加快研发成果的概念验证,从而推动实际落地。“从中短期来看,我们会特别聚焦在中国的娱乐(元宇宙)领域,期待通过索尼的人工智能(AI)、通信、传感、机器人、3D内容制作等前端技术,结合索尼旗下影视、音乐、动画、游戏等丰富的娱乐内容,打造更'贴近人,感动人'的娱乐内容创作和欣赏解决方案。”本次Sony Expo 2023索尼中国研究院展台 ,设置“虚拟舞蹈实验室”体验区,参观者可以先进入绿幕拍摄区,拍下自己的真实三维形象,然后佩戴索尼的轻量级动作捕捉设备,跟着索尼大屏电视上的RAYNOS-chan卡通人物形象简单舞动,记录下自己的动作数据,经过索尼的系统生成加工后,最后就可以在索尼的空间现实显示屏上裸眼欣赏到自己的三维形象在3D空间中起舞。据悉,该项技术目前已经于索尼在华的首个黑彩晶虚拟制作影棚开始了概念验证实验,将有望帮助内容创作者甚至普通用户以更轻量级、更可及的方式创造虚拟3D内容,打破真实和虚拟的界限。“智能机械摄影室”体验区,参观者可以在一个由索尼虚拟制作技术打造出的《尼尔:机械纪元》游戏场景中近距离接触游戏主角尤尔哈B型二号(YoRHa No.2 Type B)。参观者可以选择心仪的游戏关卡背景,拍摄机器人可以自动追踪并记录下参观者与尤尔哈的影像并免费下载领取电子照片留念。拍摄机器人可智能化的完成追踪、对焦、构图、拍摄的功能,提供稳定的拍摄质量,极大节省人力。未来,索尼中国研究院还将进一步在该概念验证中加入可实时移动的中小屏背景,打造更加轻量级,小面积空间可实现的虚拟制作解决方案。“沉浸式触觉剧场”体验区,地板上搭载了索尼的触觉反馈技术,参观者可以与歌声同频共振,通过不同波形的震动效果感受演唱会中的高潮起伏,实现360音频,视频,触感多维一体的沉浸式娱乐体验。目前,触觉反馈技术已经应用于索尼的PlayStation 5游戏机的DualSense手柄、索尼Xperia智能手机的部分型号中,索尼中国研究院对该技术的应用开发则主要面向行业应用层面,尤其是在大型娱乐、体验型设施的应用,提供大型空间的沉浸式娱乐解决方案,现在已与国内部分合作伙伴在合作洽谈中。索尼中国研究院还将于Sony Expo 2023现场举办两场合作伙伴技术论坛,竹中干雄表示:“索尼的企业宗旨是‘用创意和科技的力量感动世界’,多元化的业务是我们独特的优势,而技术研发创新是根本的基石。立足长远,索尼中国研究院关注的领域将更为广泛,如可持续发展等,我们会进一步开放对外交流,强化中国本土的产学研合作,以期更加融入和贡献于中国的产业升级和社会发展。” ...
业界动态 2023-05-24 20:17:54 -
iOS16.5又闯祸了,多款iPhone续航出现问题
上周苹果正式推送了iOS 16.5,主要是修补了39个漏洞外加带来语音录屏、骄傲壁纸等一些小变化。但是经过几天的iPhone用户体验却发现这个版本还带来了一些小问题,比如:多款iPhone的续航出现缩水现象。其实这是升级到iOS 16...
手机互联 2023-05-24 01:27:02 -
不理解!苹果信号问题影响“正常使用”,为何用户依然默默忍受?
明明苹果信号影响使用,为什么大家都愿意忍受?最近看了iPhone14,于是想买苹果手机替换现在用的安卓,但了解了身边用苹果的朋友还有网络测评,发现苹果对于手机的基础功能信号做得不是很好,而且实际体验了朋友的苹果发现这个信号体验真的非常捉急,可是苹果销量反而这么好,所以非常想知道为什么大家能忍受这种手机基本的功能都有缺陷的情况?用忍受这个词我觉得明显是不妥当的,苹果的确在一些极端场景下相对信号弱很多!(例如穿越在大山中的高铁上、在山里、地铁、地下车库、电梯等场景)但是我们又有多少人会特别高频出现在这样的场景下呢?一个很扎心的事实,虽然手机核心功能是打电话、社交沟通!但是智能手机以来,其实很多人的社交需求很低,智能手机更多是陪伴是娱乐价值!也没有那么多紧急的事情,到信号好的地方处理才来得及!有时候要打电话、要上网、要聊微信,基本上在正常的办公场所、家里时间更多一点,即使是路上绝大部分都是信号比较好的地方!苹果手机的型号即使再坏,说句不好听的话,对于日常的使用影响并不大!除非一些特殊场景下需要处理紧急事情,发现网络信号差,那可能会特别着急!但是如果遇见,很多人也会快速给对方说我这里信号不好,我回到办公室或者到信号好的地方再给你打过来,再给你回消息等行为!并不是没有解决方案的!但是相比信号弱一点,国产手机有些手机信号非常好,是一个卖点!但是手机的广告也挺多,相比较界面简单,没有烦人的广告信息和广告机对比,你会选择哪个!相比较有些极端场景下信号弱和忍受广告,你会选择哪个?相比信号弱一点,国产手机可能在拍照拍摄视频方面参差不齐,但是在拍摄视频方面,很多测评达人一直建议都是买iPhone手机,在如今拍照和拍视频这么高频的场景下。你会优先级于信号强弱还是拍摄视频和照片更好一点的手机呢?越是社交关系弱了,有时候反而越是在乎社交关系!你用苹果,她用苹果、我用啥,用其他的手机会格格不入...
手机互联 2023-05-23 08:00:42 -
【独家】百度副总裁马杰离职,元宇宙业务“希壤”陷入边缘化危机
界面新闻记者 | 崔鹏据界面新闻了解,百度副总裁、百度“希壤”业务负责人马杰已经于近期离职,希壤团队虽并未解散,但前途目前并不明朗,部分人员已经转岗或离职。内部相关人士对界面新闻表示,元宇宙业务短期内难以看到好的商业模式,盈利能力较差,以及百度转向AIGC相关业务、不愿意向元宇宙业务投入更多资源,是希壤被边缘化的主要原因。截至发稿,百度对此消息未有回应。百度副总裁马杰百度希壤发布于2021年12月底,官方将其称为国内首个“国产元宇宙”产品,定位是跨越虚拟与现实、永久存续的多人互动空间。百度官方曾表示,2022年希壤落成超过120项元宇宙活动和空间,覆盖文旅、艺术、汽车和消费等超过20个领域。过去一年,希壤在提升元宇宙产品的研发效率和降低系统运营成本方面投入了比较多精力。今年1月初,百度刚发布希壤元宇宙底座MetaStack,将其称为全球首个独立元宇宙解决方案,能将原本需要6个月到一年的元宇宙开发周期缩短至40天。元宇宙是过去两年百度在各个场合曾重点提及的业务之一。2021年12月底,百度Create大会(AI开发者大会)就在百度搭建的元宇宙空间内举办,官方当时表态称,这是百度首次在国内以元宇宙形式举办科技大会。在那场大会上,百度在一座虚拟的Creator City(创造者之城)中公布了旗下人工智能和自动驾驶等核心业务的进展。随着百度进军元宇宙业务的声量越来越大,百度甚至在去年9月底召开过一场元宇宙歌会,并给它冠以“国内首档Web3.0沉浸式晚会”的名头,整合了希壤、数字人和数字藏品等web3...
智能设备 2023-05-19 11:51:47 -
抢占元宇宙先机,塑造实体产业发展!青岛打造国内领先、国际先进的虚拟现实产业高地
风口财经首席记者 娄花元宇宙是数字经济创新发展的重要新型载体,作为新一轮互联网大变局的核心,元宇宙可能重塑产业生态,形成与现实世界相对应的虚拟世界,是未来社会变革的重要力量。在展会现场观众的火爆体验,也印证了产业的未来...
区块链 2023-05-19 07:42:12 -
Meta高管:元宇宙能给职业教育带来“变革”可与AI共存而非被取代
5月17日消息,Facebook母公司Meta的高管们认为,元宇宙可以与生成式人工智能共存,并将给岗前培训和职业教育带来“变革”,而且Meta“可以两者兼顾”。Meta正在将元宇宙技术作为一种帮助培训员工的工具,以此来重振公众对元宇宙的兴趣...
业界动态 2023-05-17 08:09:29 -
部分网友反馈苹果中国官网首页出现崩溃问题
鞭牛士 5月15日消息,今日,有不少网友反馈,苹果中国官网首页出现崩溃问题,现在正在逐渐恢复,提示在执行此命令时出现错误。 除了首页外,苹果Apple Store在线商店首页访问正常,用户依然可以正常购买 iPhone 14 系列、Mac、iPad 等产品...
手机互联 2023-05-15 11:45:46 -
维基百科:ChatGPTorNot?这是一个问题
维基百科胜在知识结构清晰,ChatGPT 长于具体问题,双方未必不可调和。作者 | Moonshot编辑| 靖宇22年前,2001年初,维基百科 Wikipedia 横空出世,在其后的互联网时代,成为人们获取知识的重要平台。但在刚开始,人们对维基「人人可编辑」的组织形式产生过质疑。甚至有电视主持人讽刺其为「wikiality」,即如果在维基百科上编造条目,只要有足够多的人同意,它就会成为现实。后来,随着《自然》(Nature)杂志的调查研究,发现维基百科准确度接近大英百科全书,Google 开始把维基百科放到搜索结果的首项,维基社区和内容贡献者也持续壮大,维基百科用了很多年时间终于取得了公众的信任。诞生之初遭到质疑,越来越多人参与去完善,而后平反收到大众认可,继而成为日常的工具,这一过程,仅诞生半年的 ChatGPT 正在经历,不仅于此,它还成为了维基百科的挑战者。不久前,维基媒体基金会召开2023-2024年度计划的电话会议,会议中提及了35次 AI,讨论的主题也是围绕 ChatGPT 带来的挑战。但维基百科所担心的挑战,并不是被 ChatGPT 取代。而是更深刻地考验:未来的维基百科,会由 ChatGPT 来撰写吗?01维基百科的内容哪里来的?要想知道 ChatGPT 能否撰写维基百科,得先知道维基百科目前内容来源于哪里。维基百科主要是由来自互联网上的志愿者共同合作编写而成,任何使用网络进入维基百科的用户都可以编写和修改里面的文章。它是互联网上一个极大的自由内容、公开编辑、多语言的网络百科全书协作计划。截至2021年初,所有语种的维基百科条目数量达5500万条,如何确保内容上的准确,全靠维基社群志愿者们的筛查。在 ChatGPT 出现前,维基百科已经长期在用 AI 去减少一些人力成本。应用最多的就是把现有条目直接机器翻译,再由人工编辑校对。2016年时,资深科学家 Aaron Halfaker 开发了一套开源机器学习算法,可以自动识别维基百科里那些恶意破坏条目和编辑假消息的行为;2020年,MIT 的研究人员也为维基百科推出过基于 AI 的修改功能,可以精确定位维基百科句子中的特定信息,并自动替换为类似于人类编辑的语言。Wikipedia 关于 ChatGPT 的页面|Wikipedia以及如维基社群所述,人工智能非常擅长总结把一篇很长的技术类条目,总结成儿童都能理解的版本,让 AI 去生成儿童版的维基百科效果很好。翻译、检查、概括简化已有内容,维基百科一直以来对 AI 的应用仅限于此,直到大型语言模型 ChatGPT 的出现。目前仍以文字方式交互为主的 ChatGPT,除了回答用户直接的提问以外,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等等。ChatGPT 可以写出相似真人的文章,并在许多知识领域给出详细和清晰的回答。哪怕 ChatGPT 生成内容的事实准确度还需要人工去二次查阅,但这时维基百科面临的问题已经很明显了:志愿者能否用 ChatGPT 来撰写维基百科条目?02能不能和想不想纽约市维基媒体分会的老维基人 Richard Knipel 就用 ChatGPT 在维基百科上起草了一个名为「艺术作品标题」的新条目,Knipel 表示,ChatGPT 给出的版本一般但语法正确,定义了艺术作品标题的概念,给出了从古至今的例子。他在草稿基础上只做了轻微修改。但另一位编辑在条目上标注,将会进行大量修改并完善。如今,我们再点进这一条目,会发现它增加了大量内容和理论索引,还梳理出了目录,给出了图片案例。像 Knipel 这样的维基人认为,ChatGPT 可以作为生成维基百科条目草稿、骨架的工具,在此基础上,人工再验证内容,编辑和充实条目。但另一派维基人则认为,在维基百科条目的创作里 ChatGPT 应该完全被禁用。一位维基百科编辑就表示「我们应该强烈呼吁不使用 AI 工具来生成条目草稿,即使这些条目随后会被人工审阅。ChatGPT 太擅长引入那些看起来很有道理的谎言。」ChatGPT 起草,人工简单编辑的版本|Wikipedia人工大量干预后产生的版本|Wikipedia但另一派也反驳这种说法,就像 Knipel 认为,修改并丰富不完善的信息,这就是维基百科在实践中一直运作的方式。ChatGPT 将继续存在并飞速发展,利用它同时强调人工干预的必要性怎么就不行呢?把 ChatGPT 上来就视作洪水猛兽实在有些偏颇。但在想不想之前,我们先看看能不能。ChatGPT 还够不够格直接编写维基百科呢?3月30日时,维基百科创始人 Jimmy Wales 在接受 Evening Standard 采访时讨论了这个议题。Wales 认为,让 ChatGPT 能独立写一个完整的维基条目,目前还有一段距离,但距离多远就难说了。「业内把这种情况称为 hallucinating(幻觉)——我称之为编瞎话。」(One of the issues with the existing ChatGPT is what they call in the field 『hallucinating』—I call it lying.)「ChatGPT 有一种凭空捏造的倾向,这对维基百科来说真的不太行。」Wales 在采访里说道。实践中也是如此,你在维基百科上搜一个词,维基百科可能会反馈「该条目不存在」,但你问 ChatGPT,它可能会给你生成一段没由头的假消息。ChatGPT 会「说瞎话」,这种事已经不新鲜了。但 ChatGPT 诞生仅半年,它的自我迭代能力已经令人咋舌,让 ChatGPT「句句吐真言」,似乎只是时间问题,那维基百科现在担忧的是什么呢?03人力有限,算力「无限」维基百科团队并没有那么担心内容到底来源于人类还是 AI,它担心的是内容质量是否过关。在维基媒体基金会在电话会议总结报告里,「挑战」被放到了开篇,其中最大比重的部分,也是维基百科团队最大的担忧在于:维基百科涌入大量 AI 生成的内容,把真正高质量的、正确的信息给淹没了。「Wiki 项目有大量高质量的、可靠的,结构化的、分类好的内容。这就是我们带给世界的价值。最让我害怕的不是人们使用 GPT 之类的大语言模型来获取知识,而是需要巡查的 AI 生成的内容会爆炸式增长。」对高质量内容来说,创作比消费的时间成本高很多,就像一篇较为完整的维基条目,需要许多人参与撰写,花许多时间,走过很多流程后完成,对读者来说几分钟就阅读完了。像维基百科这种平台,为了保证内容质量,还需要专业人士核查一条条目中每个信息、数据、引用是否来源准确,筛查和编辑的成本同样很高。因此 AI 生成内容越多,人工核查的时间也更长。而且哪怕 ChatGPT 给出了正确的结论,但它并不会直接给出结论的论据来源何处,人工还需要再找到论据。到最后,修正可能比撰写耗时更长。Wikipedia 的条目下会有很多延展阅读链接|Wikipedia目前维基百科志愿者们已经发现了许多 ChatGPT 自动生成内容上的问题。比如 ChatGPT 很容易太笼统地概括定义,导致表意不明。还有 ChatGPT 遣词造句过于肯定,不够匹配维基百科想呈现的客观中性的文字风格。最重要的是信源难以查询,维基百科的可信度和扩展阅读性,很大程度上是基于条目底下丰富的信息参考来源,但 ChatGPT 不会主动提供参考,甚至会凭空捏造。担任了20年维基百科志愿编辑的 Andrew Lih 在用 ChatGPT 起草新条目时就发现,ChatGPT 概述定义做得很不错,但它所提供的消息来源于《福布斯》、《卫报》、《今日心理学》,但 Lih 仔细查阅后发现,这些信源文章并不存在,甚至 ChatGPT 给出的 URL 都是自动生成找不到页面的假链接。综上,维基百科团队直接表示,AI 生成内容的速度和效率,可能会超出项目的运行能力。除此之外,还有许多维基百科团队会担心的点,比如如今的维基百科贡献者里,使用英语的白人男性依旧是主体,维基内容已带有语言和内容偏见,ChatGPT 靠吸纳互联网信息为养料的 AI 机器,生成出的内容会进一步放大偏见。Wikipedia 联合创始人 Jimmy Wales 在接受 Standard 采访时谈及 AI 参与撰写维基的问题|Standard...
智能设备 2023-05-14 11:22:09