-
这个比ChatGPT情商还高的AI,我可以和它聊三天三夜
狂拿考试高分让学生瑟瑟发抖,加入联网功能叫传统搜索战战兢兢,升级工作全家桶搞得打工人又悲又喜....
智能设备 2023-05-27 16:02:52 -
GPT-4玩《我的世界》15倍速攀科技,不看画面全靠代码操作
克雷西 发自 凹非寺量子位 | 公众号 QbitAI把GPT-4放进一个虚拟世界会怎么样?比如《我的世界》。英伟达开发最新方法Voyager,在游戏中点亮科技树的速度是此前方法的15.3倍,同时获得的独特物品是此前的3...
智能设备 2023-05-27 16:02:52 -
数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙都会坍缩
克雷西 发自 凹非寺量子位 | 公众号 QbitAI对于ChatGPT的工作原理,一个常见的解释是根据统计学规律预测下一个词。但最近一位叫Jacob Bayless的工程师用数学方法得出惊人结论:若是如此,所需的信息量足以让整个宇宙都坍塌成黑洞。这一数据量是50000^8000,根据贝肯斯坦上限(Bekenstein bound)原理,如果把这些信息分配到空间当中,所需要的信息密度已经远超宇宙能承受的最大值。而这仅仅是把数据存储起来的消耗,更不必说还要进行运算了。而ChatGPT与单纯统计预测的区别,可以做这样的类比:如果天文学家通过历史观测记录推算出月食的周期,这可以算是统计学。但当他们总结出牛顿万有引力定律的时候,就已经超越了统计学。什么是“随机鹦鹉”一个流传很广的说法,所谓大语言模型实际上相当于一个“随机鹦鹉”——与我们观察其输出时的情况相反,语言模型只是将其在庞大的训练数据中观察到的语素胡乱拼接在一起,根据概率生成文本,但不清楚文字背后的任何含义,就像一个随机的鹦鹉。出自论文On The Dangers of Stochastic Parrots: Can Language Models Be Too Big这对过去的语言模型,或许确实成立。比如曾经流行的n-gram算法。比如当我们在搜索引擎中进行搜索时,出现的联想词就能用此方法实现。具体来说,下面的三行文本中,第一行纯粹是随机生成,第二行考虑了单词在英语中整体的出现概率,第三行则考虑了单词在前一个词后面出现的概率。n = 0: RECEIVE FALL SURPRISED FRIDAY INGREDIENT…n = 1: REPRESENTING AND SPEEDILY IS AN GOOD…n = 2: THE CHARACTER OF THIS POINT IS THEREFORE…不难看出,随着n值的升高,文本越来越接近人类语言。而n-gram模型根本不需要掌握其中的语义或理解其中的抽象概念,就能生成像模像样的句子。据此有人猜想,GPT-4会不会也只是一种高级的n-gram呢?Bayless提出,GPT必须学会抽象才能有如今的效果,至少GPT-4肯定如此。GPT-4不只是“随机鹦鹉”要证明这一点,可以先看下棋机器人的例子。如果有一种下棋机器人,存储了巨量棋谱数据,对于每个棋局都能推荐下一步。那它就能通过“背谱法”模仿其他任何棋手或程序的下法比如Stockfish是最先进的国际象棋程序,如果仅通过对战而不看源码,是无法确定Stockfish是否在背谱。但实际上,包含所有情形和步骤的棋谱数据量可能超过2^154。而Stockfish的程序只占用了不到50MB的空间,根本不可能存下需要的所有棋谱。所以Stockfish肯定是通过更高级的方法来实现下棋的。人类语言的复杂度远超过棋类游戏,因此GPT的数据量更是同理。仅在是上一代的GPT-3的token字典中就有超过5万token。如果对每个词都逐一建立统计信息,n-gram模型中n值将高达8000。届时,需要存储的情景数量将达到50000^8000。正如文章开头所提到,这简直是天文数字,足以让整个宇宙坍缩。因此,GPT是“随机鹦鹉”的猜测在理论上得到了一定程度的批驳。“随机鹦鹉”达不到的高度仅在理论上进行说明是不充分的,因此研究人员还进行了两个实验,意图证明大模型在学习过程中已经抽象出了算法。第一个实验关于一道经典的农夫过河问题。一个农夫有一条船,和狼、羊、菜,农夫要把这3样东西运到河到另一边,农夫每次最多只能通过这个船运一样东西,要防止狼吃羊、羊吃白菜(即不能在没有农夫在的情况下同时在同一岸边),该怎么过?研究人员将这个问题中的农夫、船、河分别替换成地球人、虫洞和银河系。狼、羊和菜则分别换成火星人、金星人和月球人。替换的目的是因为互联网上不太可能出现类似语料,可以判断大语言模型是不是真的掌握了通用方法。如果GPT不是“随机鹦鹉”,那么它至少不会犯下只有“随机鹦鹉”才会犯的错误。GPT-4针对替换后的问题给出了正确的回答,GPT-3.5则没有。但它们并没有犯研究人员预想的“鹦鹉”错误——即在回答中出现狼、船、河等已被替换掉的词语。回答中使用的句子,也无法在互联网中被检索到。这些现象都证明了现在的大语言模型的生成方式已经超越了“概率预测”。第二个实验则是数字排序。如果让GPT学习数字排序,它们究竟是只会记住给出过的数字顺序,还是真的研究出排序算法呢?其实只要从GPT的输出当中就可以看出来了。假如从1-100中随机选择10个数字,并将其顺序打乱,将一共有这么多种情形:如果再考虑数字的重复出现,又或者数字的数量发生变化,根本不可能存储如此之多的情形。因此,只要GPT能够针对未知的排序问题给出正确的回答,便可以说明它们是真的研究出了排序算法。研究人员训练了一款特斯拉前AI总监Andrej Kaparthy发明的语言模型nanoGPT,专门让它做数字排序。结果显示,随着训练步数的增加,模型给出的数字顺序越来越完美。虽然在训练步数达到16万左右时突然出现了大量错误,但也很快得到了纠正。这说明这款模型并不是仅仅根据学习的素材对未知的数字进行排序,而是已经掌握了背后的方法。这个测试只是在一台笔记本电脑、算力非常有限的GPU上进行的。更不必说GPT-4了。参考链接:https://jbconsulting...
智能设备 2023-05-27 16:02:19 -
阿里达摩院:GPT-4替代年薪60万数据分析师只要几千块,论文已发
梦晨 发自 凹非寺量子位 | 公众号 QbitAIGPT-4替代初级数据分析师的成本只有0.71%,换成高级数据分析师则是0...
智能设备 2023-05-27 16:02:14 -
开源三年260家企业加入openGaus社区即将迎来生态拐点
5月26日消息,openGauss Developer Day 2023(openGauss开发者大会2023)在北京举办。会上,openGauss社区理事会理事长江大勇透露,已有将近260家企业加入社区,近5000名开发者参与社区贡献,社区代码总行数已超过1500万行,即将迎来生态拐点。在openGauss开源三周年之际,社区高速发展,即将迎来生态拐点。openGauss社区理事会理事长江大勇表示,截止目前,已有将近260家企业加入社区,近5000名开发者参与社区贡献,社区代码总行数已超过1500万行。社区坚持技术创新,如期发布了7个社区版本,多家社区伙伴基于openGauss推出的数据库商业发行版,广泛应用于政府、金融、运营商、电力、制造、医疗等十大重点行业的核心场景,2023年openGauss在非云集中式场景的市场份额更是有望突破20%,跨越生态拐点。在今年3月上线的openGauss 5.0版本中,openGauss针对架构、内核进行了重大升级:在架构创新方面,openGauss坚持用户场景驱动,持续进行架构创新,围绕多模多态、智能运维等用户需求、痛点,推出了DataPod+DataKit组合,打造全新的数据底座。未来,openGauss希望通过内核和架构的双引擎驱动,实现数据库技术突破,为全球数据库发展贡献智慧。作为面向数据基础设施的开源数据库,openGauss北向支持数据库主流应用,南向支持多样性算力,南北向丰富的生态加速了openGauss落地千行百业,进入核心业务场景。开源3年以来,openGauss已上线7个社区版本,DBV伙伴基于社区发行版发布商业发行版,用户基于社区发行版深度定制的用户自用版,这些版本已覆盖数字基础设施丰富的场景,包括面向关系型的集中式、KV数据库,地理空间数据库,时序数据库等。为了更好地满足行业细分场景的需求,充分发挥openGauss数据库和鲲鹏硬件软硬协同的优势,openGauss社区将联合伙伴推出“全栈可信”、“全栈安全”、“开箱即用”、“极简运维”的数据库一体机解决方案。会上,还发布了基于首批基于openGauss发行版的数据库一体机产品,数据库一体机产品均采用了完全开放的架构设计,基于开放的鲲鹏服务器硬件和openGauss开源数据库,为客户提供开放、安全、自主创新、长期演进的企业级数据库解决方案新选择。为了提升openGauss社区专业服务能力,openGauss伙伴专业保障服务正式发布。(静静) ...
业界动态 2023-05-26 15:57:25 -
OpenAI捐款10万美元,推动治理人工智能、引导其健康发展
IT之家 5 月 26 日消息,根据路透社报道,OpenAI 将从现有基金中抽出 100 万美元,分别等额的 10 份,用于推动 ChatGPT 的民主进程,制定有效措施,管理人工智能,遏制偏见等其它负面因素,引导其健康发展。OpenAI 在今天的博文中表示,其中划分的 10 万美元(IT之家备注:当前约 70.8 万元人民币),将捐给那些提出相关框架的个人和组织,希望有治理人工智能的方案出炉,让其健康发展。OpenAI 的首席执行官 Sam Altman 告诉路透社:“人工智能系统应该造福全人类,并具有更大的包容性。我们正在启动这个资助计划,朝着这个方向迈出第一步”。OpenAI 表示 10 万美元的投入可能会迸发出治理人工智能的诸多看法,即便是这些建议没有任何“约束力”。 ...
智能设备 2023-05-26 11:18:41 -
已在40多个国家和地区上线,OpenAI在更多市场推出官方版ChatGPT
IT之家 5 月 26 日消息,OpenAI 宣布已经在 40 多个国家和地区,推出了适用于 iPhone 和 iPad 的官方 ChatGPT 应用程序。官方版 ChatGPT 于上周率先在美国市场推出,OpenAI 承诺未来几周内会继续扩展到更多国家和地区...
智能设备 2023-05-26 11:18:38 -
OpenAICEO威胁过度监管或退出欧洲欧议员称立法者不该被“勒索”
5月26日消息,几个月来,人工智能研究公司OpenAI首席执行官萨姆·奥特曼(Sam Altman)始终在呼呼世界各地的立法者起草管理这项技术的新规则。但在周三,他威胁称,如果欧盟“过度监管”,该公司可能会退出欧盟。在过去的一周里,奥特曼在欧洲各地奔波,分别与法国、西班牙、波兰、德国和英国的政界人士会面,讨论ChatGPT的进展以及人工智能的未来。在OpenAI向世界推出其人工智能驱动的聊天机器人ChatGPT六个多月后,围绕其潜力的担忧引发了兴奋和恐慌,并使其与监管机构不断发生冲突。奥特曼本周没有去过的一个地方是布鲁塞尔,在那里,欧盟监管机构正在制定期待已久的欧盟人工智能法案,这可能是全球首套管理人工智能的规则。两位知情人士称,奥特曼取消了原定对布鲁塞尔的访问。奥特曼周三在伦敦表示:“目前的欧盟人工智能法案草案存在过度监管,但我们听说它将被撤回。”然而,负责制定人工智能法案的欧盟议员对奥特曼的说法提出了异议。罗马尼亚欧洲议会议员德拉戈斯·图多拉切(Dragos Tudorache)表示:“我认为短期内不会出现任何修订。”他补充说:“尽管如此,我们还是很高兴邀请奥特曼先生到议会来,这样他就可以表达自己的担忧,并听取欧洲立法者对这些问题的想法。”欧盟负责内部市场的委员蒂埃里·布雷东(Thierry Breton)也批评了奥特曼的威胁,称规则草案不是用于谈判的。周四,奥特曼将与英国首相里希·苏纳克(Rishi Sunak)和法国总统伊曼纽尔·马克龙(Emmanuel Macron)等多国领导人举行会面,预计OpenAI将更详细地讨论如何监管人工智能。立法者不该被“勒索”荷兰欧洲议会议员金·范·斯巴伦塔克(Kim van Sparrentak,)也参与了欧盟人工智能法案草案的起草工作,她说自己和其他议员“不应该被美国公司勒索”。“如果OpenAI不能遵守基本的数据治理、透明度以及安全要求,那么他们的系统就不适合欧洲市场,”斯巴伦塔克表示。到2月份,ChatGPT创下了历史上所有消费者应用程序中用户增长最快的纪录。OpenAI首次与监管机构发生冲突是在3月份,当时意大利数据监管机构Garante在国内关闭了该应用,并指责OpenAI藐视欧洲隐私规则。在该公司为用户制定了新的隐私措施后,ChatGPT才得以重新上线。与此同时,欧盟立法者在人工智能法案中增加了新的提案,迫使任何使用ChatGPT等生成式人工智能工具的公司披露用于培训其系统的任何受版权保护材料。欧盟议员本月早些时候就该法案草案达成一致,欧盟所属成员国、欧盟委员会和欧洲议会将敲定该法案的最终细节。通过欧盟委员会,法国或波兰等个别成员国也可以在该法案可能在今年晚些时候获得通过之前寻求修改。全力以赴推进计划虽然这项立法已经酝酿了几年,但就在对这些提案进行关键投票的前几周,专门针对生成式人工智能工具的新条款才被起草出来。此前有报道称,有些立法者最初提议完全禁止使用受版权保护的材料来培训生成式人工智能模型,但这一提议最终被否决,转而支持更严格透明度的要求。图多拉切表示:“这些规则主要与透明度有关,这确保了人工智能和构建它的公司是值得信任的。我看不出有哪一家公司会回避透明度。”Pinsent Masons律师事务所的技术合伙人尼尔斯·劳尔(Nils Rauer)表示,奥特曼在立法者审议他们的提案时发表了上述言论,这“并不令人感到意外”。“OpenAI不太可能背弃欧洲,毕竟欧盟在经济上太重要了,”他说。“你不可能将拥有近5亿人口和15万亿欧元(约合16.51万亿美元)经济规模的单一市场分割出去。”奥特曼周四在德国慕尼黑表示,他已经与德国总理奥拉夫·朔尔茨(Olaf Scholz)会面。德国欧洲议会议员谢尔盖·拉戈丁斯基(Sergey Lagodinsky)也参与了这项立法,他说,虽然奥特曼可能正试图在各个国家之间推动他的议程,但布鲁塞尔监管这项技术的计划正在“如火如荼地推进”。“当然,可能会有一些修改,”他说。“但我觉得他们不会改变整体轨迹。”(小小) ...
智能设备 2023-05-26 11:18:32 -
OpenAICEO威胁过度监管或退出欧盟欧议员称立法者不该被“勒索”
5月26日消息,几个月来,人工智能研究公司OpenAI首席执行官萨姆·奥特曼(Sam Altman)始终在呼呼世界各地的立法者起草管理这项技术的新规则。但在周三,他威胁称,如果欧盟“过度监管”,该公司可能会退出欧盟。在过去的一周里,奥特曼在欧洲各地奔波,分别与法国、西班牙、波兰、德国和英国的政界人士会面,讨论ChatGPT的进展以及人工智能的未来。在OpenAI向世界推出其人工智能驱动的聊天机器人ChatGPT六个多月后,围绕其潜力的担忧引发了兴奋和恐慌,并使其与监管机构不断发生冲突。奥特曼本周没有去过的一个地方是布鲁塞尔,在那里,欧盟监管机构正在制定期待已久的欧盟人工智能法案,这可能是全球首套管理人工智能的规则。两位知情人士称,奥特曼取消了原定对布鲁塞尔的访问。奥特曼周三在伦敦表示:“目前的欧盟人工智能法案草案存在过度监管,但我们听说它将被撤回。”然而,负责制定人工智能法案的欧盟议员对奥特曼的说法提出了异议。罗马尼亚欧洲议会议员德拉戈斯·图多拉切(Dragos Tudorache)表示:“我认为短期内不会出现任何修订。”他补充说:“尽管如此,我们还是很高兴邀请奥特曼先生到议会来,这样他就可以表达自己的担忧,并听取欧洲立法者对这些问题的想法。”欧盟负责内部市场的委员蒂埃里·布雷东(Thierry Breton)也批评了奥特曼的威胁,称规则草案不是用于谈判的。周四,奥特曼将与英国首相里希·苏纳克(Rishi Sunak)和法国总统伊曼纽尔·马克龙(Emmanuel Macron)等多国领导人举行会面,预计OpenAI将更详细地讨论如何监管人工智能。立法者不该被“勒索”荷兰欧洲议会议员金·范·斯巴伦塔克(Kim van Sparrentak,)也参与了欧盟人工智能法案草案的起草工作,她说自己和其他议员“不应该被美国公司勒索”。“如果OpenAI不能遵守基本的数据治理、透明度以及安全要求,那么他们的系统就不适合欧洲市场,”斯巴伦塔克表示。到2月份,ChatGPT创下了历史上所有消费者应用程序中用户增长最快的纪录。OpenAI首次与监管机构发生冲突是在3月份,当时意大利数据监管机构Garante在国内关闭了该应用,并指责OpenAI藐视欧洲隐私规则。在该公司为用户制定了新的隐私措施后,ChatGPT才得以重新上线。与此同时,欧盟立法者在人工智能法案中增加了新的提案,迫使任何使用ChatGPT等生成式人工智能工具的公司披露用于培训其系统的任何受版权保护材料。欧盟议员本月早些时候就该法案草案达成一致,欧盟所属成员国、欧盟委员会和欧洲议会将敲定该法案的最终细节。通过欧盟委员会,法国或波兰等个别成员国也可以在该法案可能在今年晚些时候获得通过之前寻求修改。全力以赴推进计划虽然这项立法已经酝酿了几年,但就在对这些提案进行关键投票的前几周,专门针对生成式人工智能工具的新条款才被起草出来。此前有报道称,有些立法者最初提议完全禁止使用受版权保护的材料来培训生成式人工智能模型,但这一提议最终被否决,转而支持更严格透明度的要求。图多拉切表示:“这些规则主要与透明度有关,这确保了人工智能和构建它的公司是值得信任的。我看不出有哪一家公司会回避透明度。”Pinsent Masons律师事务所的技术合伙人尼尔斯·劳尔(Nils Rauer)表示,奥特曼在立法者审议他们的提案时发表了上述言论,这“并不令人感到意外”。“OpenAI不太可能背弃欧洲,毕竟欧盟在经济上太重要了,”他说。“你不可能将拥有近5亿人口和15万亿欧元(约合16.51万亿美元)经济规模的单一市场分割出去。”奥特曼周四在德国慕尼黑表示,他已经与德国总理奥拉夫·朔尔茨(Olaf Scholz)会面。德国欧洲议会议员谢尔盖·拉戈丁斯基(Sergey Lagodinsky)也参与了这项立法,他说,虽然奥特曼可能正试图在各个国家之间推动他的议程,但布鲁塞尔监管这项技术的计划正在“如火如荼地推进”。“当然,可能会有一些修改,”他说。“但我觉得他们不会改变整体轨迹。”(小小) ...
业界动态 2023-05-26 08:23:59 -
百度何俊杰:全线拥抱AI,百度移动生态要为十亿用户打造“PersonalAI”
5月25日消息,2023万象·百度移动生态大会上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰提出,要以AI原生思维重构百度移动生态,全面“刷新”百度搜索、百度APP、百度文库、百度电商等产品与服务的用户体验,推动人机交互、内容生产、营销与商业三重变革。他表示,之前文心一言、ChatGPT等大语言模型是在让AI变“大”,移动生态的这次重构,就是要致力于让AI变“小”,变得更具体,变得人人可用。百度集团副总裁、搜索平台负责人肖阳提出基于“语义检索技术+大语言模型”的双重能力,引领搜索代际变革体验。百度搜索基于大模型创新打造的极致满足、“AI伙伴”、“AI BOT”等功能目前也正在内测中。搜索体验变革主要体现在三方面。在用户需求满足上,百度基于大语言模型和AI技术积累,让更多、更复杂的问题在第一条搜索结果中得到全面满足;在用户表达上,“AI伙伴”可以实现智能对话、多轮交互,极大降低了用户的输入表达门槛和成本;在信息边界的突破上,AI BOT为创作者、商家、机构、品牌等领域的内容、服务提供者们制作虚拟的AI分身,助力生态伙伴提升创作和服务效率。在过去一年,百度APP月活已达到6.57亿。百度信息分发平台总经理李小婉表示,百度APP今年将推出智能首页模式“一人一世界”,用户可以根据自己心意和习惯选择默认首页、大图首页、视频首页、小说首页等,满足更多元的个性化需求。 同时,她还首次展示了内测产品NEW APP,用新概念、新功能,以及一人一模型的未来远景。 目前产品的核心使用场景是对话,提问、聊天、发送指令等,用户还可指定不同“人设”的私人助理,了解用户的喜好和需求,随时对话交流,还可以给予有效建议,处理大小事务。此外,百度输入法也创新打造了AI“高情商沟通助手”,根据不同社交场景给出高情商聊天建议,为用户带来更加智能、高效的社交体验。2022年万象大会上,百度推出“创作者AI助理团”,至今已有45万创作者使用,产出超700万篇内容,累计分发量超过200亿。而在今年万象大会上,百度移动生态事业群组内容生态平台副总经理宋健介绍了全新升级的百度内容生态AIGC创作工具,AI笔记、AI成片、AI作画、AI BOT等功能将面向创作者开启内测体验,更多AI写作、AI数字人功能也即将上线,为创作者提供一站式AI创作方案,推动生产方式根本性变革。截止目前,超过600万创作者在百度创作与分享,创作者多元收入规模同比增长397%,商单收入、电商收入、付费订单量等多元业务均呈现高速增长态势。对创作者,百家号升级为“百度AI创作经营平台”,帮助创作者在AI提效、内容分发、多元变现、影响力建设等多个维度实现跨越性的突破。同时,百度推出创作者成长扶持计划“AI共创计划”,计划扶持10万创作者收入超30亿。“未来,谁拥有最佳的跟客户沟通的方式,谁就会拥有这个客户”,何俊杰指出。营销行业是AIGC的“先行示范区”,有机构预测,2022年,大型组织的营销信息2%由AI生成,到2025年,这一数据将上升到30%。据悉,百度从2014年开始,就在尝试“AIGC文本创意”。到目前,单条创意耗时从30分钟降到4分钟,AI辅助创作的文本创意每天生产14亿条,近七成企业都用到这个功能,近三分之一的创意展现都有AIGC参与。对于商家,百度副总裁、百度电商总经理平晓黎表示同步推出智能电商新品牌“百度优选”,发布了包含AI导购助手、电商AI主播制作平台、商家经营能力模型、商家成长体系、智能经营平台等一系列创新技术和智能商家经营方案。为助力商家和合作伙伴成长,平晓黎还发布百度电商超级生态计划,将助力1000个千万GMV爆款商品,100个年销售额过亿的商家,以及15个GMV过亿的服务商合作伙伴,与百度电商共同实现更大的生意机会。(一橙) ...
业界动态 2023-05-25 13:06:05 -
研究揭示ChatGPT美国用户人群画像:年轻、富裕、受过良好教育
5月25日消息,美国皮尤研究中心(Pew Research Center)最近开展的一项调查发现,58%的美国成年人熟悉ChatGPT,那些年轻富裕、受过良好教育的美国人更了解ChatGPT。调查显示,拥有研究生学位的高收入人士更熟悉ChatGPT...
业界动态 2023-05-25 08:08:16 -
OpenAICEO:马斯克教会我投资科技领域但对移民火星不感兴趣
5月25日消息,当地时间周四,人工智能研究公司OpenAI联合创始人兼首席执行官萨姆·奥特曼(Sam Altman)在伦敦大学学院发表演讲,谈到了他与埃隆·马斯克(Elon Musk)的关系。奥特曼非常感激马斯克教会他如何投资科技领域,但他对移民火星不感兴趣...
业界动态 2023-05-25 07:47:58