首页 > 资讯列表 > 科技资讯 >> 智能设备

比人类玩得好 谷歌人工智能已拿“小霸王”练脑

智能设备 2015-12-08 21:51:30 转载来源: 网络整理/侵权必删

冒着暴露年龄的风险我也要说,我知道这东西对你意义非凡:红白机电视游戏是一代人的回忆,也许是不甘心让它们就此永远沉寂,研究人工智能(AI)的专家们找到了机会让它们焕发第二春――拿给AI玩。Google在英国剑桥有个附属机构DeepMind,他们给AI玩雅达利公司(Atari,美国最大的电视游戏机公司)的游戏,想让它们在玩游戏的过程中学会如何与真实世界互动

冒着暴露年龄的风险我也要说,我知道这东西对你意义非凡:

红白机电视游戏是一代人的回忆,也许是不甘心让它们就此永远沉寂,研究人工智能(AI)的专家们找到了机会让它们焕发第二春――拿给AI玩。

Google在英国剑桥有个附属机构DeepMind,他们给AI玩雅达利公司(Atari,美国最大的电视游戏机公司)的游戏,想让它们在玩游戏的过程中学会如何与真实世界互动。这些AI软件非常喜欢电视游戏,而且不断练习会比人类玩的还好。

▲现在,AI也在玩小蜜蜂、打砖块和弹珠台

游戏世界与真实世界似乎风马牛不相及,但实际上,学习的过程和解决问题的逻辑都是一样的:

观察→状态判断→行动→反馈→观察……

让AI玩游戏的,除了Google还有一家名为Osaro的公司。Osaro公司开发的AI基于神经网络(neural networks)和增强学习(reinforcement learning)设计。AI的神经网络类似于人类大脑的神经网络,理论上讲,如果给AI提供了足够多的照片,它就能通过这些已知信息辨识出某一张照片中的所有东西。这种情况应用在游戏中,能让AI搞清楚目前的游戏是什么状态。除此之外,Osaro公司特别研发的循环神经网络(recurrent neural networks)可以让AI拥有类似于人类的短期记忆:将短暂的过去与现在进行比较,能够更好地判断出环境状态的变化和未来发展趋势。

观察结束后,增强学习用于调整行动:如果行动结果是正向的,下次就还会这样做,反之则摒弃这种做法。游戏世界很单纯,分数奖励就像刺激人类大脑的多巴胺。如果一项行动能让分数增加,AI下次就会更倾向于这样做或者选择类似的做法。

将这种学习方法应用到现实场景,才是Google和Osaro的最终目的:例如如果机器人成功把杯子放到指定位置就能得到奖励,把杯子打碎了就会受到惩罚。如此一来,它就会懂得人类想要的是什么结果,而不再是机械地执行命令。

其实AI就像小孩子,不断在游戏中试错,最终就会找到所有通关技巧。虽然现实世界的复杂程度是游戏所无法比拟的,但让AI玩游戏更像“授之以渔”――学会“如何学习”比“学到了什么”更加重要。

现在回想起来,当年那个单纯幼稚的你,是不是也曾在玩游戏时悟出什么朦胧的道理?

微信搜索“站长搜索”关注抢6s大礼!下载站长搜索客户端(戳这里)也可参与评论抽楼层大奖!

标签: 人类 得好 谷歌 人工智能 小霸王 练脑


声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持