首页 > 资讯列表 > 科技资讯 >> 业界动态

很多语音识别公司在AI领域掉进了陷阱 搜狗CEO王小川

业界动态 2016-07-16 23:30:08 转载来源: 网络整理/侵权必删

站长搜索讯(郑可君) 7月16日,奇点•极客公园创新者峰会在上海科技馆召开。搜狗CEO王小川在现场演示了人工智能的语音识别技术

搜狗CEO王小川:很多语音识别公司在AI领域掉进了陷阱

站长搜索讯(郑可君) 7月16日,奇点•极客公园创新者峰会在上海科技馆召开。搜狗CEO王小川在现场演示了人工智能的语音识别技术。

王小川一边发表演讲,一边在现场的大屏幕用文字显示出演讲内容。从现场可以看到,语音识别呈现出的效果非常惊艳,识别程度很高。

搜狗CEO王小川:很多语音识别公司在AI领域掉进了陷阱

很多人过多高估了人工智能的未来,所以王小川谈一谈反思。人类掌握的人工智能技术其实目前还是很浅。比如在语音识别方面,机器在全球范围内还是很难把两个不同的声音源分别开。此外,很多领先的技术公司带着技术去找市场,花了很多力气去组建销售团队,但在这个时候会忘了技术的源头。

在人工智能领域,很多语音识别、图像处理公司掉进了陷阱,比如技术靠谱,但是没有市场,当有了市场的时候,却把技术丢掉了。

“技术”和“幸福”的关系是,要做有“幸福感”的技术。我们不能在技术里无限想象光环,而是要把技术变成产品,变成一个成功市场的应用。搜索本身是人工智能,而且是有幸福感的人工智能,把每个人变得更强大。

王小川认为,搜索本身就是AI。今天的搜索是让机器去理解人,变成一个句子。对于搜索公司而言,人工智能技术的引入不是颠覆新的市场,而是原有用户需求的渐进式的改进。

搜索公司本身在做人工智能,Siri或者其他的人工智能的交互是未来的梦想,这样的梦想属于更多的搜索公司。

王小川表示,目前搜狗一天有1.4亿的语音识别量,准确度超过97%,有7%的用户会使用语音识别。

目前搜狗语音的技术已经不仅仅能够识别语音,更重要的是可以通过完全不依靠双手进行文字的修改。

在现场,王小川邀请一位观众上台,演示如何完全不依靠双手来发送一段语音。

搜狗CEO王小川:很多语音识别公司在AI领域掉进了陷阱

以下是王小川演讲实录:

大家好,我本人是人工智能的鼓吹族,在大家谈互联网的时候,我们就开始谈产品。大家谈产品的时候,我们就开始谈技术。大家开始谈技术的时候,我们已经开始谈人工智能。今天大家都在谈人工智能,我要谈一些什么东西呢?

感谢李志飞,其实他的演讲我非常的喜欢,我很紧张他把我想讲的东西都已经讲完了,很多理解是一样的。李志飞说在今天没有给大家带来一个演示,搜狗带来了,请看大屏幕。我们意料到今天网络可能有故障,所以我们把服务器搬到了现场。人工智能的时候我会谈一些反思,因为今天大家过多的高估了人工智能的未来,今年上半年我是鼓吹AlphaGo这样一场跨世纪的比赛,4:1的比分,之后就像一场启蒙运动,所有的公司,所有的投资,把眼光都看向了人工智能。在全球范围内的投资,异常活跃,中国也一样。今天我更多想谈到我们小心什么地方是陷井,什么是真的人工智能的未来。那么,就在前一个月,我去谷歌(微博)跟AlphaGo的工程师做了深度的沟通,有件事情我得告诉大家。AlphaGo并没有停止研发,还在进一步往前进步。但是我跟他们聊的时候,会谈到到今天为止跟李世石下棋的第四局,机器还是赢不了,我是非常惊讶的,已经过了三个月时间。所以我跟他们说有什么样的算法可以改进,去赢得第四局的比赛。谷歌的工程师跟我苦笑,你讲的方法我们都试过了。

传统做人工智能的专家就在预言深度学习有它本身的缺点,稳定性不够。即便是99%的正确性,也可能会带来不确定。比如说在无人驾驶,1%的不确定性就可能带来汽车的失速,而且还不知道怎么修改。所以我们今天会知道,深度学习我们认为他能做很多事情,但是到现在人类的技术掌握还是够浅的。

我也谈到在语音识别这样一个话题,今天语音识别已经到了比较高的准确度,接近使用,但是还是有很多限制。比如说我们需要安静的环境,当有噪音的时候,如果同时有两个人在说话,机器就搞不定了。我们也办法去除噪音,比如说汽车里面我们会有事先录制汽车引擎的声音,把没有见过的环境变成机器能够见过的环境就能够做识别,但是我跟工程师聊,如果有两个人说话怎么办呢?总有一个人的声音是听不见的。我们的解决方案就是麦克风矩阵,有一种麦克风的时候定向做识别,声音的音原给分离开。人是靠两只耳朵定声音吗?如果两个人在同一个方向说法会怎么样?人是能识别的。机器就做不到了。所以我在这张图里面给大家演示,我问了搞神经科学的人,他们认为人跟机器有本质的区别,如果人的位置不一样就能够分离开。如果两个人位置一样,一个人声音大,一个人声音小也能够分开,如果两个人声音一样大,一个是男生,一个是女生也能够分开,如果都是男生,一个人说中文,一个人说英文也能分开。只要找到一线机器找到不同的特征就能够动态的去分离。但是对不起今天在全球范围内,我们号称在语音识别有各种各样的突破,还是解决不了这样的问题。

所以我们知道,今天的计算机离人还有巨大的距离。除了技术本身的瓶颈以外,我们在创业当中有很多领先的技术公司还会面临什么样的瓶颈?很危险,一种可能性就是有技术,带着这种技术去找市场。比如说我们做了人脸识别,去找市场的方向,但是很有可能在过程当中没有找到,我们公司就死掉了。也有一种可能性是在找市场的过程当中,我们花了很多力气组建我们的消销售团队,尝试跟各个领域结合。但是,这个时候忘了技术的源头,因为技术是在不断迭代更新的。我们不能跟高效、前沿的技术保持同步,可能偶尔找到了一点市场,但是我们的技术已经变落后了。今天在中国的人工智能领域里面,做语音识别,图象处理的公司,有好一些已经掉到陷井里面去了。创业道路里面我跟投资人也在江不容易,即便不那么靠谱,即便靠谱可能也没有市场,即便有了市场可能我的技术已经丢掉了。有些情况,当我们有根的时候,要努力的发芽,树干,等它开花结果,中间的困难是非常多的。还有很多的困难,如果我们有了这样一些果实,我们有了市场的时候,或者我们认为就市场的时候,把根基丢了。人工智能跟高效,学术界的联动是非常多的。国内需要的做法不是从国外学成之后做技术,也做研发的进展,找市场,要不断的跟技术的前沿保持同步。比如说李志飞一定会有他的工程师团队读论文,甚至在这里面写自己的论文,把这个前沿跟上。人工智能创业不像我们以前互联网创业有一个模式就够了。而是不断的要把技术积攒起来。

那么,在这里面也提到一个命题的作文,我们怎么讨论技术跟幸福之间的关系。我做了一张简图。左边是我们提的一些技术,包括语音识别,人脸识别,人机交互,服务机器人等等。大家觉得这个词跟幸福有关系吗?在座大多数的人本身不是搞技术的,因为大家敬仰技术,崇拜技术,所以我们会过度在技术里面,自己想象出无限的光环。其实跟幸福没关系,是因为我们的不理解,恐惧和向往带来的一种误解。右边这些听起来就比较酷了,自动驾驶,能听懂我说话,诊断疾病,一键送咖啡,听着怎么样,是不是有一些幸福感?左下这个词大家看到了,活族皮卡丘,这几天有一个非常火的虚拟现实游戏。不是像左边一样讲虚拟现实,而是讲他们给我们带来了,一个活生生的卡通形象放到我们的面前,这是我们看到的幸福。对比左右两个图,无论是创业者,还是媒体人,还是一个投资人,我们应该看到当我们的技术能够让我们有幸福的时候,它就有可能从一个技术变成一个产品,变成市场成功的应用。给大家看一个蛮幸福的科幻。

科幻之前给大家讲讲我们对于搜狗技术和幸福之间的联系的理解。有朋友跟我谈搜索的时候,说王小川你今天挺高调,不停的谈人工智能,你们要转型做人工智能了吗?我是不是,搜索本身就是一种人工智能,而且是有幸福感的人工智能,因为他能够让每个人变得更加的强大。有时候我跟一个90后走在一块,他很厉害,无所畏惧,因为他知道拥有了搜索之后,能够解决所有的问题。上面一搜索就有答案,今天的年轻人利用技术,利用搜索,变得更加的强大,拥有了更加的幸福感。

再多补一句,为什么搜索就是一种AI呢?先看一个简图,我们知道这个关键词是我们最好的输入模式吗?今天大家已经很习惯了。我回顾在1999年到2000年,搜索刚刚出现的时候,我观察过。那个时候大家更愿意敲一个整句,大家发现机器不能识别,所以大家被训练使用了关键词。这个就像计算机使用鼠标一样,大家都很习惯。今天我们发现乔布斯告诉我们,更好的方式是用手指直接在屏幕上戳。所以,关键词的输入相对于人自己语言的输入就是像鼠标和手指自然的表达一样。需要继续提升的,因此,搜索引擎往下的进展方向,就是把一个关键词让人去想,变成人去表达一个完整的句子,机器找出中间的含义。同样,十条链接也不是我们最想用的方式,而是应该通过用户的问句直接给出答案,或者给你你的命令,机器做执行。因此从今天搜索,当我们往下的进化,对搜索引擎公司是一个渐进的过程,就像谷歌,它已经从一个移动互联网公司变成人工智能的公司。

为什么没有做到这个东西呢?听着很好听,是因为今天全人类的技术能做到让机器理解人,能变成一个句子,能够给出一个答案还是蛮有距离的。只是我们在这条道路往前去走。所以对搜索公司而言,人工智能技术的引入不是颠覆了一个新的市场,而是在原有用户的需求里面一个渐进性的改进,对谷歌一样,对我们一样,包括对百度也是这样的逻辑。所以我们提到搜索公司本身就在做人工智能,如果大家看搜狗不够过瘾,可以看谷歌,他已经代表了人工智能在今天应用的最高峰。我个人的判断,这样的未来更多是属于搜索公司的。

给大家看一个我刚才提到的美妙的动画。

这个片子大家都看过,代表了未来在我心中人工智能的方向,搜索公司未来走的方向也是向这里发展的。谈到语音输入,今天成为一个被大家吐槽特别严重的领域。也是我们发展的一个重要的环节,所以,今天大家知道讯飞,其实不知道搜索是中文语音识别用户量最大的应用,我们今天有1.4亿次的语音识别的使用量,搜狐输入法用户有7%使用语音识别,我们会不断的迭代我们的数据,使这个做得更好。但是做语音识别是不够的,我们还会做什么呢?给大家看一段视频来展示,我们怎么能够把97%继续提升。从技术来讲,人也就到这个度,怎么做,给大家放一段视频。

李志飞刚才是调试失败了。我想今天给大家再试一下,我们可以请现场找一位用户上台,现场使用这样一个产品,难点是这次的产品是要连到服务器,不是在本地能解决的。

标签: 很多 语音 识别 公司 AI 领域 进了 陷阱 搜狗


声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持