这个【民科】眼里的AI机器人,才是最真实的!

发布日期:2019-07-11

摘要:科技大公司总是把AI机器人包装得很华丽,可真相是它们并没有穿衣服。

 

 

“民科”,我认为是指那些不以某事为职业或没有受过专门训练,却做某事的人。好巧不巧,在AI领域,我就是一个“民科”。

 

我们都有这种体会:在餐厅点菜,经常会在菜单上看到奇葩的菜名,却不知道是什么食材做的。通常餐厅越别致、越豪华,这种情况越多。为什么要这样?因为可以忽悠你买单呀。而父母给我们做菜的时候通常不会如此,不然我们问父母,今晚吃什么菜,他们说吃“吻别”。当看到菜端上来的时候,会不会有点错乱的感觉?

 

对厨师这个职业来说,烧菜的父母也是“民科”。

 

关注科技信息的朋友,一定对目前AI智能机器人的蓬勃发展而欣喜若狂,那些科技大佬、专家嘴里时不时冒出“神经网络”、“深度学习”、“训练”、“算法”等拟人的词语,让我们有种计算机已经可以和人一样思考问题的感觉,幻想着一款类似“her”电影里的机器人不久就会来到我们面前。

 

真是这样吗?

 

 

真相:想象很丰满,现实很骨感!

 

作为一个有AI方面的发明专利,又有自己的AI机器人,并对那些新名词不怎么感冒的“民科”,有必要剥去现在AI智能机器人华丽的外衣,帮你还原它们的本来面目,毕竟我也同样被迷惑过。

 

其实,AI机器人并不是新鲜事,我敢说在看这篇文章中99%的人出生前它就已经存在了。它最早是由美国麻省理工的约瑟夫于1966年开发,采用的技术是关键词匹配,而真正进入大众眼帘的可能是十年前的小黄鸡,这是个小的聊天小程序,你可以用它问这问那,感觉它什么都知道。它并不高大上,在很多人眼里,和贪吃蛇这样的小游戏并没有什么区别,虽然火了一阵,并没有引起什么大公司的关注。在安静了几年后,再次火起来是2014年的微软小冰,它一出现,就以一种高姿态进入了千家万户,之后各种AI机器人如雨后春笋般地冒出来,覆盖我们生活中的方方面面,它不仅仅只是为了聊天而存在,还有非常深层次的原因,这在我上一篇《你知道吗?一把能打开10000亿新兴市场的钥匙就攥着你手里!》着重强调过。

 

现状:99.9%号称智能的AI聊天机器人都是不智能的。

 

很多AI人工智能公司都宣称自己的机器人具有“完全自主知识产权的自然语言处理引擎和交互分析能力,功能强大,覆盖了NLP中的词法、句法、篇章、语义等各个方面,满足了企业与专业用户人机交互中核心的语义分析和理解的需求。”遗憾的是,99.9%都是不智能的。一些演示的视频看上去神乎奇迹,不过是照本宣科特意做出来的。

 

如何判断一个聊天机器人是不是真的智能呢?可以通过两个因素进行判断:

1)它能否自我学习,随着时间变得越来越聪明;

2)它能够基本听懂你说的所有话。

而目前世面上的所有的聊天机器人基本都不具备这方面。他们能回复,并不是听懂了,而是基于大数据,然后训练出来的结果,他们根本不理解你说的内容。

 

穿插一句:训练其实就是机器利用一定的统计方法对大数据进行处理,然后统计出某些规律,方便后面拿来使用的过程。例子可以看我《演讲——“数学之美”读后感》一文中,对“今日天气”百度搜索的大数据分析,就一目了然了。

 

为什么现在的聊天机器人不智能?

 

因为自然语言是进化史上最复杂的产物之一,要攻克让机器理解自然语言这个难关,难度非常大。网上炒得如火如荼的阿法狗,和优秀的聊天机器人相比,实现的难度好似制造扳手和精密仪器的区别。世界科技大公司对聊天机器人投入的时间、金钱、人力超过了AlphaGo千百倍都不止,现在AlphaGo在围棋上可以战胜世界上最强大的人类,可最强大的聊天机器人都无法超过一个三岁的小孩,甚至远远不如。让阿法狗获得巨大成功的大数据,为什么在聊天机器人这块却举步维艰呢?

 

人类语言往往是高度模糊的,有时候我们人类自己都搞不明白是什么意思。

比如:“这个店的东西不好买。”

你告诉我,这个店的东西值得买,还是不值得买?

 

 

和人能接受模糊的概念、不太正规的语法不同,聊天机器人采用的是编程语言(一种概念清晰、语法正确,不能有一丝模糊的机器语言),要让这两种语言相互识别,这如同要把水和油融合在一起。上世纪70年代前,人们采用语法规则来教机器人掌握语言,因为我们就是这样教下一代的,结果实现起来遇到了极大的阻碍。之后,人类开始利用大数据统计找规律,而不是利用语法、词义来理解句义的方法,来解决人机交互的难题。

 

目前采用的方法大致是:

煎——人工模板。就是类似填空题,机器内部先输入大量的填空题,然后用户的语言如果能整句匹配上去,就调用其中填空中的内容,再找到对应的内容去回复或者执行某动作(这需要人工来编写针对不同场景的模板,例如Siri、竹间的小影、微软的小娜、手机助理等。),类似表演中的对台词:你这么说,我那么答。

­——检索。第一代AI机器人的关键词法在这里大行其道。和人工模板类似,只不过更加简单,都不需要整句的匹配,只是选取当中的关键词。然后再从语料库(就是之前真人交互时的对话内容,这些公司花大力气收集起来的各种人类交互的语言)中,找出对应的回复出来。其中有可能找出百八十句,再采用一些方法(参数、权重什么的),找出最可能适合的回复。

——机器翻译。因为以前英文翻译成中文,或者中译英都有很多年的经验了,然后把这个经验拿过来用以解决机器人识别用户语言的过程。

——深度学习:就是利用了大数据统计的方法,把用户语言当成冷冰冰的数字来寻找规律,为了能实现回复的准确性,把过程设计得非常复杂,也是目前AI机器人努力的方向。微软小冰就实现了把一句话按字词拆分,然后逐个深度学习后先得出每个字词对应的内容,再根据语法再串成句子回复。类似把糖葫芦拆散,然后找到各自对应的羊肉,再把羊肉串起来的过程。

 

效果:很差!(下图采样于2018.7.18

 

为求达到最好的效果,目前AI机器人在实际运用时都会结合这4种方法。在特定领域,比如询问天气、查询车票、客服咨询这快,效果还是比较好的,因为目的明确,人类的表述基本是固定下来的,总共也就是百来句,可以用“煎”的方法来解决。现在很多公司对大量重复性的对话工作都用客服机器人来代替,对不上台词的就转入人工。

 

可这并不智能!像百度的小度机器人、小米的小爱机器人,当个玩具还行,真指望它们能正常交互?还是算了吧。

 

而能体现智能水平的聊天机器人,首推微软小冰,微软不缺技术、金钱、人力和时间,对大数据的处理和应用都是行业的领先水平。从14年到如今,整整4年过去了,可小冰的聊天水平呢?几乎没有提升,哪怕微软小冰的高管说他们采用了多少高深的技术,可展现出来的结果还是非常的差。记得在我直播演示比较的时候,小冰被我的聊天机器人吊打,在近十个内容中,小冰只有一个回答勉强能算对,其他都回答错误。目前聊天机器人的回复普遍具有:缺乏“一致性、逻辑性、记忆力”几大弊端,很多时候连回复的准确性都实现不了,这极大地制约了聊天机器人的发展。

 

还有一类聊天机器人是竹间智能科技的小影,号称要创造出比微软小冰更有情感的聊天机器人,他们采用了人工模板的方法来解决聊天机器人的问题。似乎把上面的几大弊端掩盖起来了,可因为语言表达是无穷的,造成人工模板的设计速度远远跟不上语言表达的内容。在我直播演示的时候,这类聊天机器人暴露出的问题也非常明显,这也是为什么微软小冰没有采用这种方法的原因。

 

结论:基于大数据的方法已走到末路,《数学之美》中的数学此时已经不美了!

 

看到这里,大家可能对目前聊天机器人有点小小的失望吧。难道聊天机器人就只能当一个无聊解闷的工具?成为各种APP的接入口只是美梦一场?绝对不是这样!敬请关注我下一篇《人工智能的未来,不在于……》。

 

我会把万亿市场的未来捧在手上让你看!