从siri谈人工智能技术的应用

                                                                                                          从Siri谈人工智能技术的应用

                                                                                                                        秦元培

摘要:随着苹果iphone5的发布,其中的Siri语音助理无疑成为了其中的一大亮点。作为人工智能技术的一种现实应用,Siri实现了人机对话、信息检索、语音识别等只有在科幻电影里才出现的场景。在满足了用户对于人工智能技术的好奇心之后,各大平台仿效Siri的应用陆续放出。国内的小I机器人更是被誉为“中文语音siri”。本文将以Siri为切入点,以聊天机器人为例,讲述人工智能技术在现实生活中的应用。

关键字:人工智能技术  聊天机器人  Alice机器人  中文分词

以苹果的iphone、谷歌的Andriod和微软的windows phone,为代表的移动手机平台正在逐步改变着我们的生活方式。很多时候,人们更喜欢打开手机使用各种各样的应用(Application)来满足我们不同的需求。不久以前,iphone5发布的时候,人们惊奇地发现,iphone5拥有一个神奇的应用Siri。通过Siri,人们可以实现在科幻电影里才能看到的场景,那就是我们的手机似乎可以像人一样思考,人们可以和手机聊天、让手机帮自己做事,似乎这一切都是那么的智能、神秘。其实,Siri的背后是一门古老而又现代的技术,那就是人工智能。

人工智能的研究是从 1956 年正式开始的, 这一年在达特茅斯大学召开的会议上正式使用了“人工智能”(Artificial IntelligenceAI)这个术语。人工智能也称机器智能,它是计算机科学、控制论、信息论、神经生理学、心理学、语言学等多 种学科互相渗透而发展起来的一门综合性学科。 从计算机应用系统的角度出发,人工智能是研究如何制造智能机器或智能系统,来模拟人类智能 活动的能力,以延伸人们智能的科学。如果仅从技术的角度来看,人工智能要解决的问题是如何使电脑表现智能化,使电脑能更灵活方效地为人类服务。只要电脑能够表现出与人类相似的智能行为,就算是达到了目的,而不在乎在这过程中电脑是依靠 某种算法还是真正理解了。人工智能就是计算机科学中涉及研究、设计和应用智能机器的—个分支,人工智能的目标就是研究怎样用电脑来模仿和执行人脑的某些智力功能,并开发相关的技术产品,建立有关的理论。 

人工智能技术的发展经历了漫长的过程。50年代以后,当“人工智能”的概念被第一次提出后,人工智能技术开始兴起,主要研究方向是机器定理证明等问题。在这个阶段,由于过分强调问题的解决方法,而忽略了知识的重要性,人工智能曾经一度被冷落。而60年代末到70年代初,专家系统的出现,让人工智能的研究进入新的高潮。到了80年代,随着第五代计算机的诞生,人工智能技术得到了很好的发展。在这一时期,世界上第一个聊天机器人“阿尔贝特”出现了。虽然聊天机器人并不完全等同于人工智能(其实Alice应该是问答系统中的一种),但是两者都在朝着同一个方向努力,那就是尽可能的让机器“像人一样思考”。早在1950年英国数学家艾伦·图灵在论文中提出,交谈能检验智能.如果一台计算机能像人一样对话,它就能像人一样思考.他由此获称“人工智能之父”.1995年11月23日,艾丽斯Alice诞生了。艾丽斯的名字是由英文“人工语言在线计算机实体”的头一个字母的缩写拼成。科学家华莱士将这个聊天程序安装到网络服务器,然后待在一边观察网民会对它说什么。随着华莱士对艾丽斯的升级与艾丽斯聊天经验的日渐丰富,艾丽斯越来越厉害,曾一度被认为是最聪明的聊天机器人。80年代末,神经网络技术的发展使得人工智能技术开始从单个智能主体研究转向基于网络环境下的分布式人工智能研究。不仅研究基于同一目标的分布式问题求解,而且研究多个智能主体的多目标问题求解,使人工智能更面向实用。目前,人工智能技术已经被广泛运用于模式识别、专家系统、智能搜索、定理证明、逻辑推理、博弈、信息感应与辨证处理等领域,这一崭新的技术可以说已经很常见了,但是为什么会因为Siri而备受关注呢?原因就在于Siri让我们离人工智能更近、更生活化,那么Siri究竟是不是人工智能技术呢?

Siri是一个语音助理,和Alice等聊天机器人类似,是一个可以实现和人交流程序。从技术角度来看,Alice采用一种叫做人工智能标记语言(AIML)的语言,来组织自己的语料数据。通过大量的预制模版,实现对用户问题的作答。但是,作为聊天机器人,在满足用户的好奇心时的同时,不得不面对人们的思考和质疑:难道机器人会思考?机器人有逻辑?事实上,即使最聪明的Alice,和大多数机器人一样,没有记忆,他只能对于用户此刻的问题作出回答,上下文之间并没有关联。但是大量的事实说明,凭借这样看似简单的伪智能,机器人完全可以和人顺利地完成交谈,而不被人发现自己是在和一个机器聊天。例如由英国科学家罗洛·卡潘特发明的“乔治”,据说它是世界上最聪明的“聊天机器人”,“乔治”不仅会说40种语言,并且能够同时和数百人一起进行聊天。“乔治”能够在聊天时开玩笑、回答问题、表露感情、和网民们进行关于爱情、生活和宇宙等各种话题的讨论。“乔治”说话那么逗趣、那么真实、以致于许多和它聊天的人都将它当成一个“真人”。据悉,到目前为止“乔治”已和全球大约200万人聊过天呢!假如你刚才还在对聊天机器人智能程度存在怀疑,那么现在,你是不是开始怀疑自己的判断了?那么从某种意义上来说,它展现出来的聪明与狡黠,会不会意味着——我们人类的思维和语言也许没有这么难模仿?会不会意味着——人类的语言习惯可以被总结复制,然后再将这个规律用在人类身上? 假如是这样,那么或许某一天,电影《黑客帝国》里的场景真的会出现。人类制造了机器人,机器人却叛变,与人类爆发战争。会思考的电脑控制了人脑,人类则在电脑的欺骗下生活?

了解了Alice的奥秘,我们就来说说SiriSiriAlice的机制基本相同,首先会根据用户输入的信息在数据库里选择匹配的内容,然后经过一定算法处理以后返回给用户。这里主要涉及以下技术:语音识别技术,负责将语音转化为文本;数据库,负责组织一定形式的数据,便于机器人提取知识;对于Siri来说,它的数据库并不在本地,而是分布式的云端,通过云计算技术(以google为代表的网页搜索技术;以 Wolfram Alpha 为代表的知识搜索技术;Wikipedia 为代表的知识库技术(包括其他百科,如电影百科等);Yelp 为代表的问答以及推荐技术。),实现数据的整合和提取。和Alice等机器人不同的是,Siri似乎可以抛弃繁琐的语法结构,甚至思维模式也可以混乱,Siri会结合上下文结构去理解,它还会从人类语言史的角度出发,利用人工智能系统去分析,并在绝大多数情况下领会你的意思。 在这一点上,Siri显得更为智能,因为它更像人工智能而不是聊天机器人。

国内的人工智能技术研究相比较国外起步较晚,但是同样取得了很多不凡的成就。以聊天机器人为例,清华大学图书馆的虚拟服务机器人“小图”,能够为用户提供图书信息,实现虚拟化管理。此外,有国内著名软件商赢思推出的小i机器人,通过和QQMSN、飞信等软件商的合作,已经得到广泛的应用。在移动互联网的大潮中,小i机器人先后推出了各大平台的版本,能够为用户提供聊天、天气查询、网页搜索、翻译等类似于“Siri”的功能,因此,小i机器人被称为中文语音“Siri”。还有我们常常听到的QQ机器人、飞信机器人都属于聊天机器人。

由于中文语法的复杂、博大精深,对于中文的处理难度相对英语要大得多。英语由单词构成,彼此之间通过空格而分开。但是中文是不具备这样的特征的,因此对中文的处理无疑是一个具有挑战性的问题。对于中文聊天机器人,首先要解决语料库的问题,选择什么样的数据结构来存储数据显得身份重要。其次,要解决一个词的问题,类比国外的聊天机器人,我们有了中文分词的研究。所谓分词,就是把一个句子分割成几个具有明确意义的词汇。分词的方法目前主要有:字符串匹配分词(正向最大匹配法、逆向最大匹配法、最少切分、双向最大匹配法)、理解分词方法、统计分词算法。分词中最大的难点是歧义词和未登录词的处理。对于未登录词的处理,理论上我们可以利用机器学习技术加以消除。不仅仅是聊天机器人,中文分词对于搜索引擎、机器翻译(MT)、语音合成、自动分类、自动摘要、自动校对等等,都需要用到中文分词。中文分词可以说是中文信息处理的基础。至此,我们应该明白了中文聊天机器人今后的方向,一个是机器学习,一个是基于云计算的云端数据挖掘,两者相互结合可以使机器人的知识库变得强大起来。此外,还需要加强机器人在上下文关联和输出控制方面的机制,这样我们的机器人才能更聪明,才能更好的为我们服务。

透过聊天机器人来谈人工智能无疑是浅显而片面的,但是依靠聊天机器人的冰山一角,我们发现,人工智能离我们的生活真的不远,甚至说我们整天都在使用人工智能。目前,人工智能的推理功能已获突破,学习及联想功能正在研究之中,下一步就是模仿人类右脑的模糊处理功能和整个大脑的并行化处理功能。人工神经网络是未来人工智能应用的新领域,未来智能计算机的构成,可能就是作为主机的冯·诺依曼 型机与作为智能外围的人工神经网络的结合。研究表明: 情感是智能的一部分,而不是与智能相分离的,因此人工智能领域的下一个突破可能在于赋予计算机情感能力。情感能力对于计算机与人的自然交往至关重要。 

参考文献:

[1]田金萍《人工智能发展综述》

[2]郑南宁院士谈人工智能的研究现状《人工智能与人类生活》 上海科技报/2010 年/10 月/22 日/第 B03 版  

[3]王树西、刘群、白硕《问答系统研究综述》

[4]李德毅、肖俐平《网络时代的人工智能》

[5]危辉、潘云鹤《从知识表示到表示: 人工智能认识论上的进步》

[6]梁子琳、丁润伟《基于句类模型的人机对话系统语句库设计》

[7]夏天《基于ALICE的汉语自然语言接口》

雪轻鸿 CSDN认证博客专家 .NET Python 伪·全栈攻城狮
谢谢你,在这世界的角落,找到我,一个即将进入而立之年的中年大叔,常年以 飞鸿踏雪 的花名混迹江湖。在现实生活中,我是一名 伪·全栈攻城狮,因为我觉得,什么都略懂一点,生活会更多彩一些。目前,主要关注.NET、.NET Core、Python、数据分析、微服务、Web 等技术方向。日常行为:读书、写作、电影、烹饪、洞箫等。喜欢看日剧/纪录片/科普、刷B站、刷LeetCode等。
已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 成长之路 设计师:Amelia_0503 返回首页
实付 9.90元
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值