查字典论文网 >> 浅谈智能助理及其应用的信息检索技术

浅谈智能助理及其应用的信息检索技术

小编:

摘要:本文首先从智能助理的概念入手,探究智能助手的前世今生以及发展历程,阐述了智能助手的演变过程,进而对智能助理这个概念进行简单的总结和归纳,然后通过对各大厂家的智能助理背后使用的信息检索技术和信息技术进行了简单的探讨,并归类分析,提出一些展望。

关键词:智能助理;信息检索技术;谷歌;微软;苹果公司

一.智能助理的概念

智能助理也可以称呼为智能助手,这个定义来自于微软发布的Cortana(中文名:微软小娜)语音软件。cortana是微软发布的全球第一款个人智能助理。它“能够了解用户的喜好和习惯”,“帮助用户进行日程安排、问题回答等”。[1]Cortana可以说是微软在机器学习和人工智能领域方面的尝试。微软想实现的事情是,手机用户与cortana的智能交互,不是简单地基于存储式的问答,而是对话。它会记录用户的行为和使用习惯,利用云计算、搜索引擎和“非结构化数据”分析,读取和“学习”包括手机中的文本文件、电子邮件、图片、视频等数据,来理解用户的语义和语境,从而实现人机交互。[1]

二.智能助手的发展历程

最早的语音助手在主要的手机操作系统中都有,通常会被叫做语音识别,或者语音命令,作为系统的一个单独功能选项而出现。语音助手的出现使用户和使用者解放了双手,可以通过简单的语音命令,诸如“照相机”,“短信”等简单的语音短语来开启某些手机的功能。虽然简单,功能有限,而且不具备学习能力,但这是一种比较明显的进步,因为机器可以识别自然语言,而非之前的人工语言。通过后台程序和数据库,操作系统能够识别出人的语音,将其转换为机器语言,执行其想要表达的命令,自动完成操作而不需要人工干预。相比较之以前的各种智能助手程序,这种进步使得机器完成了自然语言和人工语言的转换,虽然在识别率,语音功能上还比较弱小,很多任务无法完成,自定义选项有限,但意义非常重大。

三.三大智能助手基于的信息技术介绍

智能助手的概念很早就有人提出,最早来自于PDA个人助理设备和早期的智能手机。早期的智能助手属于被动式的计算程序,用户和使用者通过设置各种规则来让程序执行各种动作,诸如定点设置闹铃提醒,按时给某人发短信等非常简单的功能。这时的智能助手还不能算做是真正的智能概念,因为其不具备机器语言和学习的功能,仅仅能够通过用户设置的规则提前或者滞后执行某种操作。但因为可以不需要用户和使用者的实时操控,显得相对智能,从而获得了智能助手的称呼。这种智能助手基于不同的操作系统,包括linux,symbianS60等,都是早期智能手机上的APP程序,种类很多,功能简单,而且使用方法比较麻烦,人机交互不是非常友好,非常生硬。用户和使用者对其的使用主要依靠键盘和触摸屏进行,反应速度比较慢,语言的转换速度也很慢。随着智能手机硬件系统的发展和软件系统的更新,智能手机能够处理更多的数据,同时网络技术的演进,数据的上传和下载也变得更加方便,语音助手这个概念出现了。

siri,google now,cortanan这些智能助手主要采用的是两大技术,即人工智能以及云计算。但如果更细分来说,则可分为前端技术和后台技术来看。在前端技术方面,即面向用户,和用户交互(User Interface,UI)的技术,主要是语音识别以及语音合成技术。语音识别技术是把用户的口语转化成文字,其中需要强大的语音知识库,因此需要用到所谓的“云计算”技术。而语音合成则是把返回的文字结果转化成语音输出,这个技术理论上本地就能完成,当然也可以是在云端完成的。后台技术,其实才是真正的大角色。这些技术的目的就是处理用户的请求,并返回最匹配的结果,这些请求类型很多,千奇百怪,要处理好并不简单。基本的结构可能是分析用户的输入(已经通过语音转化),根据输入类型,分别采用合适的技术(合适的技术后台)进行处理。这些合适的后台技术包括,①以Google,Bing,百度等为代表的网页搜索技术;②以Wolfram Alpha为代表的知识搜索技术(或者知识计算技术);③以维基百科为代表的知识库(和Wolfram Alpha不同的是,这些知识来自人类的手工编辑)技术(包括其他百科,如电影百科等);④以Yelp为代表的问答以及推荐技术。将处理后得到的结果再返还给用户,也就完成了一次与用户的问答或是聊天。[5]

四.智能助理的发展方向

总的来说,无论是微软公司的Cortana还是谷歌公司的Google Now或是苹果公司的Siri,其核心技术基本属于NLP体系,基于自然语言处理技术,剖析用户语言组成,分析中文语义理解用户意图并相应。具体来说是意图识别(特征抽取,多维分类模型,中文语法分析),命名实体识别(信息抽取泛化,结构化资源库),应答引擎(交互式场景,记忆能力,一问多答)。机器学习,通过和用户的交互以及互联网数据挖掘开展的学习来让智能助理能自动完善自身的知识数据,并随时间推移越来越强大和智能,具体有监督、半监督和无监督学习,同时基于用户反馈的学习(负责成百上千各模型的效果自动提升),评测体系和异构信息融合与挖掘(基于海量多类型数据挖掘并构造结构化知识库)。基于用户画像的咨询服务,通过分析用户基本资料,历史行为和动作轨迹,构造用户个人信息库,使智能助理能准确的了解用户的性格,爱好、习惯,做出优质的个性化服务。

参考文献:

[1]微软小娜是什么?.江西门户网.2014-8-6

[2]计算机光盘软件与应用,Computer CD Software and Applications,2014年10期

[3]谷歌在2015 I/O大会都说了什么?干货都在这.人人都聊互联网[引用日期2015-05-29]

[4]百度百科http://baike.baidu.com/link?url=W5BJ2s-QZ63kGpO-XlN9S0r7l4w1ax7ox_KDHkgULd9vghOMwduGEx9eH5TMudyIKdn9aOSvtK8VpYTaX7Mau_

[5]人工智能浅析语音助手的现状及未来发展http://www.ailab.cn/news/tech/2014103020340.html

[6]GoogleNow背后的科技有多黑?http://www.ailab.cn/news/tech/2015090351007_2.html

[7]Google Now正式登上Windows和Mac桌面平台.网易[引用日期2014-03-25]

热点推荐

上一篇:非英语专业大学生英语语调使用状况的实验调查研究

下一篇:如何对幼儿进行德育教育论文 幼儿园关于德育教育之类的论文

农业项目整体管理方案 项目管理方案(模板5篇) 项目化英语教学心得体会 2023年银行办公室支部书记述职述廉报告(六篇)