浅谈语音识别技术对期刊编辑出版工作现代化的作用

时间：2024-05-04

小编：

在信息化社会里，采用先进的技术与手段进行信息的采集、处理、传播是出版业发展的必然，也是信息化社会对编辑工作者的要求[1]。随着现代科技的迅速发展，编辑出版工作的运行方式正在发生变化，表现为管理的现代化和手段的现代化。作为期刊编辑必须适应这个变化，将科学的方法和先进的技术手段有机地结合起来，紧跟时代潮流，促进期刊编辑工作现代化。

语音识别技术是机器通过对语音信号的识别和理解过程将语音信号转变为相应的文本或命令的技术，是信息技术领域十大重要的新技术之一，其应用已经成为一个具有竞争性的新兴高技术

产业[2]。

科技期刊的编辑出版对语音识别技术的运用，主要是指采用先进的语音识别应用设备、软件和操作平台，对期刊信息进行采集、处理、存储和传播，实现便捷、高效的期刊编辑出版。语音识别技术的应用可使编辑甩掉键盘，通过语音命令对机器进行操作，让编辑记者从事务性劳动中解放出来，将更多的时间精力用于创造性劳动中，更好地从事编辑活动，达到编辑工作的目标[3]。

一、语音识别技术在编辑检索中的应用

在网络时代，作为一个期刊编辑，需要随时了解行业动态，把关出版内容，审核信息真实性，根据编辑规范对文章进行加工制作，这一切都离不开对信息、资料、标准的查询检索。互联网搜索引擎，如百度、谷歌等，是目前人们最为常用的一种网络检索工具，编辑记者无时无刻不在使用。通过手写或键盘输入关键字的检索方式，虽然比传统的纸质书报刊查阅有了质的飞跃，但也非尽善尽美：一是不能满足国际上通行的“普遍服务”要求，例如文盲、肢体残障人和老年人无法使用。二是搜索服务精准率不高，搜索引擎提供的结果众多，包含大量广告和无用信息，要找出所需要的知识还需要一条一条打开链接再搜寻。三是音视频搜索存在许多盲点无法检索，例如在数字出版中要搜索电视剧某一片段仍很困难。

通过语音识别技术，可以有效解决这些问题。例如，期刊编辑需要查找某些内容，可以运用iPhone4S智能手机搭载的“siri”的来完成。其先在设置里把siri打开，然后按home键唤出siri，再点一下界面上的话筒，siri开始聆听。语音输入完成，siri就开始识别并且作出回应。因为跳过了谷歌、百度的所有步骤，从而免去了打开链接再收寻的烦恼，而且回答以自然语言的形式呈现，准确度高，可帮助编辑大大提高搜索效率。

又如，编辑需要一段乒乓球比赛的视频，利用“中文电视广播新闻节目识别系统”，编辑只要说出“侧身抢拉”、“前三板”等词，系统就可以找到精确到秒的视频片段。同样，如果想找一部电影的片段，只需记得其中的经典台词，对着系统说出即可精准搜索。编辑需要查找某首歌曲，可以利用哼唱搜索引擎——Midomi，对着麦克风哼唱某段旋律，便可轻松找到想要的歌曲，它甚至可以自动纠正哼唱者曲调的错误。

语音识别技术应用于搜索引擎中，可为期刊编辑工作提供精准、方便、快捷的技术手段，并为所有能发音说话的人提供互联网服务。对下一代搜索引擎来说，语音搜索是未来发展方向。

二、语音识别技术在采访中的应用

采访是编辑记者同采访对象进行语言交流的动态过程。目前，媒体的采访工作受到两大问题困扰：一是访谈采用笔录、摄影及录音、录像等形式，采访结束后，需要将上述素材整理成文字资料，这是一个费时费力的苦差事；二是许多采访活动会涉及与非母语的外国人士交谈，由于语言不通，不利于交流，影响采访的展开。为解除这两大困扰，科研人员经过长期的努力，提出了许多有效的解决方案，其研究成果也已应用于实际。

利用谷歌的在线文本翻译器，编辑记者在采访过程中，可以使用母语对设备讲话，设备随后将编辑记者的声音转化成被采访者所希望的语言，并以人造合成声音的方式输出；受访者也可以使用母语与编辑记者对话，该设备会将受访者的语言转化成编辑记者的母语，从而保证了编辑记者与外国人的畅通交流。iPhone4S智能手机应用Lingual后，会将用户的讲话显示在iPhone屏幕上，可供选择的语言达30种。由BBN公司开发的翻译设备TransTalk，也允许使用不同语言的人进行双向对话。

我们可以设想一下这一“语音控制时代 ”的采访和写作，一旦采访者与被采访者的灵思闪现，只需要拿出自己的智能设备，对其发出指令，随意念出所思所想，便将成为媒体选用的作品。

三、语音识别技术在文件输入中的应用

电脑的诞生给传统的纸笔书写带来了新的技术革命，较之传统的手写方式，电脑书写拥有不可比拟的优势。但是，要掌握一种输入法并熟练操作不是一件容易的事，电脑打字也并非适合所有人群；而且长时间坐在电脑面前操作，容易造成对眼睛的伤害，电磁辐射时刻威胁着人们的健康；工作的繁忙与灵感的转瞬即逝，也对文字输入效率提出了更高要求。语言是人类最简单、最快捷、最方便、最自然的思想表达方式，也是人类思维的工具[4]，人们一直都企盼着通过语音操控机器为人类服务的时代到来，事实上，这个时代已经来到了我们身边。

期刊编辑可以运用Windows7的语音识别系统，对着计算机朗读文本，由计算机自动生成常用格式的文字用以编辑写作；可以创建文本文档，也可在文档中进行修改或更正错误。如果计算机识别有误，可以说“更正”，接着说出错误的字词，系统会及时作出修正。除了打字外，编辑还可以利用该语音识别程序中的16个常用命令、9项常用控件命令、31项文本处理命令、15项窗口命令、5个点击屏幕任意位置命令，以及另外的几组键盘命令，用语音对计算机进行操作。

编辑更可以利用讯飞口讯这一基于“云计算”方式实现的手机听写软件，在实现语音文字输入的同时，将文字通过短信、邮件进行发送。这些信息甚至可以发送到新浪微博、腾讯微博和开心网供大家分享。该系统还能根据发音断句自动添加标点符号，极大提升了编辑的文字输入效率。如果编辑需要将某段广播电视节目中的语言变为文字加以利用，就可以使用“中文电视广播新闻节目识别系统”，让系统“收听”一段广播电视节目（如新闻联播节目），系统会自动将节目中的语音内容生成文字。还有一种翻译摘录笔也非常适合编辑记者要求，它采用图像识别技术，可快速将书刊中的内容扫入“笔”中，供编辑随时查阅、修改。它能存储300万汉字，并可以快速传输到电脑、手机、掌上电脑等设备中，比手写快几十倍。

利用语音识别和图像识别技术，能够高效快捷地输入输出文字，可以提高电脑的使用效率，把编辑的双手从鼠标键盘上解放出来，让编辑将更多的时间放在策划等有创造性的工作上，这是提高期刊编辑质量的一个有效方法。

四、语音识别技术在文字校对中的应用

校对是期刊编辑出版过程中的一个重要环节，其任务是根据原稿订正排印或缮写的错误。编辑加工除改错外还有补漏、删繁、润色、升华等，编辑质量的高低体现在原稿上留错的多少，而校对工作的质量则体现在出版物上留错的多少。编辑工作的疏漏，可由校对工作来弥补和完善，但校对工作的失检则无可挽回地成为出版物中的差错[5]。

文字的人工校对辛苦且枯燥，稍不注意就会出现漏校和错校，即使经过三校也难免遗漏。采用语音识别技术，可极大提高工作效率，减少错误率。例如，编辑可以使用即时语音校对软件InsTalk来开展校对工作。当编辑打开一个Word文档输入汉字、数字和英文字母时，计算机附带的喇叭会跟随录入的字符即时发出相应的汉语普通话语音，通过语音的提示，编辑便可知道字符是否输错。这一功能对使用五笔或其他形码的编辑而言更显得意义重大，很多常犯的和稀奇古怪、莫名其妙的错误都可以在输入过程中避免。文档输入完后，编辑还可以让电脑朗读全文帮助校对文字。

需要编辑注意的是，虽然语音识别软件提供了快捷的校对手段，但其智能化程度目前还不是很高，对如语法、句子结构、词语搭配、专业术语、政治问题、领导人职务及排序、涉台问题以及目录、序号、科技计量、标点等错误，还不能有效检测校对，因此必须配合其他手段加以完善。黑马校对系统就是一个非常好的选择，黑马校对软件包含七十多个专业库，支持各种排版软件。目前国内已有95%以上的出版社、近万家的报刊、印刷企业、文化公司和机关办公等单位和个人正在使用黑马校对平台。将语音识别软件与黑马软件相配合，不仅可以大大提高工作效率，减少人工劳动强度，而且校对速度快、质量高。

五、语音识别技术在刊社管理中的应用

1. 过期期刊收藏检索。过期期刊记载着刊社发展历史，是刊社宝贵的内容资源，也是编辑经常查阅信息的“数据库”。使过期期刊的收藏与管理逐步向标准化、现代化方向发展，是过期期刊管理工作的基本要求和发展趋势。编辑运用微软的语音识别开发平台SAPI，只需说出想检索的内容，系统就会自动识别语音，返回检索结果，显示馆藏书刊、借阅情况等信息[6]。

2. 语言培训。编辑如需进行语音方面的训练（如英语发音、普通话发音等），运用语音识别软件（如思必驰公司开发的口语在线学习平台——声动之芯），只需对着麦克风读出需要练习的字、词、句，系统就会自动打分并实时地把得分、发音纠正等评测信息反馈出来。整个学习过程摆脱了老师和课堂的限制，只要有电脑和网络，学习者就能随时进行口语练习评测。

3. 办公室管理。利用手机或其他手持电子终端，通过语音识别软件可以远程控制办公室的电器设备（如电脑、空调、电视机、VCD、电扇、窗帘）。通过语音识别设备还可以取代人工接线员，实现电话自动转接服务，如中科信利智能总机系统TIDS（即“电脑接线员”），用户只需说出所要找的人名，该系统就会用语音识别技术识别出用户想要找的人，将电话转接到相应的电话分机，它特别适合于装有集团电话的期刊、图书出版社。运用语音识别技术还可以代替会议活动的速录，用于刊社车辆管理[7]，单位的防火防盗，以及员工考勤等诸多方面。

语音识别技术发展到今天，其应用系统对中小词汇量以及非特定人语音识别精度已经大于98%，对特定人语音识别精度则更高。但是对连续、大词汇量和非特定人的语音识别要达到更高精度，还有较长的一段路要走；在任何环境下都能实现人机自由对话，其难度会更大，这不仅需要基础理论的突破，更需要大量真实用户数据积累后的系统自动学习和演进。

目前语音识别技术已经能够满足期刊编辑通常的应用要求，但也有不足：一是对不同的人，因为普通话水平有差别（即口音的差别），其识别率高低会不同，因此需要对某些用户做一定的自适应训练后才能更准确识别[8]；二是识别系统的环境适应性尚不尽如人意，在噪音环境下语音识别性能还不够理想；三是由于知识表达等问题，听写系统还不能完全取代键盘的输入；四是语音识别系统在实验室演示效果很好，但转化为商品应用于实际，还有许多具体问题需要解决，比如识别速度、识别的准确度和人性化等，因此还需要有一个不断提高和升级的过程。

随着技术的不断发展、进步，语音识别技术必将广泛应用于期刊社及其他媒体工作的方方面面，实现人机的完美交互，从根本上改变传统工作方式，将编辑的手从键盘中解放出来，以高效、快捷的手段，带动编辑工作质量的提升。为适应新技术对编辑工作的要求，期刊编辑不仅要从专业上不断充实自己，还要不断拓展自己的知识领域，掌握现代技术手段，以推进我国期刊向现代化和国际化方向发展。

浅谈语音识别技术对期刊编辑出版工作现代化的作用

小编：

相关推荐

热点推荐

相关搜索

最新排行