基于预制约束的汉语语音录入系统
runsly
03-11 17:07
0

钱小飞

摘  要:基于预制约束,提出一种汉语语音录入的解决方案。在软件系统方面,通过定制音系系统,采用大颗粒度语音数据和选择式录入方式进行语音录入,并引入智能的错误检查机制和记忆排序机制,来检测错误和提高录入效率。在管理系统方面,重视录入流程管理,制定配套的录入流程规范来支持高质量录入。基于预制约束的汉语语音录入系统,在提高录入一致性和准确性方面,提供了高效的解决方案。

关键词:汉语语音录入;预制;约束;流程管理

随着经验主义研究的繁荣,语言学研究越来越依赖于大规模真实语言材料的获取。受益于计算机技术的发展,语法学和语义学研究所需要的大量文本材料比语音材料更容易获取。语音材料的获取不仅需要大量的语言调查,高效灵活的录入也是困扰研究者的主要问题。前人在语音录入问题上作出了大量的富有成效的工作,如李龙、潘悟云开发了云龙国际音标输入法,解决了国际音标录入的问题[1]。海柳文开发了“汉语方言民族语言语音材料处理软件”,分析处理调查所得的语音数据[2]。程南昌、侯敏开发了同音字汇生成软件,专门处理同音字表的排序生成[3]。潘悟云设计开发了汉语方言计算机处理系统(TFD),实现了方言材料的输入与规整、字音查询、方言音系分析、方言语音处理、方言地图等功能[4]。上述系统大多是针对方言语音处理的,在一定程度上支持了语音的输入、编辑和整理工作,为语音录入的编码、输入、检索、分析提供了便捷的工具。

我们希望在前人工作的基础上,对语音录入所存在的一些难点提供解决方案。这些问题主要包括:第一,字符一致性问题。国际音标需要用特殊软件录入,对于同一个音标,不同人员以至同一人的录入都会出现大量差别。第二,音标的错误约束问题。在录入国际音标时,常常会发生录入错误,包括误删、误增等。有些录入者使用键盘和普通输入法录入部分国际音标,甚至将一个音标拆分为多个字符,使得看上去类似的“国际音标”符号内部编码不同,这样就会造成检索不全和误检现象,降低了数据库的可用性和准确性。第三,稀疏特征值数据的问题。相近的方言在语音上可能会存在少量区别,却是语音研究的重要数据。在提供批量修正功能的系统中,容易造成稀疏特征值数据的无意识忽视。第四,字表问题。有时仅依靠所拥有的字表难以预测被调查方言的同音字情况,或者需要在现有字表的基础上增补语音材料[5],希望先录入再整理材料,这就需要一种灵活的逐字录入的方式。基于上述问题,本文提出了一种基于预制约束的语音录入策略,研制了一个汉语语音录入系统。

一、研制思路和系统构造

(一)汉语语音录入系统的研制思路

基于预制约束的汉语语音录入系统的主要研制思路,是通过支持定制化和规范化的录入流程管理,来解决录入过程中的录入一致性、音标的错误约束和稀疏特征值数据问题。具体来说,我们采用基于大颗粒数据的选择式语音录入方式,同时引入智能的错误检查机制和记忆排序机制,并通过严格的流程管理来保证录入数据的质量。

(二)汉语语音录入系统的构造

广义的汉语语音录入系统包括软件系统和管理机制两个方面。具体来说,软件系统主要由数据系统、语音录入系统两个部分组成,管理机制则由录入管理规范构成。汉语语音录入系统结构可如图1所示:

其中,数据系统是语音录入系统的操作对象,同时也为语音录入系统规定参数;录入管理规范规定了语音录入系统的录入规则。狭义的汉语语音录入系统则专指软件系统。

二、汉语语音录入的软件系统

(一)数据系统

数据系统包括语音数据表库和元数据系统。数据库采用Access数据库,由多个语音数据表组成。数据表是系统存放录入数据的地方,包括用于初始化的Init数据表和用户自定义的数据表。每个数据表的数据结构可如表1所示:

元数据系统包括合法的声韵调数据和非法的聲韵符号,用于提高录入的效率,进行智能化的错误检测。合法的声韵调数据存放于List文件夹中,非法的声韵调符号存放于IllElem文件夹中。这两组数据默认已经存在,用户可按照规定格式自行定制和修改内容,由于语音录入往往需要使用国际音标,数据内容必须使用UNICODE编码。List文件夹和IllElem文件夹与主程序TPD(Tools for Phonetic Data)位于同一个文件夹下。合法的声韵调数据文件、非法的声韵调符号文件分别如表2、表3所示:

(二)语音录入系统

1.控件注册

语音录入系统用于录入汉语语音,具备了数据库连接、加载视图、语音记录录入、语音记记录检索、语音记录更新、语音记录删除等功能。

在打开语音录入软件之前,需要为软件进行控件注册,这些控件管理语音数据的显示。控件注册可以分为两种情况:第一种情况,如果系统盘为C盘,双击regctrl.bat或regctrl.bat64,弹出注册成功的窗口后予以确认。第二种情况,如果系统盘不是C盘,拷贝OCX文件夹下的MSADODC.OCX,MSDATGRD.OCX至system32文件夹;点击开始->运行,在控制台中输入regsvr32 msadodc.ocx,按回车,弹出注册成功的窗口后确认;然后在控制台中输入regsvr32 msdatgrd.ocx,按回车,弹出注册成功的窗口后确认。

注册好控件之后,双击语音录入软件TPD.exe打开程序,单击菜单“语音库录入”->“录入系统”打开录入系统后,其界面如图2所示:

2.数据库连接

语音录入系统将汉字音节分项录入数据表,因此,在进行语音录入之前,首先需要建立一个Access语音数据库,并在数据库中建立相应的空数据表。该数据表的结构与Init数据表相同,如表1所示。在进行语音录入时,首先点击“载入数据库”连接数据库,然后点击“选择表”,下拉列表框中的下拉箭头,选择该数据库中的一张数据表。这里以北京官话为例,此时,下方的红色字体显示为“连接数据库成功”。具体如图3所示:

3.语音数据表视图

语音数据表视图可以帮助我们观察数据表中的已有数据和实时录入数据情况。第一次载入数据表时,如果数据表中已经存在数据,为保证显示字段与实际字段相对应,需要核对“ID字段”“韵母字段”“声母字段”“声调字段”“单字字段”“注释字段”的字段名是否与数据表的字段名相对应;如果不对应,可以在相应的下拉列表中选择更改。点击“载入视图记录”,则左侧的语音数据表单显示数据表中的数据。这些数据是分页显示的,点击“首页”“上一页”“下一页”“末页”可以跳转到相应的位置。此外,点击字体可以设置语音数据表单的显示字体、大小等格式,所选择的字体、格式将同时应用于“语音数据表单”和“韵母”“声母”“声调”“单字”“注释”的下拉列表框。语音数据表载入视图可如图4所示:

4.预制约束下的语音录入

预制约束下的语音录入主要包括三种不同的录入机制:基于预制的语音录入、基于约束的语音录入和记忆排序机制。

基于预制的语音录入与合法的声韵调数据文件listYM、listSM、listSD配合使用,在这些元数据文件中分别预制合法的声、韵、调等数据。具体示例如图5所示:

在录入过程中,采用元数据选择式录入的方式,只允许在下拉列表中使用预制的元数据,而不允许使用其他即时录入数据;如果需要修改录入数据,只能在系统底层修改元数据,原则上不接受界面边界。相对于国际音标而言,预制的声韵调数据的颗粒度更大,我们称之为“基于大颗粒度数据的录入”,它大大提高了语音录入的一致性和录入效率,使得同一个录入者在不同时间的录入,以及不同的录入者的录入内容基本相同;即使发生录入错误,这些错误也是一致的,易于修改的。比如,ʦ和ʈʂ、tɕ和ʨ’存在書写方式的差异,这些差异在录入的数据中是一致的,易于批量修正。基于大颗粒度的选择式录入可如图6所示:

与预制语音录入配合使用的是基于约束的语音录入。为了保证底层元数据的合法性,我们设计了一种约束机制,对录入错误进行定制的智能化的识别。基于约束的语音录入在系统底层自定义错误类别,并在编辑框下拉列表内,选择相应的预制元数据进行录入检查。如果出现与自定义错误类别一致的情况,将反馈给录入人员。对于韵母、声母、声调而言,汉字默认是非法选项。约束机制元数据可如图7所示:

具体来说,在录入界面,单击“韵母”“声母”“声调”“单字”“注释”下方编辑框的下拉列表,选择对应数据,或者输入对应数据,程序将检查输入的合法性。输入完成后,单击“添加记录”按钮,程序将检查是否存在重复记录;如无重复记录,“语音数据”界面将跳至最后一页,在尾部添加新记录。这种逐条录入的方式可以保证每条记录都被录入者关注,防止稀疏特征值数据的无意识疏忽。图8显示的是在韵母误录入非法字符“/”时的系统反馈。

语音录入系统还能够提供记忆排序机制。在输入第二条记录时,“编号”“韵母”“声母”“声调”下方的编辑框内将保留上一次的输入信息,“单字”“注释”编辑框的上一条信息会自动清除。如果不需要记忆上一次的录入内容,单击“清空输入”按钮,便可以清除“编号”“韵母”“声母”“声调”“单字”“注释”下方编辑框中的信息。“韵母”“声母”“单字”下拉列表框将保留最近N次的录入信息以供选择,并默认N=5,5,3。如果listDZ中录入了单字表,“单字”下拉列表将从第I个字开始,按照字表顺序动态显示M条信息,这时可以使用左向按钮和右向按钮进行调节,并默认I=1、M=10。修改字表后,需要重启录入界面。记忆排序机制能协助录入人员尽可能地利用上一次或前几次的已录入信息,大大减少了录入工作量;同时,也可以使我们利用已有字表进行录入,既兼顾了录入的灵活性,又极大地提高了录入的效率。

5.检索数据

语音录入系统同时也提供了检索功能,以便于查询、检查和修正录入数据。在“编号”“韵母”“声母”“声调”“单字”“注释”下方的编辑框中,输入待检索信息,单击“检索记录”按钮,程序将进行精确检索,进入检索视图。单击“关闭检索记录”,则可以退出检索视图。检索视图可如图9所示:

6.更新记录

更新记录功能可以在分页视图和检索视图下进行。在分页视图下,单击“语音数据表单”某条记录,在“语音数据表单”中修改该记录的内容,然后单击“更新记录”按钮,即可更新记录中的数据。在检索视图下,单击“语音数据表单”某条记录,在“语音数据表单”中修改该记录的内容,然后单击“更新检索记录”按钮,即可更新记录中的数据。如图9中,可以将ʈʂ修改为tʂ。

7.删除记录

删除记录功能可以在分页视图和检索视图下进行。在分页视图下,单击“语音数据表单”某条记录左部游标,当出现黑三角箭头指向该条记录时,单击“删除记录”按钮,即可删除该条记录。在检索视图下,单击“语音数据表单”某条记录左部游标,当出现黑三角箭头指向该条记录时,单击“删除检索记录”按钮,即可删除该条记录。

三、汉语语音录入的管理机制

我们认为,与语音录入软件相比,语音录入的项目管理机制同样重要。只有将语音录入软件的功能与优质的项目管理结合起来,才能取得令人满意的录入效果。而以往的研究却对此缺乏足够的重视。汉语语音录入的管理机制主要包括录入标准的管理和录入流程的管理两个方面。

汉语语音录入首先应制定录入的标准。语音录入的标准主要是在于音系。在多方言或多变体的数据库中,多个音系之间的符号表示应协调、规范而不冲突、不混淆,以便于检索结果中的音系符号具有唯一的意义。同时,录入标准还应包括元数据管理的标准。

我们不仅要在录入过程中严格执行录入标准,而且还要制定严格的流程管理。汉语语音录入项目的管理流程包括8个步骤:1.项目组成员录入音系;2.项目负责人审核和统一修正所有音系;3.项目组成员按照音系制定元数据;4.项目负责人审核和统一修正元数据;5.项目组成员进行语音录入;6.录入完成后,项目组成员根据录入数据重新归纳音系;7.项目组成员对比原始音系和录入音系,复查录入结果和进行修正,再次归纳音系,直到原始音系和录入音系相同,或确认新增声韵调标注无误;8.项目负责人审核和修正所有录入结果。

综上所述,基于预制约束的汉语语音录入系统,通过支持定制音系系统,采用大颗粒度语音数据、选择式录入方式,提高了语音录入的一致性。同时,引入智能的错误检查机制和记忆排序机制,通过严格有效的流程管理,来保证录入数据的质量,提高录入数据的效率。我们借助于这套系统,录入了20个方言点的语音材料,获得了很好的录入一致性和非常优质的语音数据,极大地减少了人工复检率。总体而言,基于预制约束的汉语语音录入系统与前人开发的录入系统各有特点,可以相互补充。它在前人研究的基础上,采用国际音标输入法录入大颗粒元数据,借助于预制约束机制和质量管理机制,在解决录入一致性、提高录入准确率方面,提供了一种高效的解决方案。

参考文献:

[1]李龙,潘悟云.国际音标输入法及其实现[J].语言研究, 2006,(3).

[2]海柳文.汉语方言民族语言语音材料处理软件设计[J].广西民族学院学报(自然科学版),2005,(3).

[3]程南昌,侯敏.“方言同音字汇”自动生成軟件的设计及实现[J].中文信息学报,2013,(1).

[4]潘悟云.汉语方言计算机处理系统[DB/OL].http://www.eastling.org/resource.htm,2011-06-11.

[5]李如龙.汉语方言学(第二版)[M].北京:高等教育出版社,2007.

Chinese Speech Input System:Based on Prefabrication and Constraints

Qian Xiaofei

(College of Liberal Arts, Shanghai University, Shanghai 200444, China)

Abstract:A solution to Chinese speech input based on prefabrication and constraint is proposed. In terms of software systems, custom phonological systems, large-granule speech data and selective entry methods are used for voice entry, and intelligent error checking mechanisms and memory ranking mechanisms are introduced to detect errors and improve the efficiency of entry. In the area of management systems, the importance of entry process management has been put forward, and supporting input process specifications have been formulated to support high-quality input. Chinese speech input system based on prefabrication and constraint provides an efficient solution for improving the consistency and accuracy of input.

Key words:Chinese speech input;prefabrication;constraint;process management

标签: 预制 流程管理 约束

相关内容

热门资讯

全国政协十三届五次会议在京开幕 全国政协十三届五次会议在京开幕 习近平李克强栗战书王沪宁赵乐际韩正王岐山到会祝贺 汪洋作政协常委...
1.35万亿元!中国烟草创下利... 1.35万亿!虽然处在疫情之年,但是中国烟草还是在2021年刷新了税利纪录。3月6日,2021年烟草...
理想汽车:2021年第四季度净... 2021年第四季度的车辆毛利率2为22.3%,而2020年第四季度为17.1%,2021年第三季度为...
新泰天气预报03月04日 新泰天气预报30天 今日天气:新泰市,晴,0℃~18℃,西风1级,当前温度8℃。 2022年03...
考验践行良法善治的知识产权“维... 某CMS发函广大网站主侵权,并要求高额付费的事情,近期闹得沸沸扬扬。被大家诟病的是其一直对外宣传免...
一周国内本土确诊553例,涉3... 人民日报健康客户端根据国家卫健委通报的新冠疫情情况梳理发现,2月25日至3月3日,31个省市(含兵团...
最大12级!华北大部出现7级以... 截至4日下午14时,内蒙古中东部、北京、天津、陕西、河北西部、山东、辽宁西部等地出现7-8级以上大风...
最晚不会晚于2025年,中国一... 据中国新闻网微博3月3日消息,全国政协常委、北京大学新结构经济学研究院院长林毅夫接受采访表示,中国距...
胡锡进:军费占GDP的比例太低... 今年中国国防预算增长7.1%,高于去年的6.8%,另外明显高于今年GDP增长5.5%左右的目标。但老...