互联网 qkzz.net
全刊杂志网:首页 > 大学学报 > 文章正文
刊社推荐

汉语方言语音数据库建设构想


□ 洪拓夷

  [摘要]介绍我国近年来相关研究的情况,论述建设汉语方言语音数据库的重要意义和技术上的可行性,并从汉语方言语音数据库功能、数据库系统构成、语音语料库设计等几个方面进行分析和探讨,构建一款可用于认知和研究等的多功能的汉语方言语音数据库,同时提出需要注意的几个问题。
  [关键词]汉语方言 方言数据库 语音数据库
  [分类号]H21 G254
  
  1 引言
  
  近几年,由于受到普通话和流动人口的影响,使得用纯正方言的人数越来越少,应该说这些方言正处于衰变状态。所以,笔者认为,尽快建立具有多功能的汉语方言语音数据库具有极其重要的意义:①可以通过其存储和学习功能来保护和传播人类非物质文化遗产;②通过其检索和辨识等功能,帮助某些职能部门准确辩别出话语者的乡里籍贯等地域信息,如对公安、安全部门开展刑事侦查等具有重要的应用价值;③通过其原生态的语音语料库事实数据有助于深入研究语音现象和文化渊源等。同时,它又可以推动语言现代化处理技术的深入研究和运用。可见,拟建的汉语方言语音数据库具有广阔的应用前景。
  多媒体计算机语音处理功能的实现,多媒体软件开发技术的运用,汉语文-语转换、自动分词、语音合成、语音检索等处理技术的深入研究等都为多功能汉语方言语音数据库的建设提供了有力的技术保障,如汉语的文语转换系统可以将计算机内的任何文本转换成连续的语音流,再如汉语方言自动辨识技术虽然尚处于起步阶段,但它可以通过特征选取、音素匹配等方法对汉语方言进行辨识。
  目前,学界相关研究也曾取得了一些成绩,如李永宏和于洪志对“安多藏语语音合成语料库”进行了初步研究,词库以双音和多音节词为主体,句料库却以7种句型合成为主;沈向荣曾提出开发“壮语方言词语在线语料库检索软件”的设想;海柳文曾提出“汉语方言民族语言语音材料处理软件”的开发框架;肖双荣和吴道勤曾提出要在建立湖南方言语音特征数据库基础上进行湖南方言语音特征统计和分析;中国社会科学院开发的“北方方言基本词汇数据库”,收录北方话100余调查点和2000余条基本词汇;由丁邦新等开发的“汉藏同源词研究系统”,收录了汉藏语系122种语言和12种汉语方言的1500余条词汇;再如麦耘主持的“汉语方言词汇数据库”,刘丹青主持的“方言语法语料库”,侯精一主持的“现代汉语方言音库”,刘俐李主持的“汉语方言语音词汇库”等。尽管这些相关数据库存在明显不足,如方言偏少,收词量偏少,语音数据缺乏,缺少语音原始情景信息,系统功能单一等,但它们都为汉语方言语音数据库建设打下了良好的基础。
  
  2 方言语音数据库建构
  
  2.1 数据库功能
  检索功能。数据库应具有多途径检索功能,检索标识可以是文本也可以是语音;可使用多条件进行组合检索,能实现普通话与方言以及方言与方言之间的双向浏览,如由普通话词汇或语音能检索到相应的方言词汇或语音,由方言查找普通话或其它方言等;能以汉语方言语音为检索入口,通过对语音特征进行匹配,如调类、调值、调型、变调等,查出方言的市、县、乡三级地名信息;能根据各种方言实际情况和用户浏览习惯,来确定浏览方式和输出信息。
  学习功能。该数据库的建成将成为人们了解和学习各种方言不可或缺的工具。可以通过直接点击数据库中的词语或句子并选择方言类型,便能听到该方言的发音和相关例证等信息。可以通过输入词、句、段等文本,输出相对应的语音和相关例证等信息,这些语音文件有的是语料库中的原生态发音,有的是通过自动切分技术,采用音节及词汇的语音合成技术模拟而成的仿自然语句。
  分析功能。系统可以实现各种知识库间的有机联系,对各种方言的语法、语义和语用等资源描述信息进行比较分析等,如能以方言语音语料库、方言词语词汇库、方言语音语法知识库等为基本依据进行各种特征相似度比较、匹配和分析等,从而确定检索结果与要输出的内容。
  下载功能。它用来实现用户对检索、分析和比较结果的下载和打印;提供给用户对语言数据的统计(表格)等的输出;可以输出用户使用情况的统计数据与分析等。可以选择语音文件的某种格式进行下载,也可以输出带方言注音的汉语学习文本。
  维护功能。它主要包括三方面的维护功能:一是数据编辑功能,系统对载人的语音数据可以进行复制、剪切、替换、插入等;二是系统维护功能,系统管理员可进行数据管理、用户管理、日志管理以及系统升级等;三是拓展功能,根据发展需要对数据库再设计或添加新模块,以加强或拓展数据库功能。
  用户验证。系统对使用者身份进行确认从而分配不同的权限,主要分为系统管理员、数据管理员和普通用户。
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文
关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | EMS快递查询
全刊杂志赏析网 2016