互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

汉语方言语音数据库建设构想


□ 洪拓夷

  [摘要]介绍我国近年来相关研究的情况,论述建设汉语方言语音数据库的重要意义和技术上的可行性,并从汉语方言语音数据库功能、数据库系统构成、语音语料库设计等几个方面进行分析和探讨,构建一款可用于认知和研究等的多功能的汉语方言语音数据库,同时提出需要注意的几个问题。
  [关键词]汉语方言 方言数据库 语音数据库
  [分类号]H21 G254
  
  1 引言
  
  近几年,由于受到普通话和流动人口的影响,使得用纯正方言的人数越来越少,应该说这些方言正处于衰变状态。所以,笔者认为,尽快建立具有多功能的汉语方言语音数据库具有极其重要的意义:①可以通过其存储和学习功能来保护和传播人类非物质文化遗产;②通过其检索和辨识等功能,帮助某些职能部门准确辩别出话语者的乡里籍贯等地域信息,如对公安、安全部门开展刑事侦查等具有重要的应用价值;③通过其原生态的语音语料库事实数据有助于深入研究语音现象和文化渊源等。同时,它又可以推动语言现代化处理技术的深入研究和运用。可见,拟建的汉语方言语音数据库具有广阔的应用前景。
  多媒体计算机语音处理功能的实现,多媒体软件开发技术的运用,汉语文-语转换、自动分词、语音合成、语音检索等处理技术的深入研究等都为多功能汉语方言语音数据库的建设提供了有力的技术保障,如汉语的文语转换系统可以将计算机内的任何文本转换成连续的语音流,再如汉语方言自动辨识技术虽然尚处于起步阶段,但它可以通过特征选取、音素匹配等方法对汉语方言进行辨识。
  目前,学界相关研究也曾取得了一些成绩,如李永宏和于洪志对“安多藏语语音合成语料库”进行了初步研究,词库以双音和多音节词为主体,句料库却以7种句型合成为主;沈向荣曾提出开发“壮语方言词语在线语料库检索软件”的设想;海柳文曾提出“汉语方言民族语言语音材料处理软件”的开发框架;肖双荣和吴道勤曾提出要在建立湖南方言语音特征数据库基础上进行湖南方言语音特征统计和分析;中国社会科学院开发的“北方方言基本词汇数据库”,收录北方话100余调查点和2000余条基本词汇;由丁邦新等开发的“汉藏同源词研究系统”,收录了汉藏语系122种语言和12种汉语方言的1500余条词汇;再如麦耘主持的“汉语方言词汇数据库”,刘丹青主持的“方言语法语料库”,侯精一主持的“现代汉语方言音库”,刘俐李主持的“汉语方言语音词汇库”等。尽管这些相关数据库存在明显不足,如方言偏少,收词量偏少,语音数据缺乏,缺少语音原始情景信息,系统功能单一等,但它们都为汉语方言语音数据库建设打下了良好的基础。
  
  2 方言语音数据库建构
  
  2.1 数据库功能
  检索功能。数据库应具有多途径检索功能,检索标识可以是文本也可以是语音;可使用多条件进行组合检索,能实现普通话与方言以及方言与方言之间的双向浏览,如由普通话词汇或语音能检索到相应的方言词汇或语音,由方言查找普通话或其它方言等;能以汉语方言语音为检索入口,通过对语音特征进行匹配,如调类、调值、调型、变调等,查出方言的市、县、乡三级地名信息;能根据各种方言实际情况和用户浏览习惯,来确定浏览方式和输出信息。 ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《图书情报工作》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017