摘要
本文按照软件工程的基本思路,宏观上设计出藏文字词统计软件的基本架构,从微观上设计出藏文字词量化的功能模块,实现了藏文字词统计分析的算法,并通过语料库语言学的理论和研究方法对规模为36万词种的词典语料库中统计出总数为9111个藏文音节数,60万次词构成的藏语教材语料库中统计出藏文音节总词量、文本数、词种数、词频、词性、频次、词长、累加频率、分布率、使用度等大量珍贵的数据,这对于促进藏语语言学研究和语言教学领域字词量化研究及教材编写等提供较为科学的数据。
出处
《电子技术与软件工程》
2015年第17期52-53,126,共3页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
基金
国家自然科学基金"藏语依存树库的构建(批准号:61163043)"
"基于Ontology的藏文语料库检索关键技术研究(批准号:61262053)"
国家哲学社会科学基金重大项目"基于地理信息平台的藏语方言数据库建设(批准号:14ZDB101)"
教育部哲学社会科学研究重大课题攻关项目"藏文<大藏经>十种版本电子资料库建设及其研究(批准号:13JZD028)"
西藏大学珠峰学者人才发展支持计划主体计划"杰出青年学者"
2014年度西藏自治区一般科技计划项目"基于小词汇量的拉萨语声学声学特征提取研究"(项目号:2015ZR-14-1)
2014年度西藏大学青年科研培育基金项目"面向拉萨语的语音声学特征提取研究"(项目号:ZDPJZK201403)的资助