-
题名Zipf定律与汉字字频分布
被引量:20
- 1
-
-
作者
游荣彦
-
机构
华南师范大学计算机科学系
-
出处
《中文信息学报》
CSCD
北大核心
2000年第3期60-65,共6页
-
文摘
本文证明了在以Zipf定律描述整个汉字字频分布时 ,不管如何精心挑选参数a和c,一些累计拟合频率都有明显的误差。针对这一现象 ,本文提出了一个解决办法 ,那就是以Zipf定律仅描述汉字字频分布的尾部的方法。
-
关键词
计量语言模型
汉字字频分布
Zipf定律
拟合频率
-
Keywords
Computationl language model Distribution of Chinese character frequency Zipf's law Fitting frequency
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名唐代以来汉语文学作品中的字频演变
被引量:4
- 2
-
-
作者
刘宇凡
郭金忠
陈清华
-
机构
石家庄经济学院人文社科学院
北京师范大学管理学院
-
出处
《中文信息学报》
CSCD
北大核心
2011年第3期93-97,共5页
-
基金
北京师范大学青年教师科研基金资助项目
-
文摘
研究历史上各个时期汉语文学作品中的字频分布具有重要意义,可以帮助我们更加深入研究汉语言的历史演变,但这在以前的语言统计工作中是缺乏的。该文对唐代以来的文学作品按不同时期进行分类建立语料库,字频分析的结果表明自唐代以来人们使用汉字的习惯处于不断变化之中,时期越相近,汉字的使用习惯就更具一致性。从分布上看,不同时期的字频都可以用一个指数截断的幂律函数进行很好的拟合,随着历史的发展,幂律性质不断衰减而指数性质不断增强。
-
关键词
汉语文学作品
字频分布
指数截断的幂律
-
Keywords
Chinese literature
character frequency distrihutiont exponential truncated power law
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名两汉魏晋南北朝古籍字频统计与分布研究
- 3
-
-
作者
刘根辉
刘金柱
-
机构
华中科技大学人文学院
华中科技大学国学研究院
-
出处
《华中国学》
2020年第1期78-91,共14页
-
基金
华中科技大学中央高校基本科研业务费(2020WKYXZX004)
-
文摘
汉字字频是汉字除形、音、义之外的第四要素。考察历代古籍字频,有助于深入了解汉字的发展演变,同时对研究古代汉语的用字面貌、研究历代社会思想及文化风貌的变迁具有重要意义。本文以两汉魏晋南北朝时期的古籍文献为研究对象,对该时期古籍字频及其分布情况进行统计分析,在一定程度上推动了古籍断代字频研究的进程。本文依据汉语古籍语料库完整性、穷尽性、准确性等建库原则构建了两汉魏晋南北朝古籍语料库。研究发现,该语料库的字频大致符合Zipf分布,且核心字区、一用字区字频分布都很不均匀,其中古籍内容对一用字区的字频分布影响显著。同时,两汉魏晋南北朝的字频分布比先秦均匀一些,先秦古籍字频分布差异化特点更加突出。
-
关键词
古籍字频
两汉魏晋南北朝
字频统计
字频分级
字频分布
-
分类号
G255.1
[文化科学—图书馆学]
K234
[历史地理—中国史]
-