-
题名汉语词汇动态属性与变异
- 1
-
-
作者
郑锦全
-
机构
"中研院"人文社会科学研究中心
台湾师范大学华语文教学系暨研究所
-
出处
《语言学论丛》
CSSCI
2017年第2期1-19,共19页
-
文摘
本文区分词语和词汇,词语是个别词,词汇是词语的集合体。过去讨论不同词汇的差异都只能列举词语的异同,无法呈现宏观的词汇特色。以断代词典所收录的字词来比较,也很难看出不同时代词汇的差异。本文考查'中研院'所收集的上古汉语数字资源、近代汉语数字文本、现代汉语平衡语料库、《唐诗三百首》、《宋词三百首》、北京大学标记的《人民日报》1998年新闻稿以及台湾通讯社1991—2002年所发布的新闻文字,论述词语成千上万,须要提炼出有意义的词汇特色来区别词汇异同。区别的关键在于词语的使用而不在于词语的有无,词语使用表现在语流或文本中。因此,本文所提出的词汇属性称为词汇动态属性。在语流中词语出现次数高低可以排序,从排序中可以从最高词频往下累积,得出词频在全部词语数目中的百分比。我们以词频统计中最高的15个词语的词频累积百分比作为高频词集中度,以高频词集中度当作词汇动态特性。从文本计算出来的词汇动态特性能清楚划分出所考查的古代、近代、现代、诗词和新闻稿的词汇属性。希望这个计量性质的词汇属性对今后的词汇研究有些助益。
-
关键词
词语与词汇
词汇动态特性
词频累积百分比
高频词集中度
-
Keywords
word and lexicon
lexical dynamic attribute
cumulative frequency percentage
concentration level of high frequency words
-
分类号
H13
[语言文字—汉语]
-