期刊文献+

二字短语凝固度分级考察 被引量:4

On the Agglomeration Degree of Two-Character Phrases
下载PDF
导出
摘要 为解决二字短语扩充词表带来的歧义切分大幅增加问题 ,我们对扩收的二字短语进行了凝固度的分级。我们首先考察验证了已曾提出过的各种标准和方法。考察证明 ,结构类型、“成分字替换率”“前 /后接歧义度”与凝固度密切相关 ,也与接续类型 (A/BC~AB/C)密切相关。其中 ,定中、状中、述宾三类结构以前字为基准的后字替换率有特别价值 ,该频率高的字组多为A/BC型接续 ,其他字组多为AB/C型接续。在此基础上 ,我们提出了二字短语扩充词表的分级方案和具体的分级排歧策略。 This paper attempts to solve the problem of multi ambiguities caused by the enlarged vocabulary of two character phrases (TCP), by means of grading the TCP according to their agglomeration degree. By testing various standards and methods, we find that these three factors——the structure of the phrases, the replacing rate (RR) of component character (CC) and the ambiguous rate by front and back connecting——are not only closely related to the agglomeration degree of two character phrases, but also related to the type of ambiguity (A/BC~AB/C). We also find that the RR of back CC (RR1) to the structures of adnominal N, adverbial V/A and VO are especially useful: these three types of phrases with the high RR1 are mostly of A/BC connecting, whereas the other phrases are of AB/C. Based on this result, we present a grading scheme for the enlarged vocabulary of TCP and give some disambiguation rules relating to the agglomeration degree.
作者 梁源
机构地区 北京大学中文系
出处 《语言文字应用》 CSSCI 北大核心 2000年第2期21-33,共13页 Applied Linguistics
  • 相关文献

参考文献23

  • 1北京大学中文系现代汉语教研室(1993)编.《现代汉语》.商务印书馆1995年.
  • 2陈松岑.《词与非词的界限—语法专家标准与群众语感的异同》.未刊.1998.
  • 3刘月华等(1982).《实用现代汉语语法》.外语教学与研究出版社.1983.
  • 4陆丙甫.《汉语定语的分类及其顺序》[J].华文世界,1989,(5).
  • 5陆志韦(1957).《汉语的构词法》.《陆志韦语言学论文集》(三).中华书局.1990.
  • 6吕叔湘(1959).《吕叔湘文集》(二).商务印书馆.1995.
  • 7吕叔湘(1963).《现代汉语单双音节问题初探》.《吕叔湘文集》(二).商务印书馆.1995.
  • 8吕叔湘(1979).《汉语语法分析问题》.《吕叔湘文集》(二).商务印书馆.1995.
  • 9马庆株.多重定名结构中形容词的类别和次序[J].中国语文,1995(5):357-366. 被引量:48
  • 10宋柔等(1997a).《大规模语料库中词语接续对的统计和分析》.未刊.

共引文献178

同被引文献45

引证文献4

二级引证文献164

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部