期刊文献+

用数据采掘方法获取汉语词性标注规则 被引量:10

A DATA MINING METHOD TO ACQUIRE PART OF SPEECH RULES IN CHINESE TEXT
下载PDF
导出
摘要 从数据采掘的角度对汉语文本词性标注规则的获取进行研究 .在满足用户规定的支持度向量的前提下 ,先从候选集模式中挑选出常用模式 ;然后采掘出具有高可信度的产生式规则 .该过程完全是自动的 ,而获取的规则在表达上是明确的 ,同时又是隐含在数据中的、用户不易发现的 .实验表明 :在原有统计方法的基础上 ,利用自动获得的标注规则作为补充 ,可以提高词性标注的正确率 . A data mining method to acquire part of speech rules in Chinese text is presented. Given an array of support degree, it selects frequent pattern from candidate pattern set. Then it extracts a set of production rules that have high confidence degree. The process is automatic. The rules acquired are clear, but implicit in data set and previously unknown by users. The experiment shows a system that incorporates statistic method with rule method has better performance.
出处 《计算机研究与发展》 EI CSCD 北大核心 2000年第12期1409-1414,共6页 Journal of Computer Research and Development
基金 国家自然科学基金资助!(项目编号 6 980 30 10 )
关键词 数据采掘 中文信息处理 汉语词性标注规则 part of speech, tagging of Chinese corpus, data mining, association rul,
  • 相关文献

参考文献8

  • 1白拴虎.基于统计的汉语语料库词性自动标注的研究与实现[M].北京:清华大学,1992..
  • 2刘开瑛 陈肇雄 等.语料库词类自动标注算法研究[M].北京:电子工业出版社,1992.378-386.
  • 3温锁林.中文文本兼类词的标注技术.中文信息算是国际会议论文集[M].北京,1998..
  • 4温锁林,中文信息处理国际会议论文集,1998年
  • 5Park J S,Proc of ACM SIGMOD.San Jose,1995年,175页
  • 6Liu S,Computer Processing Chinese Oriental Languages,1995年,9卷,1期,31页
  • 7刘开瑛,机器翻译研究进展,1992年,378页
  • 8白拴虎,硕士学位论文,1992年

共引文献1

同被引文献36

引证文献10

二级引证文献116

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部