汉语词性自动标注系统的设计与实现被引量：4

The Design and Implementation of the Chinese Part-of-speech Automatic Tagging System

下载PDF

导出

摘要介绍了汉语词性自动标注系统的设计与实现．该系统实现了统计与规则相结合的方法进行汉语词性自动标注．描述了该系统的总体结构，以及所使用的非兼类词表、兼类词表、标记集和词性标注规则的组织，特别对稀疏矩阵及其存储方法进行了详细的介绍。 In this paper, the Chinese part-of-speech automatic tagging system is presented, which has implemented statistics-based and rulebased tagging methods, introduced its whole structure and organized a series of word tables such as the ambiguous word table, nonambiguous word table, tag-set and POS tagging rules. Especially, the processing and storing methods of sparse matrix arc described in more detail.

作者王素格张永奎

机构地区山西大学计算机科学系

出处《计算机工程》 CAS CSCD 北大核心 2001年第3期7-8,65,共3页 Computer Engineering

基金国家自然科学基金项目(69575011) 国家863项目(863-306-ZT03-03-1) 山西省自然科学基金项目(99

关键词汉语词性自动标注系统自然语言理解语料库神经网络设计 Part-of-speech automatic tagging Word table Corpus Rough set Collocation mode Statistic model

分类号 TB391.12 [一般工业技术—材料科学与工程]

引文网络
相关文献

参考文献9

1刘开瑛陈肇雄.语料库词类自动标注算法研究.机器翻译研究进展[M].北京:电子工业出版社,1992.378-386.
2王素格张永奎.汉语词性标注中兼类词排歧算法探讨.计算语言学文集[M].北京:清华大学出版社,1999,11.162-166.
3王素格.汉语词性标注知识获取方法研究：硕士学位论文[M].太原:山西大学,2000..
4王素格，硕士学位论文，2000年
5刘开瑛，中文文本自动分词和标注，2000年
6王素格，基于Rough Set自动获取词性标注规则初探，1999年，469页
7王素格，计算语言学文集，1999年，162页
8Ma Qing，Proc 1998 Int Conference on Chinese Information Processing，1998年，200页
9刘开瑛，机器翻译研究进展，1992年，378页

共引文献1

1王素格,张永奎.汉语词性标注排歧方法探讨[J].计算机工程与应用,2001,37(7):70-72. 被引量：7

同被引文献20

1苏祺,昝红英,胡景贺,项锟.词性标注对信息检索系统性能的影响[J].中文信息学报,2005,19(2):58-65. 被引量：8
2周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量：43
3洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
4Christopher D Manning,Hinrich Schutze,苑春法等(译).统计自然语言处理基础[M].电子工业出版社,2005.01.
5付国宏.HMM和对数线性模型相结合的汉语词性标注[D].哈尔滨:哈尔滨工业大学计算机科学与技术学报,2001.
6王挺,陈火旺,杨谊,史晓东.一种自适应词性标注方法[J].软件学报,1997,8(12):937-943. 被引量：8
7王广正,王喜凤.一种基于规则优先级的词性标注方法[J].安徽工业大学学报（自然科学版）,2008,25(4):426-429. 被引量：4
8王丽杰,车万翔,刘挺.基于SVMTool的中文词性标注[J].中文信息学报,2009,23(4):16-21. 被引量：17
9魏欧,吴健,孙玉芳,sonata.iscas.ac.cn.基于统计的汉语词性标注方法的分析与改进[J].软件学报,2000,11(4):473-480. 被引量：31
10俞士汶,朱学锋,段慧明.大规模现代汉语标注语料库的加工规范[J].中文信息学报,2000,14(6):58-64. 被引量：30

引证文献4

1王朝静,郑庆华.面向答疑文本的词类标注方法的研究与实现[J].计算机工程与应用,2004,40(16):57-60. 被引量：2
2张卫.词性标注系统的设计与实现[J].情报杂志,2008,27(11):81-82. 被引量：1
3谢逸,饶文碧,段鹏飞,陈振东.基于CNN和LSTM混合模型的中文词性标注[J].武汉大学学报（理学版）,2017,63(3):246-250. 被引量：20
4马小雯,袁满,刘彦林,李臻,李慧杰.面向标准文本的词性标注集设计[J].信息技术与标准化,2022(10):36-42.

二级引证文献23

1江有福,袁繁华,郑庆华.自然语言网络答疑系统中倒排索引技术的研究与实现[J].浙江海洋学院学报（自然科学版）,2005,24(4):353-358.
2江有福,郑庆华.自然语言网络答疑系统中倒排索引技术的研究[J].计算机技术与发展,2006,16(2):126-128. 被引量：1
3顾磊,赵阳.古籍数字化标注资源建设的意义及其现状分析[J].图书馆学研究,2016(4):49-52. 被引量：4
4孙娟娟,于红,冯艳红,彭松,程名,卢晓黎,董婉婷,崔榛.基于深度学习的渔业领域命名实体识别[J].大连海洋大学学报,2018,33(2):265-269. 被引量：24
5宁凌.一种基于深度学习的PDM文档自动审核算法[J].计算机与网络,2018,44(10):57-58. 被引量：1
6徐飞,叶文豪,宋英华.基于BiLSTM-CRF模型的食品安全事件词性自动标注研究[J].情报学报,2018,37(12):1204-1211. 被引量：14
7曹湘,李誉坤,钱叶,闫晨阳,杨忠光.基于混合神经网络的电力短文本分类方法研究[J].计算机与数字工程,2019,47(5):1145-1150. 被引量：6
8刘月,翟东海,任庆宁.基于注意力CNLSTM模型的新闻文本分类[J].计算机工程,2019,45(7):303-308. 被引量：20
9金忠星,李东.消费者偏好预测的深度学习神经网络模型[J].计算机应用,2019,39(7):1888-1893. 被引量：3
10马正奇,呼嘉明,龙铭,陈新.运用CNN-LSTM混合模型的短文本分类[J].空军预警学院学报,2019,33(4):295-297. 被引量：3

1梁朝虎,尚久浩,王德忠.包装纸盒CAD中尺寸的自动标注[J].包装工程,2000,21(3):38-40. 被引量：2
2蒋晓,唐永志.Pro/E工程图模块中专用符号自动标注的实现[J].包装工程,2003,24(2):51-52. 被引量：3
3Viroj Wiwanitkit.Ultrasound measurement of the corpus callosum and neural development[J].Neural Regeneration Research,2014,9(3):336-336.
4刘庆丰,易茗.谈谈数码照片的存储方法——兼评对数码存储的一些错误认识[J].摄影与摄像,2004(2):12-12.
5罗时飞,刘晓婷.工程图技术要求自动生成工具的设计与实现[J].工程图学学报,2001,22(4):13-18. 被引量：1
6文丽,张传伟,郭卫.用VB6实现AutoCAD中表面粗糙度的自动标注[J].计算机辅助设计与制造,2000(9):21-23. 被引量：1
7液体中的纳米粒子可用于存储信息[J].功能材料信息,2014,11(4):57-57.
8张霄军,张凌岚.基于XML的Web中文文本挖掘系统设计[J].术语标准化与信息技术,2004(3):31-35. 被引量：3
9孔永强,王伯平,袁文旭,都丽娜.尺寸公差的计算机辅助查询与标注[J].机械管理开发,2009,24(6):185-186. 被引量：1
10查德根,沈景风,黄宗益.计算机自动标注焊接符号的实现[J].工程机械,1998,29(9):34-35. 被引量：2

计算机工程

2001年第3期

浏览历史

内容加载中请稍等...

汉语词性自动标注系统的设计与实现被引量：4

参考文献9

共引文献1

同被引文献20

引证文献4

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

汉语词性自动标注系统的设计与实现 被引量：4

参考文献9

共引文献1

同被引文献20

引证文献4

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

汉语词性自动标注系统的设计与实现被引量：4