基于规则的中文时间词和数词的自动识别算法被引量：2

Chinese Time Words and Numerals Automatic Segmentation Method Based on Rules

下载PDF

导出

摘要对中文时间词和数词在文本中的常见形式进行归纳,以此为基础构建用于识别时间词、数词的规则集,提出一个基于规则的时间词和数词自动识别算法,并对该算法在竞争情报分析领域和机器翻译领域中的应用价值进行论述。 This paper firstly generalizes the formats of Chinese time words and numerals appearing in the text. Based on them, this paper then sets up a rule sets for recognition, proposes a method about Chinese time words and numnerals based on rules and discusses its application value in competitive intelligence analysis as well as machine translation field at last.

作者高霄云杨建林

机构地区南京大学信息管理系

出处《现代图书情报技术》 CSSCI 北大核心 2007年第3期46-50,共5页 New Technology of Library and Information Service

关键词词语切分信息抽取规则 Word segmentation Information extraction Rule

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1余战秋.中文分词技术及其应用初探[J].电脑知识与技术（认证考试）,2004(11M):81-83. 被引量：11
2孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101
3温有奎,温浩,徐端颐,潘龙法.基于知识元的文本知识标引[J].情报学报,2006,25(3):282-288. 被引量：65
4Regina Barzilay, Noemie Elhadad, and Kathleen R. McKeown. Sentence Ordering in Multidocument Summarization. In: Proceedings of the 1 st Human Language Technology Conference. San Diego, California, 2001
5孙广范,宋金平,袁琦.机器翻译中规则和模板的协调方法研究[J].中文信息学报,2006,20(B03):31-35. 被引量：3
6张江.基于规则的分词方法[J].计算机与现代化,2005(4):18-20. 被引量：14
7郑泽之,张普,杨建国.基于语料库的字母词语自动提取研究[J].中文信息学报,2005,19(2):78-85. 被引量：10

二级参考文献88

1孙茂松.谈谈汉语分词语料库的一致性问题[J].语言文字应用,1999(2):90-93. 被引量：20
2孙茂松,张磊.人机并存,“质”“量”合一—谈谈制定信息处理用汉语词表的策略[J].语言文字应用,1997(1):81-88. 被引量：7
3黄居仁,陈克健,陈凤仪,魏文真,张丽丽.《资讯处理用中文分词规范》设计理念及规范内容[J].语言文字应用,1997(1):94-102. 被引量：6
4刘开瑛.现代汉语自动分词评测技术研究[J].语言文字应用,1997(1):103-108. 被引量：15
5董振东.汉语分词研究漫谈[J].语言文字应用,1997(1):109-114. 被引量：11
6孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量：45
7刘涌泉.关于汉语字母词的问题[J].语言文字应用,2002(1):85-90. 被引量：220
8徐秉铮,詹剑,贺前华.基于神经网络的分词方法[J].中文信息学报,1993,7(2):36-44. 被引量：15
9刘植惠.两种新型的情报产品──《超级杂志》和《科学地图册》[J].情报理论与实践,1994,17(6):47-48. 被引量：6
10孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：87

共引文献196

1李斌,袁义国,芦靖雅,冯敏萱,许超,曲维光,王东波.第一届古代汉语分词和词性标注国际评测[J].中文信息学报,2023,37(3):46-53. 被引量：4
2吴欢,应俊,王逸飞,胡华宇,徐洪丽,郑一琼.乳腺癌病理文本的结构化信息提取[J].解放军医学院学报,2020,41(7):746-751. 被引量：9
3翟晓华,孙炜,张路金.多站点信息发布平台的全文检索技术[J].微计算机信息,2008,24(9):165-167. 被引量：1
4张泉,曾国荪,王伟,孙明军,谷华楠.基于改进的模糊C-均值聚类的信任文摘[J].计算机研究与发展,2008,45(z1):268-273. 被引量：2
5郑炜冬.多种方法融合的中文自动分词系统的设计与实现[J].韩山师范学院学报,2009,30(6):37-43.
6王军辉.汉语自动分词研究进展[J].魅力中国,2009(30):333-333.
7洪虹,李波.汉语自动分词研究进展[J].魅力中国,2009,0(22):114-114.
8陈小荷.中文信息处理概述[J].南京师范大学文学院学报,2002(1):171-176. 被引量：8
9黄建中,王肖雷.Katz平滑算法在中文分词系统中的应用[J].计算机工程,2004,30(B12):371-372. 被引量：5
10陈耀东,王挺.基于有向图的双向匹配分词算法及实现[J].计算机应用,2005,25(6):1442-1444. 被引量：7

同被引文献21

1李君婵,谭红叶,王风娥.中文时间表达式及类型识别[J].计算机科学,2012,39(S3):191-194. 被引量：9
2车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：63
3李向阳,苗壮,肖江.无结构文本信息抽取综述[J].军事通信技术,2004,25(2):31-36. 被引量：3
4贺瑞芳,秦兵,刘挺,潘越群,李生.基于依存分析和错误驱动的中文时间表达式识别[J].中文信息学报,2007,21(5):36-40. 被引量：21
5Zhang Y M, Zhou J F. A Trainable Method for Extracting Chinese Entity Names and Their Relations. In:Proceedings of the Second Chinese Language Processing Workshop, Hong Kong,2000.
6Barzilay R, Lee L. Catching the Drift: Probabilistic Content Models. with Application to Generation and Summarization, HLT - NAACL 2004:113 - 120.
7菅小艳，郑家恒.基于HMM的农作物信息抽取:自然语言理解与大规模内容计算.,2005(10).25—28.
8Sigz．垂直搜索引擎技术．http：／／www．fullsearcher．com／n20051112144420735．asp(Accessed Sept．10,2006).
9Available at http://crfpp.googlecode.com/svn/trunk/doc/index.html.
10Mingli Wu,Wenjie Li,Qin Lu,et al.A Chinese Temporal Parser for Extracting And Normalizing Temporal Information[C] //Proceedings of international Joint Conference on Natural Language Processing (IJC-NLP),2005(3651):694-706.

引证文献2

1廉站俊,吕学强,张玉杰,施水才.基于句子相似度计算的信息抽取[J].现代图书情报技术,2007(6):38-41. 被引量：4
2吴琼,黄德根.基于条件随机场与时间词库的中文时间表达式识别[J].中文信息学报,2014,28(6):169-174. 被引量：11

二级引证文献15

1化柏林.基于句子匹配的文章自写度测评系统[J].现代图书情报技术,2007(11):40-44. 被引量：2
2何维,王宇.基于句子关系图的网页文本主题句抽取[J].现代图书情报技术,2009(3):57-61. 被引量：9
3蒲海霞,李佳田,李锐,何育枫,王华.非结构化文本数据的GIS描述性查询方法[J].计算机应用,2012,32(9):2483-2487. 被引量：1
4贾遂民,张玉,张腾飞.一种基于介词用法的灾难事件信息抽取方法[J].计算机与现代化,2015(7):116-119. 被引量：3
5张义,李治江.基于高斯词长特征的中文分词方法[J].中文信息学报,2016,30(5):89-93. 被引量：3
6王晓玉,李斌.基于CRFs和词典信息的中古汉语自动分词[J].数据分析与知识发现,2017,1(5):62-70. 被引量：24
7孙健,高大启,刘珉,高炬,阮彤.中文电子病历文本中的时间识别算法研究[J].山西大学学报（自然科学版）,2018,41(1):15-22. 被引量：2
8马雷雷,李宏伟,魏勇,梁汝鹏,龚竞.基于规则的中文文本时间表达式识别和规范化方法[J].信息工程大学学报,2017,18(5):560-565. 被引量：8
9贾圣宾,向阳.面向智能服务系统的时间语义理解[J].计算机应用,2018,38(3):620-625.
10宋燕.基于词网的主观题自动评阅算法的研究[J].电脑知识与技术（过刊）,2014,20(10X):6827-6830.

1撰稿体例[J].社会,2012,32(3):241-241.
2乌小茜,王千龙,马星.浅析计算机网络安全[J].网络与信息,2009(5):49-49. 被引量：5
3陈忠菊.关于加强无线网络的信息安全的方法探究[J].科技创新导报,2015,12(5):222-222. 被引量：4
4禹安胜,金铁,杨涛.网络钓鱼攻击的威胁及防范[J].计算机安全,2010(10):100-101. 被引量：5
5梁碧婵.计算机网络安全及防范[J].才智,2011,0(19):64-64. 被引量：1
6刘华.文本分类C#实现[J].现代图书情报技术,2007(3):43-45.
7林盛,金培权,赵旭剑,岳丽华.时间感知的Web搜索研究[J].计算机学报,2015,38(11):2163-2171. 被引量：3
8朱岩,陈培颖,欧彦,葛世超,张哲.英文科技期刊中的数字表达[J].编辑学报,2016,28(1):37-38. 被引量：3
9新一代智能搜索引擎──网典[J].网络与信息,1999,13(2):21-21. 被引量：2
10朱潜,吴辰铌,朱志良,刘洪娟.Hadoop云平台下Nutch中文分词的研究与实现[J].小型微型计算机系统,2013,34(12):2772-2776. 被引量：5

现代图书情报技术

2007年第3期

浏览历史

内容加载中请稍等...

基于规则的中文时间词和数词的自动识别算法被引量：2

参考文献7

二级参考文献88

共引文献196

同被引文献21

引证文献2

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于规则的中文时间词和数词的自动识别算法 被引量：2

参考文献7

二级参考文献88

共引文献196

同被引文献21

引证文献2

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于规则的中文时间词和数词的自动识别算法被引量：2