基于规则的大规模试卷文本语块识别方法的研究被引量：4

Study of massive paper texts chunking based on rules

下载PDF

导出

摘要提出了一种基于规则的试卷文本语块识别方法,有效解决了试题库中大规模试题数据的初始化问题。通过定义文本语块识别规则,构建自动机识别模型,在理论上描述了试卷文本的识别过程。实验表明,该模型具有良好的性能,在此基础上,实现了一个原型系统,通过具体的应用实例验证了该方法的可行性和有效性。 To solve the initiating of massive examination questions in database efficiently, proposed a paper texts chunking method based on rules. Defining recognition rules of paper texts and constructing automata recognition model, described the recognition processing of paper texts theoretically. Experiment results show that this model has better performance. By these works, implemented a prototype system, and verified its feasibility and effectiveness by a practical application.

作者郭凯红李文立

机构地区大连理工大学管理学院辽宁大学信息学院

出处《计算机应用研究》 CSCD 北大核心 2009年第4期1391-1393,1401,共4页 Application Research of Computers

基金国家自然科学基金资助项目(70572099) 辽宁省自然科学基金资助项目(1050349)

关键词规则语块试卷文本识别模型 rules chunk examination paper texts recognition model

分类号 TP391.43 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1ABNEY S P. Parsing by chunks [ M]//BERWICK R, ABNEY S, TENNY C, et al. Principle-based parsing. Dordercht: Kluwer Academic Publishers, 1991:257- 278.
2SANG E F T K, BUCHHOLZ S. Introduction to the CoNLL-2000 shared task: chunking[ C]//Proc of the 2nd Workshop on Learning Language in Logic. Morristown: Association for Computational Linguistics, 2000 : 127-132.
3孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学,2000,2(2):74-83. 被引量：38
4ARGAMON S, DAGAN I, KRYMOLOWSKI Y. A memory-based approach to learning shallow natural language patterns [ C ]//Proc of the 36th Annua Meeting of the Association for Computational Linguistics. Morristown: Association for Computational Linguistics, 1998: 67-73.
5ZHANG Tong, DAMERAU F, JOHNSON D. Text chunking based on a generalization of winnow[ J ]. Journal of Machine Learning Research, 2002,2:615-637.
6周强,孙茂松,黄昌宁.汉语句子的组块分析体系[J].计算机学报,1999,22(11):1158-1165. 被引量：31
7梁颖红,赵铁军,刘博,杨沐昀.基于关联度评价的中心词扩展的英文文本语块识别[J].计算机研究与发展,2006,43(1):153-158. 被引量：3
8梁颖红,赵铁军,于浩,姚健民,徐冰.基于改进K-均值聚类的汉语语块识别[J].哈尔滨工业大学学报,2007,39(7):1106-1109. 被引量：4
9魏玮,杜金华,徐波.基于分层语块分析的统计翻译研究[J].中文信息学报,2007,21(5):87-90. 被引量：7
10秦玉平,王秀坤,艾青,刘卫江.多主题文本分类的实现算法[J].计算机工程,2008,34(2):190-192. 被引量：5

二级参考文献95

1陈永府,杨小献,陈立平,朱林.面向决策支持的数据重构技术[J].计算机辅助设计与图形学学报,2004,16(6):831-837. 被引量：3
2孙晋文,肖建国.基于SVM的中文文本分类反馈学习技术的研究[J].控制与决策,2004,19(8):927-930. 被引量：16
3高昊江,张宜生,刘凡,梁书云.面向Web服务的企业信息系统集成开发技术研究与应用[J].计算机工程与科学,2004,26(6):105-109. 被引量：21
4徐小平.面向组件的商务决策分析系统的设计与实现[J].计算机工程与科学,2004,26(9):70-74. 被引量：2
5张大斌,张德喜,吕少鹏.电信企业信息化中决策支持系统的构建[J].计算机工程与设计,2005,26(7):1815-1818. 被引量：4
6邹志文,朱金伟.数据挖掘算法研究与综述[J].计算机工程与设计,2005,26(9):2304-2307. 被引量：52
7张翔,肖小玲,徐光祐.基于样本之间紧密度的模糊支持向量机方法[J].软件学报,2006,17(5):951-958. 被引量：84
8周强,俞士汶.汉语短语标注标记集的确定[J].中文信息学报,1996,10(4):1-11. 被引量：35
9周强.一个汉语短语自动界定模型[J].软件学报,1996,7(A00):315-322. 被引量：9
10S.Abney.Parsing by chunks.In:Principle Based Parsing.CA:Kluwer Academic Publishers,1991.

共引文献82

1谌志群,张国煊.基于浅层文本分析的中文Web信息检索[J].杭州电子科技大学学报（自然科学版）,2008,28(1):48-51. 被引量：1
2刘云,俞士汶.“句管控”与中文信息处理[J].汉语学报,2004(2):56-62. 被引量：5
3罗三定,廖程锋.一种新的搜索引擎探讨[J].情报学报,2004,23(4):428-432. 被引量：2
4程葳,赵军,刘非凡,徐波.面向口语翻译的双语语块自动识别[J].计算机学报,2004,27(8):1016-1020. 被引量：3
5许云,樊孝忠,张锋.基于生成语法的英语时态判断[J].计算机工程与应用,2004,40(26):226-228. 被引量：3
6谭咏梅,姚天顺,陈晴,李珩,朱靖波.基于SVM+Sigmoid的汉语组块识别[J].计算机科学,2004,31(8):142-146. 被引量：3
7干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23. 被引量：14
8余正涛,樊孝忠.基于最大熵模型的汉语问句语义组块分析[J].计算机工程,2005,31(17):3-5. 被引量：5
9XU Shiyong,PENG Danling,JIN Zhen,LIU Hongyan,YANG Jie.Personality and neurochemicals in the human brain:A preliminary study using^(1)H MRS[J].Chinese Science Bulletin,2005,50(20):2318-2322.
10孙广范,宋金平,袁琦.基于混合策略的汉英双向机器翻译系统的设计[J].中文信息学报,2006,20(B03):25-30. 被引量：2

同被引文献42

1莫礼平,张兆海.VB中基于ADO的数据库访问方法[J].电脑开发与应用,2004,17(6):33-34. 被引量：11
2任慧龙,谷富生,张雪梅.浅析地面气象数据的质量控制[J].山西气象,2004(3):45-46. 被引量：5
3任芝花,刘小宁,杨文霞.极端异常气象资料的综合性质量控制与分析[J].气象学报,2005,63(4):526-533. 被引量：62
4郝晓弘,李应启,刘树博.小型工业监控软件的实时数据库设计与实现[J].计算机应用研究,2006,23(9):198-200. 被引量：6
5王丽芳,蒋泽军,庄亮,曾杰.基于ADO.NET的O/R Mapping中间件的研究[J].西北工业大学学报,2006,24(6):759-762. 被引量：5
6杨启亮,邢建春,王平.面向SQL Server的OPC Client开发[J].计算机应用与软件,2007,24(2):95-97. 被引量：4
7谢川.基于B/S/S的异构数据源集成系统设计[J].计算机应用,2007,27(2):436-437. 被引量：11
8香港天文台.船舶天气报告电码[EB/OL].http://www.weather.gov.hk/wserviee/tsheet/pms/shipcode_c,htm,2003-05-04.
9WMO. WMO publication No. 306: Manual on codes [ EB/OL]. [ 2010-09-16 ]. http :///www. wmo. int/pages/ prog/www/WMOCodes/ManualCodes. html.
10Lott N, Baldwin R, Jones P. The FCC integrated surface hourly database: A new resource of global climate data[M]. National Climatic Data Center Technical Report No. 2001 (01). Asheville: National Climatic Data Center,2001.

引证文献4

1刘智浓.航空兵部队航理智能组卷系统设计[J].计算机工程与设计,2010,31(19):4329-4331. 被引量：2
2王兴,朱定真,苗春生.基于规则引擎的多元大气信息数据质量检查方法[J].南京信息工程大学学报（自然科学版）,2011,3(3):238-243. 被引量：4
3覃延,李冬梅,陈志泊.基于支持向量机的大规模试卷识别方法[J].西南大学学报（自然科学版）,2014,36(6):180-185. 被引量：1
4季峰.火灾事故文本中的信息抽取[J].青海师范大学学报（自然科学版）,2020,36(3):14-21.

二级引证文献7

1肖理庆,徐晓菊.改进遗传算法智能组卷研究[J].计算机工程与设计,2012,33(10):3970-3974. 被引量：7
2许永达.基于线程池的高并发访问考试系统设计[J].计算机与现代化,2013(3):232-234. 被引量：8
3杨家芳,赖冬林,张丰,杜震洪,刘仁义.基于规则引擎的土地数据质量检查方法[J].国土资源科技管理,2015,32(2):94-99. 被引量：5
4马莉娜,张倩.基于支持向量机的新能源上市公司绩效评价[J].重庆理工大学学报（自然科学）,2016,30(1):54-62.
5段慧芬,伍辉华,张德华,李磊.规则引擎在指挥显示系统中的应用[J].兵工自动化,2017,36(8):80-83. 被引量：4
6张肖霞,杜平,陈杭,鲁玉佳,张金区.基于约束规则的科技基础性数据质量审查模型研究与实现[J].中国科技资源导刊,2017,49(5):60-67. 被引量：2
7崔岩.规则引擎在列控产品配置数据验证中的应用[J].铁路通信信号工程技术,2020,17(7):29-34. 被引量：2

1陈丽燕,祝建中.基于Word文档的试题库系统的实现[J].信息技术,2005,29(9):143-145. 被引量：7
2梁颖红,曹军,赵铁军.真实语料下基于多Agent的分布式英语语块识别[J].计算机工程与应用,2008,44(28):22-24.
3梁颖红,曹军.文本语块识别典型方法的比较与分析[J].计算机技术与发展,2008,18(11):76-79. 被引量：2
4张锦,林加论,陈明锐.医学主干课程在线测试系统的设计与实现[J].硅谷,2009,2(13):63-65.
5黄莉.基于构式语块的句子相似度计算[J].计算机与数字工程,2014,42(1):9-13.
6甘泉,傅继阳.基于ASP的试题库系统的设计与实现[J].暨南大学学报（自然科学与医学版）,2005,26(5):622-625. 被引量：3
7莫怡文,姬东鸿,黄江平.基于条件随机场的顿号边界识别[J].计算机应用,2015,35(10):2838-2842. 被引量：2
8孙超,张仰森.利用浅层句法分析提取特征的词义消歧[J].计算机工程与设计,2010,31(21):4704-4707.
9梁颖红,赵铁军,刘博,杨沐昀.基于关联度评价的中心词扩展的英文文本语块识别[J].计算机研究与发展,2006,43(1):153-158. 被引量：3
10曾国辉,张秀彬,胡朝晖.XML与Database的连接方法[J].微型电脑应用,2003,19(6):57-60. 被引量：1

计算机应用研究

2009年第4期

浏览历史

内容加载中请稍等...

基于规则的大规模试卷文本语块识别方法的研究被引量：4

参考文献14

二级参考文献95

共引文献82

同被引文献42

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于规则的大规模试卷文本语块识别方法的研究 被引量：4

参考文献14

二级参考文献95

共引文献82

同被引文献42

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于规则的大规模试卷文本语块识别方法的研究被引量：4