基于大规模真实文本的数值知识元挖掘研究被引量：19

Numeric knowledge element mining based on large-scale realistic corpora

下载PDF

导出

摘要探讨了从海量文献中挖掘知识元的背景,并详述了从海量年鉴文本中抽取宏观数值知识元的基本流程和各主要环节的算法,并重点对数值知识元主体抽取的效果进行了分析,实验结果表明在特定领域内知识元挖掘要达到实用水平是可行的。 This paper discusses the necessity of the knowledge element mining,then describes in detail the base process and algorithms of main steps of extraction numeric knowledge elements from China yearbook full-text database,and then specially analyzes the extraction quality.

作者肖洪薛德军

机构地区中国学术期刊(光盘版)电子杂志社

出处《计算机工程与应用》 CSCD 北大核心 2008年第30期150-152,222,共4页 Computer Engineering and Applications

关键词真实文本文本挖掘数值知识元自动编辑 realistic corpora text mining numeric knowledge element automated editing

分类号 TP398.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1常青.文本挖掘挖掘知识[J].中国计算机用户,2004(24):49-50. 被引量：10
2Etzioni O,Cafarella M,Downey D.Web-scale information extraction in knowItAll(premaliminary results)[C]//Proceedings of the 13th International Conference on World Wide Web(WWW2004),New York, 2004.
3Banko M,Cafarella,M J.Open information extraction from the Web[C]// Proceedings of the 20th International Joint Conferences on Artificial Intelligence,2007.
4Pasca M,de Kang Lin.Organizing and searching the World Wide Web of facts-step one:the one-million fact extraetion challenge[C]// Proeeedings of the 21st National Conferenee on Artificial Intelligence, 2006.
5Pasta M,de Kang Lin.Names and similarities on the Web:fast extraction in the fast lane[C]//Processings of the 21st International Conference on Computational Linguistics and 44th Annual Meeting of the ACL, Sydney,2006 : 809-816.
6Google-onebox-搜索引擎周边[EB/OL].[2007-10-22].http://www.eryi.org/catalog.asp?tags=google-onebox.
7中国年鉴全文数据库[EB/OL].[2007-09-22].http://www.cnki.net/logirdautonavi.aspx?id=7.
8周雪忠,吴朝晖.文本知识发现:基于信息抽取的文本挖掘[J].计算机科学,2003,30(1):63-66. 被引量：32
9马颂德,王珏.智能信息处理与知识挖掘[J].世界科技研究与发展,1999,21(6):16-23. 被引量：7

二级参考文献3

1D．Marr 姚国正等（译）.视觉计算理论[M].科学出版社,1988..
2F．Capra 朱润生等（译）.物理学之道，近代物理学与东方神秘主义[M].北京:北京出版社,1999..
3Corinna Cortes,Vladimir Vapnik. Support-Vector Networks[J] 1995,Machine Learning(3):273～297

共引文献46

1何文才,张琼,余菲,都婧,焦黎冰.基于树状SVM的网页分类与信息安全过滤系统研究[J].网络安全技术与应用,2008(8):27-29.
2鹿小明.文本挖掘及其在信息检索中的应用[J].情报资料工作,2004,25(6):26-28. 被引量：10
3曹霞,孙成权.数字图书馆与知识创新[J].图书与情报,2004(6):90-93. 被引量：6
4施晓华,黄冀.信息检索新技术[J].中国信息导报,2005(3):47-49. 被引量：1
5施晓华,黄骥.信息检索新技术应用[J].情报科学,2005,23(8):1225-1228. 被引量：9
6倪现君.文本挖掘在Web中的技术分析[J].中国科技信息,2006(03A):23-23. 被引量：1
7陈浩声,李安,胡柏青.多层分类算法在维修信息挖掘中的应用[J].微计算机应用,2006,27(2):195-198.
8封春升,郝爱民.基于模式匹配的自然语言识别[J].计算机工程与应用,2006,42(19):144-146. 被引量：8
9马金娜,田大钢.基于SVM的中文文本自动分类研究[J].计算机与现代化,2006(8):5-8. 被引量：8
10马金娜,田大钢.基于支持向量机的中文文本自动分类研究[J].系统工程与电子技术,2007,29(3):475-478. 被引量：14

同被引文献216

1邓小英,王凤兰.《针灸甲乙经》数字化整理研究初探[J].陕西中医,2008,29(7):857-859. 被引量：2
2徐如镜.开发知识资源发展知识产业服务知识经济[J].现代图书情报技术,2002(S1):4-6. 被引量：18
3赵红洲.论科学结构[J].中州学刊,1981(3):59-65. 被引量：11
4石梅,周建屏.文献信息场论[J].新世纪图书馆,1988(Z1):20-24. 被引量：1
5赵红洲,蒋国华.知识单元与指数规律[J].科学学与科学技术管理,1984,5(9):39-41. 被引量：61
6曹罗生.Internet浏览翻译系统数字与数词表达形式的识别技术[J].佛山科学技术学院学报（自然科学版）,2004,22(3):31-34. 被引量：1
7温有奎.计算机检索中的情报取样与滤波分析[J].情报学报,1993,12(1):61-68. 被引量：2
8温有奎,徐端颐,潘龙法.基于XML平台的知识元本体推理[J].情报学报,2004,23(6):643-648. 被引量：20
9温有奎.基于“知识元”的知识组织与检索[J].计算机工程与应用,2005,41(1):55-57. 被引量：74
10田春虎.国内语义Web研究综述[J].情报学报,2005,24(2):243-249. 被引量：37

引证文献19

1聂文杰,莫迪,黄邦锐,刘海,郝天永.基于位置特征和句法依存树的可度量数量信息抽取模型[J].计算机系统应用,2022,31(10):279-287.
2王洪建.中小学知识元学习平台设计与建设[J].中小学电教（综合）,2009(9):64-66. 被引量：2
3汤华波,颜慧超,王钊.知识管理系统工作平台开发[J].软件导刊,2010,9(12):92-94. 被引量：3
4杨建林.知识表示与知识相关性度量研究[J].情报理论与实践,2011,34(5):1-5. 被引量：5
5丁侃,柳长华.国内知识元相关研究现状[J].数字图书馆论坛,2011(12):72-78. 被引量：4
6刘畅,尚航标.森工企业应急管理:面向突发事件的知识元链接技术[J].林业经济,2013(7):112-115.
7吴超,郑彦宁,化柏林.数值信息抽取研究进展综述[J].中国图书馆学报,2014,40(2):107-119. 被引量：10
8张娟,陈人语.语义网背景下基于单元信息的知识组织框架研究[J].国家图书馆学刊,2018,27(6):54-59. 被引量：5
9高国伟,王亚杰,李永先.知识元表示方法研究[J].现代情报,2015,35(3):15-18. 被引量：8
10毕崇武,王忠义,宋红文.基于知识元的数字图书馆多粒度集成知识服务研究[J].图书情报工作,2017,61(4):115-122. 被引量：51

二级引证文献121

1聂文杰,莫迪,黄邦锐,刘海,郝天永.基于位置特征和句法依存树的可度量数量信息抽取模型[J].计算机系统应用,2022,31(10):279-287.
2王铮,黄子洛,刘心锐,胡一涵,向敬宣.互联网新型知识付费平台的信息构建——以音频类知识服务平台为例[J].知识管理论坛,2022(6):626-637.
3徐霞军,秦绪涛,杨强,朱云飞.大数据技术在核电设备缺陷分析中的初步应用[J].核动力工程,2020,41(S01):68-72. 被引量：5
4周敏.言语生存论视野下“知识元”型母语课程知识探析[J].衡阳师范学院学报,2011,32(1):92-96.
5谢红.电子商务中的知识管理策略[J].中国管理信息化,2013,16(1):64-67. 被引量：1
6周敏.“知识元”型语文课程知识构层的语用学维度审视[J].湖南第一师范学院学报,2013,13(1):36-39. 被引量：2
7张建华,郭增茂.知识管理中知识表示绩效测度研究[J].情报杂志,2013,32(6):203-206.
8王静.电子商务中的知识管理策略探析[J].商情,2013(30):70-71.
9许春漫.泛在知识环境下知识元的构建与检索[J].情报理论与实践,2014,37(2):107-111. 被引量：11
10赖振丹.基于数据挖掘的广西农业信息服务平台分析设计[J].中国管理信息化,2014,17(9):93-94. 被引量：1

1何金勇.dBASEⅢ数据库结构自动编辑技巧[J].计算机应用研究,1991,8(4):7-8. 被引量：1
2杨曙光.下载文档高效去空行[J].电脑爱好者（普及版）,2008,0(1):67-67.
3刘素楠,刘颖芬.AUTOCAD中的夹点及其在编辑中的应用[J].电脑学习,1999(5):31-32.
4宾晓华.一种对DBASEⅢ程序进行自动再编辑的方法[J].微型计算机,1990(4):86-87.
5张飞碧.全自动智能录播和远程教育系统(3)[J].音响技术,2008(7):47-50.
6温有奎,孙明,温浩,焦玉英，武汉.基于Web的情报知识元挖掘与语义集成地图[J].情报学报,2008,27(2):163-168. 被引量：8
7温有奎 ,温浩 ,徐端颐 ,潘龙法 .基于创新点的知识元挖掘[J].情报学报,2005,24(6):663-668. 被引量：37
8宋建新,胡建彰.可视图文中线条图形自动编辑的研究[J].通信学报,1994,15(5):69-74.
9张杰.AutoCAD环境下线切割自动编程系统[J].青岛大学学报（自然科学版）,1999,12(3):68-71.
10余一骄,尹燕飞,刘芹.基于大规模语料库的高频汉字串互信息分布规律分析[J].计算机科学,2014,41(10):276-282.

计算机工程与应用

2008年第30期

浏览历史

内容加载中请稍等...

基于大规模真实文本的数值知识元挖掘研究被引量：19

参考文献9

二级参考文献3

共引文献46

同被引文献216

引证文献19

二级引证文献121

相关作者

相关机构

相关主题

浏览历史

基于大规模真实文本的数值知识元挖掘研究 被引量：19

参考文献9

二级参考文献3

共引文献46

同被引文献216

引证文献19

二级引证文献121

相关作者

相关机构

相关主题

浏览历史

基于大规模真实文本的数值知识元挖掘研究被引量：19