期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
面向中文科技文献非结构化摘要的知识元表示与抽取研究——基于知识元本体理论 被引量:16
1
作者 郑梦悦 秦春秀 马续补 《情报理论与实践》 CSSCI 北大核心 2020年第2期157-163,共7页
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表... [目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。 展开更多
关键词 科技文献 结构化摘要 知识表示 知识抽取 知识元 本体模型
下载PDF
中文图情期刊摘要的核心要素与逻辑结构分析 被引量:5
2
作者 周志超 《情报科学》 CSSCI 北大核心 2018年第3期8-12,32,共6页
【目的/意义】对中文图情领域核心期刊摘要进行语义分析,以期发现摘要中包含核心要素与逻辑结构的特征及规律。【方法/过程】选择图书馆情报学领域的三本优秀核心期刊,以2016年01-04期论文为样本,即《中国图书馆学报》、《大学图书馆学... 【目的/意义】对中文图情领域核心期刊摘要进行语义分析,以期发现摘要中包含核心要素与逻辑结构的特征及规律。【方法/过程】选择图书馆情报学领域的三本优秀核心期刊,以2016年01-04期论文为样本,即《中国图书馆学报》、《大学图书馆学报》和《图书情报工作》,对摘要进行逐句语义标注,并对摘要中包含的核心要素和逻辑结构进行统计分析。【结果/结论】研究发现,中文图情论文摘要主要由7大基本要素组合而成,其中研究结论、研究方法、研究目的是最为核心的要素;绝大部分摘要(79.2%)至少由3个基本要素构成,而"研究目的/问题+研究方法/过程+研究结论"(P+M+F模式)是最为常见的逻辑结构;采用结构化摘要发表论文,对于提升摘要结构逻辑性和完整性有一定影响。 展开更多
关键词 摘要核心要素 结构化摘要 语义标注 摘要逻辑结构
原文传递
辅助成本估算系统化调研的自动化方法
3
作者 孙悦明 杨叶 张文 《计算机工程与设计》 CSCD 北大核心 2013年第2期490-494,共5页
为降低软件工程领域传统进行系统化调研(SLR)所需要的大量的人力和时间花费,提出了自动化辅助SLR过程的方法。通过使用语法和句法分析方法对软件估算文献的摘要部分进行结构化划分以及概念与知识抽取。建立软件估算本体(COSt estimation... 为降低软件工程领域传统进行系统化调研(SLR)所需要的大量的人力和时间花费,提出了自动化辅助SLR过程的方法。通过使用语法和句法分析方法对软件估算文献的摘要部分进行结构化划分以及概念与知识抽取。建立软件估算本体(COSt estimation ONTology,COSONT),将抽取出来的概念知识组织成本体结构以自动化辅助软件成本估算的系统化调研。通过对比实验,表明了使用COSONT既能得到不错的SLR效果,又能节省大量的时间,验证了系统化调研自动化方法的优势。 展开更多
关键词 系统化调研 语法与句法分析 本体 软件估算 结构化摘要 软件工程
下载PDF
视频智能分析技术应用研究 被引量:17
4
作者 王凌志 陈军辉 《警察技术》 2012年第2期66-68,共3页
"平安城市"和社会监控的建设,积累了大量的监控视频资源,利用视频破案已经成为非常重要的手段。但是面对海量的视频资料,并且基于目前审看手段效率低下、耗时费力的原因,让监控视频资料利用的效率和范围受到极大限制。如何解... "平安城市"和社会监控的建设,积累了大量的监控视频资源,利用视频破案已经成为非常重要的手段。但是面对海量的视频资料,并且基于目前审看手段效率低下、耗时费力的原因,让监控视频资料利用的效率和范围受到极大限制。如何解决这个难题成为当前刑侦视频运用中关注的焦点。本文阐述了如何利用视频智能分析技术及软件工具来进行智能化视频审看,并结合实战经历进行说明。 展开更多
关键词 智能分析 刑侦思维 结构化摘要 智能排查 智能浓缩
下载PDF
Constructing a taxonomy to support multi-document summarization of dissertation abstracts
5
作者 KHOO Christopher S.G. GOH Dion H. 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第11期1258-1267,共10页
This paper reports part of a study to develop a method for automatic multi-document summarization. The current focus is on dissertation abstracts in the field of sociology. The summarization method uses macro-level an... This paper reports part of a study to develop a method for automatic multi-document summarization. The current focus is on dissertation abstracts in the field of sociology. The summarization method uses macro-level and micro-level discourse structure to identify important information that can be extracted from dissertation abstracts, and then uses a variable-based framework to integrate and organize extracted information across dissertation abstracts. This framework focuses more on research concepts and their research relationships found in sociology dissertation abstracts and has a hierarchical structure. A taxonomy is constructed to support the summarization process in two ways: (1) helping to identify important concepts and relations expressed in the text, and (2) providing a structure for linking similar concepts in different abstracts. This paper describes the variable-based framework and the summarization process, and then reports the construction of the taxonomy for supporting the summarization process. An example is provided to show how to use the constructed taxonomy to identify important concepts and integrate the concepts extracted from different abstracts. 展开更多
关键词 Text summarization Automatic multi-document summarization Variable-based framework Digital library
下载PDF
基于主动学习的科技论文句子功能识别研究 被引量:11
6
作者 陈果 许天祥 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第8期53-61,共9页
【目的】为降低对人工标注语料的依赖,探索利用主动学习方法,充分结合现成的结构化摘要和有针对性的少量人工标注,以获得具有更好泛化能力的句子功能分类模型,识别文献句子功能类型(如表述研究的目的、方法、结论等)。【方法】以结构化... 【目的】为降低对人工标注语料的依赖,探索利用主动学习方法,充分结合现成的结构化摘要和有针对性的少量人工标注,以获得具有更好泛化能力的句子功能分类模型,识别文献句子功能类型(如表述研究的目的、方法、结论等)。【方法】以结构化摘要功能句为初始语料训练SVM、CNN、Bi-LSTM三种初始分类器,再展开主动学习:对大量无标签普通摘要句子进行功能预测,自动筛选不确定性高的样例提请人工标注,标注结果用于优化初始分类器,迭代进行主动学习,以提高分类器在新任务场景下的泛化性能。【结果】在图书情报学科文献集上实验表明,开展主动学习可取得较好的句子功能分类效果,准确率、召回率、F1值达84.65%、84.49%、84.57%,较主动学习前分别提升3.25%、3.24%、3.25%。【局限】为避免大量的人工语料标注工作,仅做了5次迭代。【结论】主动学习方法善于发现新任务场景下未标注语料与已有现成训练语料的差异,有针对性地降低人工标注成本,以提升基本模型的泛化能力。后续可进一步扩展应用于其他场景下(如引文、全文)的句子功能识别。 展开更多
关键词 结构化摘要 句子功能识别 主动学习 短文本分类
原文传递
影响支持向量机模型语步自动识别效果的因素研究 被引量:11
7
作者 丁良萍 张智雄 刘欢 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第11期16-23,共8页
【目的】探讨在基于支持向量机(SVM)模型的科技论文摘要自动语步识别过程中,训练样本的规模、N元词(N-gram)的N取值、停用词以及词频加权方式等特征对识别效果的影响。【方法】从72万余篇科技论文结构化摘要中,抽取出总计110多万条已标... 【目的】探讨在基于支持向量机(SVM)模型的科技论文摘要自动语步识别过程中,训练样本的规模、N元词(N-gram)的N取值、停用词以及词频加权方式等特征对识别效果的影响。【方法】从72万余篇科技论文结构化摘要中,抽取出总计110多万条已标注好的语步为实验数据,构建SVM模型进行语步识别实验。采用控制变量方法,基于单一变量原则,通过改变训练样本量、N-gram的N取值、是否去除停用词、词频加权方式,对比分析这些特征变化对语步识别效果的影响。【结果】训练样本数量为60万条语步、N元词的N取值为[1,2]、不去除停用词、词频加权方式采用TF-IDF时模型识别效果最好,为93.50%。【局限】主要以笔者收集的结构化论文摘要为训练和测试语料,未与其他人的结果比较。【结论】训练样本规模以及一些精细的特征对传统机器学习模型的效果有重要影响,使用者在实践中需要根据具体情况进行精细的特征选取。 展开更多
关键词 语步识别 支持向量机 结构化摘要
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部