期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于机器学习和深度学习的南海证据性数据抽取算法比较与应用
被引量:
6
1
作者
彭玉芳
陈将浩
何志强
《现代情报》
CSSCI
2022年第2期55-69,共15页
[目的/意义]本文尝试从文献载体到文献内容(全文检索)再到数据层面的细粒度的南海证据性数据抽取。首先,能提高南海文献数字资源的检索性能;其次,为专业人员提供充足的证据材料;最后,为南海维权的证据链关联模型构建做好基础。[方法/过...
[目的/意义]本文尝试从文献载体到文献内容(全文检索)再到数据层面的细粒度的南海证据性数据抽取。首先,能提高南海文献数字资源的检索性能;其次,为专业人员提供充足的证据材料;最后,为南海维权的证据链关联模型构建做好基础。[方法/过程]根据南海维权证据的特点,制定抽取规则。通过文本清洗、文本分段、段分句、分词把非结构化的数据转化成结构化数据。然后分别比较朴素贝叶斯、SVM、随机森林、DNN、TexCNN、Bi-LSTM、LightGBM和XGBoost的证据性数据抽取效果。最后为了进一步提高证据抽取的准确性,增加了“5W”规则过滤和人工校验。[结果/结论]实验结果表明,基于TensorFlow深度学习框架,构建DNN模型的证据性数据抽取效果较好,准确率达0.88。通过进一步融合“5W”规则过滤和人工校验,显著地提高了南海证据性数据抽取的准确率,本文的证据抽取的方法具有一定的可行性。
展开更多
关键词
证据性数据抽取
TensorFlow
机器学习算法
深度学习算法
“5W”规则
下载PDF
职称材料
基于深度学习与需求规则融合的学术文献“目标数据”抽取模型构建与应用——以南海数字资源为例
被引量:
6
2
作者
彭玉芳
陈将浩
《情报科学》
CSSCI
北大核心
2022年第1期141-147,157,共8页
【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度学习方法从大量的学术文献中...
【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度学习方法从大量的学术文献中抽取目标数据。其次使用NER和TF-IDF抽取目标数据的"5W"规则,接着对目标数据做第二层需求规则过滤,凡是满足"5W"规则的数据,被鉴定为目标数据。最后对目标数据做第三层人工校验,最终生成学术文献"目标数据"。【结果/结论】本文构建的学术文献"目标数据"抽取模型的准确率可达0.88,再融合"5W"规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献数据库机构的检索工作。【创新/局限】深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息层面到进入学术文献内容的数据层面。
展开更多
关键词
深度学习
命名实体识别
词袋模型
TF-IDF
“5W”规则
原文传递
题名
基于机器学习和深度学习的南海证据性数据抽取算法比较与应用
被引量:
6
1
作者
彭玉芳
陈将浩
何志强
机构
南京工程学院经济与管理学院
南京大学信息管理学院
中国科学技术大学数学科学学院
中国科学技术大学苏州研究院
出处
《现代情报》
CSSCI
2022年第2期55-69,共15页
基金
国家社会科学基金重大项目“南海疆文献资料整理中的知识发现与维权证据链建构研究”(项目编号:19ZDA347)
南京大学2015年度研究生创新工程“跨学科科研创新基金”项目“民国档案文献中的环中国南海文化电函与报道研究”(项目编号:2015CW04)
江苏省研究生培养创新工程项目“基于自动关联技术的南海问题证据链研究”(项目编号:KYLX15_0025)。
文摘
[目的/意义]本文尝试从文献载体到文献内容(全文检索)再到数据层面的细粒度的南海证据性数据抽取。首先,能提高南海文献数字资源的检索性能;其次,为专业人员提供充足的证据材料;最后,为南海维权的证据链关联模型构建做好基础。[方法/过程]根据南海维权证据的特点,制定抽取规则。通过文本清洗、文本分段、段分句、分词把非结构化的数据转化成结构化数据。然后分别比较朴素贝叶斯、SVM、随机森林、DNN、TexCNN、Bi-LSTM、LightGBM和XGBoost的证据性数据抽取效果。最后为了进一步提高证据抽取的准确性,增加了“5W”规则过滤和人工校验。[结果/结论]实验结果表明,基于TensorFlow深度学习框架,构建DNN模型的证据性数据抽取效果较好,准确率达0.88。通过进一步融合“5W”规则过滤和人工校验,显著地提高了南海证据性数据抽取的准确率,本文的证据抽取的方法具有一定的可行性。
关键词
证据性数据抽取
TensorFlow
机器学习算法
深度学习算法
“5W”规则
Keywords
evidence data extraction
TensorFlow
machine learning algorithm
deep learning algorithm
“5W”rule
分类号
G255 [文化科学—图书馆学]
下载PDF
职称材料
题名
基于深度学习与需求规则融合的学术文献“目标数据”抽取模型构建与应用——以南海数字资源为例
被引量:
6
2
作者
彭玉芳
陈将浩
机构
南京工程学院经济与管理学院
南京大学信息管理学院
中国科学技术大学数学科学学院
出处
《情报科学》
CSSCI
北大核心
2022年第1期141-147,157,共8页
基金
国家社会科学基金重大项目“南海疆文献资料整理中的知识发现与维权证据链建构研究”(19ZDA347)
南京大学2015年度研究生创新工程“跨学科科研创新基金”项目“民国档案文献中的环中国南海文化电函与报道研究”(2015CW04)
江苏省研究生培养创新工程项“基于自动关联技术的南海问题证据链研究”(KYLX15_0025)。
文摘
【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度学习方法从大量的学术文献中抽取目标数据。其次使用NER和TF-IDF抽取目标数据的"5W"规则,接着对目标数据做第二层需求规则过滤,凡是满足"5W"规则的数据,被鉴定为目标数据。最后对目标数据做第三层人工校验,最终生成学术文献"目标数据"。【结果/结论】本文构建的学术文献"目标数据"抽取模型的准确率可达0.88,再融合"5W"规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献数据库机构的检索工作。【创新/局限】深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息层面到进入学术文献内容的数据层面。
关键词
深度学习
命名实体识别
词袋模型
TF-IDF
“5W”规则
Keywords
deep learning
named entity recognition
bag-of-words model
TF-IDF
"5W"rule
分类号
G250.2 [文化科学—图书馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于机器学习和深度学习的南海证据性数据抽取算法比较与应用
彭玉芳
陈将浩
何志强
《现代情报》
CSSCI
2022
6
下载PDF
职称材料
2
基于深度学习与需求规则融合的学术文献“目标数据”抽取模型构建与应用——以南海数字资源为例
彭玉芳
陈将浩
《情报科学》
CSSCI
北大核心
2022
6
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部