期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于机器学习和深度学习的南海证据性数据抽取算法比较与应用 被引量:6
1
作者 彭玉芳 陈将浩 何志强 《现代情报》 CSSCI 2022年第2期55-69,共15页
[目的/意义]本文尝试从文献载体到文献内容(全文检索)再到数据层面的细粒度的南海证据性数据抽取。首先,能提高南海文献数字资源的检索性能;其次,为专业人员提供充足的证据材料;最后,为南海维权的证据链关联模型构建做好基础。[方法/过... [目的/意义]本文尝试从文献载体到文献内容(全文检索)再到数据层面的细粒度的南海证据性数据抽取。首先,能提高南海文献数字资源的检索性能;其次,为专业人员提供充足的证据材料;最后,为南海维权的证据链关联模型构建做好基础。[方法/过程]根据南海维权证据的特点,制定抽取规则。通过文本清洗、文本分段、段分句、分词把非结构化的数据转化成结构化数据。然后分别比较朴素贝叶斯、SVM、随机森林、DNN、TexCNN、Bi-LSTM、LightGBM和XGBoost的证据性数据抽取效果。最后为了进一步提高证据抽取的准确性,增加了“5W”规则过滤和人工校验。[结果/结论]实验结果表明,基于TensorFlow深度学习框架,构建DNN模型的证据性数据抽取效果较好,准确率达0.88。通过进一步融合“5W”规则过滤和人工校验,显著地提高了南海证据性数据抽取的准确率,本文的证据抽取的方法具有一定的可行性。 展开更多
关键词 证据性数据抽取 TensorFlow 机器学习算法 深度学习算法 “5W”规则
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部