期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
学术论断句标注与识别方法探索 被引量:4
1
作者 徐健 郭语凡 +4 位作者 喻雪寒 黄雨馨 杨婷婷 王唯一 刘政 《情报学报》 CSSCI CSCD 北大核心 2022年第7期707-719,共13页
学术文本中的论断句包含了学者对研究问题的看法和判断,对其进行识别有助于组织和挖掘其中蕴含的学术观点,以辅助学者更高效地开展科研活动。在对前人研究进行归纳的基础上,提出论断句判断的3个充分条件和3个必要条件,从肯定和否定角度... 学术文本中的论断句包含了学者对研究问题的看法和判断,对其进行识别有助于组织和挖掘其中蕴含的学术观点,以辅助学者更高效地开展科研活动。在对前人研究进行归纳的基础上,提出论断句判断的3个充分条件和3个必要条件,从肯定和否定角度构建论断句判定标准。开发论断句标注系统,选择信息资源管理领域部分论文,开展摘要和全文层面论断句的标注实验。评测最小序列优化、支持向量机、朴素贝叶斯、决策树、k近邻、BERT(bidirectional encoder representations from transformers)+FC(full connection)、BERT+BiLSTM(bidirectional long short-term memory)分类器对论断句的识别效果。研究发现:①使用本文提出的判断标准,标注者在摘要和全文层面对学术文本中论断句和非论断句的标注一致性较高;②仅使用文本特征情况下,BERT+BiLSTM算法识别效果最好,准确率、召回率和F_1值等指标均大于90%;③论断句和非论断句在长度、段内位置、文内位置和TextRank权重上频率分布均存在差异;④在摘要层面,使用序列最小优化算法,加入长度特征后,分类器识别效果提升0.5%;在全文层面,使用支持向量机分类器,加入长度、段内相对位置、文内相对位置特征后,分类器识别效果在F_1值上取得了2%的提升。 展开更多
关键词 序列最小优化算法 朴素贝叶斯 支持向量机分类器 信息资源管理 决策树 序列优化 学术文本 位置特征
下载PDF
2014—2020年间论辩挖掘研讨会研究述评 被引量:1
2
作者 徐健 黄雨馨 +3 位作者 王唯一 杨婷婷 郭语凡 刘政 《现代情报》 CSSCI 2021年第9期167-176,共10页
[目的/意义]论证挖掘(Argument Mining)是人工智能、文本挖掘领域近几年较为火热的研究主题,是观点挖掘(Opinion Mining)最新的研究方向。论辩挖掘旨在对文本信息中的论辩成分与结构进行识别、提取与分析,相关工作有助于度量论辩性文本... [目的/意义]论证挖掘(Argument Mining)是人工智能、文本挖掘领域近几年较为火热的研究主题,是观点挖掘(Opinion Mining)最新的研究方向。论辩挖掘旨在对文本信息中的论辩成分与结构进行识别、提取与分析,相关工作有助于度量论辩性文本中蕴含的论点、论据及其间关系,实现对观点可信度的评估,是完成文本细粒度分析和深度理解的关键。[方法/过程]本文收集了2014—2020年Argument Minging Workshop上发表的121篇论文,梳理相关理论、方法和应用场景。[结果/结论]研究发现,当前论辩挖掘研究仍处于初级阶段,相关研究存在缺乏整体性、未建立统一的标注规范、研究深度不足的缺陷。未来应更注重应用研究、提升语料库构建质量、实现从论辩性信息的理解到论辩自动生成的过渡。 展开更多
关键词 观点 论辩挖掘 论证策略 论辩组件
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部