-
题名基于证据增强与多特征融合的文档级关系抽取
- 1
-
-
作者
颜新月
杨淑群
高永彬
-
机构
上海工程技术大学电子电气工程学院
-
出处
《计算机应用》
CSCD
北大核心
2024年第11期3379-3385,共7页
-
基金
上海市地方能力建设项目(21010501500)
上海市“科技创新行动计划”社会发展科技攻关项目(21DZ1204900)。
-
文摘
文档级关系抽取(DocRE)的目的是识别文档中实体对之间存在的所有关系。针对证据句子和文档信息未能被有效利用以及实体多提及的问题,在使用证据增强上下文特征的基础上,构建一种多特征融合的文档级关系抽取模型EMF(Evidence Multi-feature Fusion)。首先,在实体前后加上实体类型,将关系文本特征与实体提及进行关联,以获得特定于关系的实体特征。其次,通过不同卷积核获得片段表示,并通过注意力机制获得实体对感知的多粒度片段级特征;同时,利用证据分布增强与实体对高度相关的上下文特征。最后,融合以上特征进行关系分类,并在推理时将获得的证据组成伪文档与原文档一起输入分类器进行关系分类。在DocRE数据集DocRED(Document-level Relation Extraction Dataset)上的实验结果表明,使用BERTbase作为预训练语言模型编码器时,相较于先进模型EIDER(EvIDence-Enhanced DocRE),所提模型EMF的Ign F1和F1分别提高了0.42和0.41个百分点,F1达到了62.89%。EMF模型更关注与实体和关系相关的部分,可提高抽取的精度,并具有较好的可解释性。
-
关键词
文档级
关系抽取
证据
提及注意
片段特征
-
Keywords
document-level
relationship extraction
evidence
mention attention
fragment feature
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
-
-
题名汉语“提及”类衔接成分的用法及其辨析
被引量:1
- 2
-
-
作者
周利芳
-
机构
陕西师范大学国际汉学院
华南师范大学国际文化学院
-
出处
《华文教学与研究》
CSSCI
2018年第3期61-69,共9页
-
基金
教育部人文社会科学基金项目"以汉语教学为背景的现代汉语语篇衔接成分研究"(12YJA740118)(1)
-
文摘
现代汉语的"提及"类衔接成分通过话题的引入表示对话和上下文之间的承接关系,是承接类语篇衔接成分的下位类型。文章根据结构将"提及"类衔接成分分为2个小类:一是说到,说起,提起;二是说起来,提起来。并在各小类内部解释、辨析了这些成分的意义和功能。
-
关键词
语篇
提及类
承接关系
衔接成分
辨析
-
Keywords
discourse
“mentioning”type
continuing relationship
cohesive component
analyze
-
分类号
H193.5
[语言文字—汉语]
H146.1
[语言文字—汉语]
-
-
题名基于多种提及关系的社交媒体用户位置推断
被引量:1
- 3
-
-
作者
乔亚琼
罗向阳
马江涛
李晨亮
张萌
李瑞祥
-
机构
信息工程大学网络空间安全学院
数学工程与先进计算国家重点实验室
郑州轻工业大学计算机与通信工程学院
武汉大学国家网络安全学院
-
出处
《通信学报》
EI
CSCD
北大核心
2020年第12期72-81,共10页
-
基金
国家自然科学基金资助项目(No.U1804263,No.U1636219,No.61872287,No.U1736214)
国家重点研发计划基金资助项目(No.2016QY01W0105,No.2016YFB0801303)
+2 种基金
中原英才计划−中原科技创新领军人才基金资助项目(No.1052020KJLJ0025)
河南省科技创新人才计划基金资助项目(No.184200510018)
河南省科技攻关基金资助项目(No.202102310237)。
-
文摘
针对现有基于生成文本和社交关系的联合位置推断方法对社交媒体中异质数据间的位置关联性挖掘不充分的问题,提出了一种基于多种提及关系的社交媒体用户位置推断方法。首先,综合考虑社交媒体文本中用户之间的提及关系、用户对位置指示词的提及关系和用户对地理名词的提及关系,构建包含用户、位置指示词和地理名词3种节点的异质网络;其次,基于共同提及关系提出用户−词语−位置简化算法来构建用户−位置异质网络,将位置邻近的用户更为紧密地联系起来;再次,提出有偏的随机游走算法对图中节点采样以充分探索网络结构,缓解已知位置的稀疏性问题;最后,采用基于多层感知机的神经网络分类器对用户进行位置推断。在GEOTEXT、TW-US和TW-WORLD这3个代表性Twitter数据集上的实验结果表明,所提方法可显著提高用户位置推断准确率。
-
关键词
社交媒体
异质网络
用户位置推断
提及关系
-
Keywords
social media
heterogeneous network
user geolocalization
mention relationship
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于上下文共指实体依赖的文档级关系抽取
- 4
-
-
作者
夏正新
苏翀
刘勇
-
机构
南京邮电大学继续教育学院
南京邮电大学管理学院
南京邮电大学医疗信息工程研究中心
四川大学计算机学院
-
出处
《数据采集与处理》
CSCD
北大核心
2023年第5期1226-1234,共9页
-
文摘
文档级关系提取(Document relationship extraction,DRE)旨在多条句子中识别实体间的关系,而实体可能对应于跨越句子边界的多次提及,其中代词实体提及是因句子之间连接而普遍存在的语法现象,也是影响句子推理的一个重要因素。然而,以往的研究大多侧重于普通实体提及之间的关系,却很少关注代词实体提及的共指和关系捕获。本文提出了基于上下文共指实体依赖(Contextual coreference entity dependency,CCED)的文档级关系抽取模型,即通过融合普通实体和代词实体表示来构建共指实体依赖关系的上下文图结构,并在图上进行实体对间的全局交互推理,从而对实体关系的相互依赖进行建模。分别在公共数据集DocRED、DialogRE和MPDD上对CCED模型进行评估,结果显示在DocRED数据集上,与表现最好的基线模型DocuNet-BERT相比,CCED模型在测试集上的Ign F_(1)性能提高0.55%,F_(1)性能提高0.35%。在DialogRE和MPDD数据集上,与表现最好的基线模型COLN相比,CCED模型在DialogRE测试集上的F_(1)性能提高1.02%,在MPDD测试集上的ACC性能提高1.19%。实验结果验证了新模型对于文档级关系抽取的有效性。
-
关键词
关系提取
实体提及
共指消解
图推理
上下文图结构
-
Keywords
relationship extraction
entity mentions
coreference resolution
graph reasoning
context graph structure
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名医患谈话中话文提起的研究
- 5
-
-
作者
温鹏程
-
机构
山西药科职业学院基础部
-
出处
《延安职业技术学院学报》
2014年第1期127-129,共3页
-
文摘
医患关系是众多社会关系中非常独特的一种关系。探讨医患交谈中,话文的提起这一重要的语用现象。进而指出,医生在患者对自己的不适自述后,为了明确患者的某一症状,先提起这一话文,甚至多次反复提及直到确认。而患者对自己的疾病及可能担心的病情也会主动提起话文,直到双方对疾病都有满意的了解。
-
关键词
话文提起
医患关系
症状
沟通
-
Keywords
words mention
the doctor-patient relationship
symptoms
communication
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-