-
题名基于集成学习与聚类联合标注的多模态个体情绪识别
- 1
-
-
作者
柯善军
聂成洋
王钰苗
何邦胜
-
机构
重庆理工大学车辆工程学院
-
出处
《智能科学与技术学报》
CSCD
2024年第1期76-87,共12页
-
基金
重庆市教委科学技术研究项目(No.2020CJZ053)。
-
文摘
针对通用情绪识别模型面对不同个体时的低识别精度问题,提出一种基于集成学习与聚类联合标注的多模态个体情绪识别方法。该方法首先基于公共数据集训练通用情绪识别模型,然后分析公共数据集数据与个体无标签数据的分布差异,建立跨域模型来预测和标注个体数据的伪标签。同时,对个体数据进行加权聚类并标注聚类标签,利用聚类标签与伪标签进行联合标注,筛选高置信度样本进一步训练通用模型,得到个性化情绪识别模型。实验采集3名被试的3种情绪数据并使用该方法标注,最后优化得到的个性化模型对3种情绪的平均识别精度达到80%以上,相比原通用模型,至少提升了35%。
-
关键词
个体情绪识别
领域自适应
集成学习
聚类
联合标注
-
Keywords
individual emotion recognition
domain adaptation
integrated learning
clustering
joint annotation
-
分类号
TP911.7
[自动化与计算机技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于联合标注和全局推理的篇章级事件抽取
被引量:20
- 2
-
-
作者
仲伟峰
杨航
陈玉博
刘康
赵军
-
机构
哈尔滨理工大学自动化学院
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2019年第9期88-95,106,共9页
-
文摘
事件抽取可以帮助人们从海量的文本中快速、准确地获取感兴趣的事件知识。然而,目前事件抽取的研究主要集中在从单一句子中抽取事件,由于事件构成的复杂性和语言表述的多样性,多数情况下多句才能完整地描述一个事件。因此,从篇章中抽取出完整的结构化事件信息,显得更有价值和意义。该文首先利用基于注意力机制的序列标注模型联合抽取句子级事件的触发词和实体,与独立进行实体抽取和事件识别相比,联合标注的方法在F值上提升了1个百分点。然后利用多层感知机判断实体在事件中扮演的角色。最后,在句子级事件抽取的基础上,利用整数线性规划的方法进行全局推理,融合句子级事件信息,实现篇章级事件抽取,与基线模型相比,这种基于全局推理的篇章级事件抽取在F值上提升了3个百分点。
-
关键词
篇章级事件抽取
联合标注
全局推理
-
Keywords
document-level event extraction
joint labeling
global reasoning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于联合层级问答的新闻人物言论抽取方法
- 3
-
-
作者
张能欢
冯爽
周正宇
-
机构
国家广播电视总局广播电视科学研究院
中国传媒大学
-
出处
《中国传媒大学学报(自然科学版)》
2024年第3期57-65,共9页
-
基金
中国传媒大学校级项目(CUC23WH005)
国家重点研发计划课题(2021YFF0901602)。
-
文摘
新闻人物言论的抽取对理解社会动态、分析公众意见、辅助决策制定至关重要。本文针对新闻场景定义了人物言论事件框架,提出了一种基于联合层级问答的新闻人物言论抽取方法。该方法改变原有的针对起始位置进行预测的指针标注方式和序列标注,采用联合层级标注,以提高模型在面对复杂人物名称时的识别能力,并利用多轮问答的特性,准确匹配人物名称和触发词,以解决复杂人物言论抽取中的多任务问题。为进一步提升模型训练效果,引入了额外位置向量和交替双向训练策略。实验结果表明,本文方法在(人物,触发词)抽取、言论抽取以及(人物、触发词、言论)三元组抽取任务中均取得了较好的结果。
-
关键词
人物言论
事件抽取
联合层级标注
多轮问答
-
Keywords
figure remarks
event extraction
joint hierarchical annotation
multi-round question-answering
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名用户自适应的社会标签推荐模型
被引量:1
- 4
-
-
作者
卢露
赵靖
魏登月
-
机构
上海电力学院计算机科学与技术学院
安徽科技学院理学院
武汉大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
2014年第7期165-169,共5页
-
基金
国家自然科学基金资助项目"用户自适应的社会标签生成和优化模型研究"(61272277)
安徽省教育厅优秀青年基金资助重点项目"Web挖掘中的群智能算法应用研究"(2011SQRL117ZD)
-
文摘
针对传统模型不能真实反映标签的生成过程以及无法加入用户角色等问题,提出一种新的用户-内容联合标注模型。该模型中标签的生成同时受用户兴趣和资源主题的影响,反映用户真实的标注过程,能够学习到包括用户的兴趣分布概率、资源的主题分布概率、词语的主题分布概率以及标签的主题分布概率等参数。实验结果表明,与CI-LD、ACorrLDA等模型相比,该推荐模型的正确率提高了10%。
-
关键词
社会标注
标签
隐含主题模型
狄利克雷分配模型
用户·内容联合标注模型
GIBBS抽样
-
Keywords
social annotation
tag
latent topic model
Dirichlet allocation model
user-content joint annotation model
Gibbs sampling
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名统计模型中附加语言学规则的蒙古语词法分析
- 5
-
-
作者
张聪品
赵理莉
-
机构
河南师范大学计算机与信息技术学院
中国科学院计算技术研究所
-
出处
《计算机工程与设计》
CSCD
北大核心
2011年第8期2861-2864,共4页
-
基金
河南省高等学校青年骨干教师计划基金项目(2006年)
河南省基础与前沿技术研究计划基金项目(092300410152)
河南省科技攻关基金项目(2007520026)
-
文摘
蒙古词法分析是蒙古语信息处理的基础性问题,是蒙古语信息处理工作的第一步。通过对统计模型和蒙古语构词规则进行深入研究,提出了一种融合统计和规则技术的蒙古语词切分和词性标注的方法。该方法以统计模型作为基本框架,采用树形结构描述系统的解空间,并加入了蒙古语语言学规则和词干、词缀词典。实验结果表明,该系统分词和词性标注的词级准确率为95.1%,词干/词缀级准确率为94.6%,较已有蒙古语词法分析系统的准确率有所提高。
-
关键词
蒙古语信息处理
蒙古语词法分析
蒙古语分词
蒙古语词性标注
联合切分和词性标注
-
Keywords
Mongolian information processing
Mongolian lexical analysis
Mongolian word segmentation
Mongolian part of speech tagging
joint segmentation and POS tagging
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种中国古典文学文本知识图谱构建方法
被引量:1
- 6
-
-
作者
杨泽
顾磊
-
机构
南京邮电大学计算机学院
-
出处
《计算机技术与发展》
2021年第7期28-34,41,共8页
-
基金
教育部人文社会科学研究青年基金项目(18YJC870006)。
-
文摘
以中国古典文学为代表的古文是中文的重要组成部分,其语法、词汇相对于现代文而言更加复杂、讲究,给中文自然语言处理带来了机遇和挑战。针对上述问题,利用自然语言处理和知识图谱技术,以中国古典文学文本中具有代表性的《三国演义》为例,进行知识图谱构建。该方法通过语料库的网页标签匹配生成了一个分词与词性标注数据集,用来训练神经网络模型的联合分词和词性标注规则,并使用训练好的模型对《三国演义》进行测试解析;从结果中删除停用词,将内容词及其语义链接分别作为知识图谱中的节点和关系,并进行可视化展示。侧重于在古典文学文本进行联合分词与词性标注的基础上进行知识图谱构建。可视化展示的图像清晰地显示了非结构化文本中的重要信息。这项研究表明了以上工作流程的有效性,并展示了将自然语言处理和知识图谱应用于中国古典文学文本的潜力。
-
关键词
中国古典文学
知识图谱
Neo4j
自然语言处理
联合分词与词性标注
-
Keywords
Chinese classical literature
knowledge graph
Neo4j
natural language processing
joint word segmentation and part-of-speech tagging
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-