-
题名基于图卷积网络的重大事件趋势预测
被引量:1
- 1
-
-
作者
耿小航
彭冬亮
张震
谷雨
-
机构
杭州电子科技大学通信信息传输与融合技术国防重点学科实验室
-
出处
《计算机工程与设计》
北大核心
2021年第11期3196-3203,共8页
-
基金
国家自然科学基金项目(61771177)。
-
文摘
针对基于公开新闻数据的重大事件趋势预测研究在文本特征提取上语义理解不足问题,提出基于图卷积网络的重大事件趋势预测方法。利用结构化事件信息构建以事件为中心的语义关联图;按时间片粒度分割出局部事件语义关联图,利用预训练词向量对节点文本初始化特征表示;将带有节点特征的局部事件语义关联图输入图卷积网络,聚合节点邻域信息计算图特征表示并输入到分类器,训练预测模型并输出预测结果。以朝鲜核行为趋势预测问题验证所提出方法的有效性,对测试集(2017年3月~2018年3月)预测准确率达到76.92%,全时间段预测准确率为89.58%。预测结果表明,该方法增强了对文本的语义理解,预测精度优于基于专家知识构建特征的方法。
-
关键词
重大事件
趋势预测
图卷积网络
事件语义关联图
结构化事件数据
-
Keywords
major event
trend prediction
graph convolution network
event semantic association graph
structured event data
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于预训练模型和特征融合的事件触发词抽取
被引量:4
- 2
-
-
作者
张震
谷雨
耿小航
俞海亮
-
机构
杭州电子科技大学自动化学院
-
出处
《杭州电子科技大学学报(自然科学版)》
2021年第4期40-47,共8页
-
基金
国家自然科学基金资助项目(61771177)。
-
文摘
为解决事件触发词抽取任务中出现的一词多义、特征提取不充分等问题,提出一种基于预训练模型和特征融合的触发词抽取方法。以BERT预训练模型的多层双向Transformer编码单元构建的动态词向量为基础,融合卷积网络提取的词汇级别特征和图卷积网络提取的句子级别特征,然后应用条件随机场模型对预测的触发词标签序列进行合理约束,从而实现对触发词的准确抽取。采用ACE2005英文数据集进行测试,提出方法在测试集上的触发词识别任务F1值为74.6%,触发词分类任务F1值为71.1%,验证了提出方法的有效性。
-
关键词
预训练模型
卷积神经网络
图卷积
条件随机场
触发词抽取
-
Keywords
pre-training model
convolutional neural network
graph convolutional network
conditional random field
trigger extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合单词贡献度与Word2Vec词向量的文档表示
被引量:15
- 3
-
-
作者
彭俊利
谷雨
张震
耿小航
-
机构
杭州电子科技大学通信信息传输与融合技术国防重点学科实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第4期62-67,共6页
-
基金
国家自然科学基金(61673146)。
-
文摘
针对现有文档向量表示方法受噪声词语影响和重要词语语义不完整的问题,通过融合单词贡献度与Word2Vec词向量提出一种新的文档表示方法。应用数据集训练Word2Vec模型,计算数据集中词语的贡献度,同时设置贡献度阈值,提取贡献度大于该阈值的单词构建单词集合。在此基础上,寻找文档与集合中共同存在的单词,获取其词向量并融合单词贡献度生成文档向量。实验结果表明,该方法在搜狗中文文本语料库和复旦大学中文文本分类语料库上分类的平均准确率、召回率和F1值均优于TF-IDF、均值Word2Vec、PTF-IDF加权Word2Vec模型等传统方法,同时其对英文文本也能进行有效分类。
-
关键词
单词贡献度
Word2Vec词向量
词嵌入
文档表示
文本分类
-
Keywords
Term Contribution(TC)
Word2Vec word vector
word embedding
document representation
text classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于HC-TC-LDA的重大事件趋势预测
被引量:1
- 4
-
-
作者
彭俊利
谷雨
张震
耿小航
-
机构
杭州电子科技大学自动化学院
-
出处
《指挥信息系统与技术》
2019年第5期40-46,共7页
-
基金
装备发展部“十三五”预研课题资助项目
-
文摘
提出了一种基于海量公开新闻数据的重大事件趋势预测框架.首先,对使用网络爬虫爬取的专题新闻数据进行时间片划分和趋势等级划分等处理;然后,考虑到数据有较大噪声和稀疏性强等特点,提出了一种融合层次聚类、单词贡献度和潜在Dirichlet分布(LDA)主题模型的特征抽取方法,抽取具有表征性的单词为特征,构建特征集合;最后,采用多项式逻辑回归方法构建重大事件趋势预测模型.以朝鲜核活动预测为例,验证了该框架的性能和有效性.
-
关键词
重大事件
趋势预测
单词贡献度
LDA主题模型
-
Keywords
mega-event
trend prediction
term contribution
latent Dirichlet allocation (LDA) topic model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-