-
题名基于文献信息网络语义特征的相似性搜索
被引量:4
- 1
-
-
作者
邱庆羽
李婧
全兵
童超
张利君
张海仙
-
机构
四川大学计算机学院
中移(苏州)软件技术有限公司
成都瑞贝英特信息技术有限公司
-
出处
《计算机应用》
CSCD
北大核心
2018年第5期1327-1333,1352,共8页
-
基金
教育部-中国移动科研基金资助项目(MCM20160307)
四川省科技创新苗子工程项目
+1 种基金
成都市科技局国际合作项目(2016-GH02-00048-HZ
2015-GH02-00041-HZ)~~
-
文摘
文献信息网络是典型的异构信息网络,基于其进行相似性搜索是图挖掘领域的一个研究热点。然而,现有的方法主要采用元路径或元结构的方式,并未考虑节点自身的语义特征,从而导致搜索结果出现偏差。对此,基于文献信息网络提出了一种基于向量的语义特征提取方法,并设计实现了基于向量的节点相似性计算方法 VSim;此外,结合元路径设计了基于语义特征的相似性搜索算法VPSim;为提高算法的执行效率,针对文献网络数据的特点,设计了剪枝策略。通过在真实数据上的实验,验证了VSim对搜索语义特征相似实体的适用性,以及VPSim算法的有效性、高执行效率和高可扩展性。
-
关键词
文献信息网络
相似性搜索
图挖掘
元路径
语义特征
-
Keywords
bibliography information network
similarity search
graph mining
meta path
semantic features
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于BiLSTM-CRF的商情实体识别模型
被引量:35
- 2
-
-
作者
张应成
杨洋
蒋瑞
全兵
张利君
任晓雷
-
机构
四川大学计算机学院
四川省计算机研究院
成都瑞贝英特信息技术有限公司
四川智仟科技有限公司
中移(苏州)软件技术有限公司
四川黑马数码科技有限公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第5期308-314,共7页
-
基金
四川省科技计划项目(18PTDJ0085
2019YFH0075
+1 种基金
2018GZDZX0030)
泸州市科技计划项目(2017CDLZ-G25)
-
文摘
结合语言模型条件随机场(CRF)和双向长短时记忆(BiLSTM)网络,构建一种BiLSTM-CRF模型,以提取商情文本序列中的招标人、招标代理以及招标编号3类实体信息。将规范化后的招标文本序列按字进行向量化,利用BiLSTM神经网络获取序列化文本的前向、后向文本特征,并通过CRF提取出双向本文特征中相应的实体。实验结果表明,与传统机器学习算法CRF相比,该模型3类实体的精确率、召回率和F1值平均提升15.21%、12.06%和13.70%。
-
关键词
条件随机场
双向长短时记忆网络
语言模型
命名实体识别
深度学习
-
Keywords
Conditional Random Field(CRF)
Bidirectional Long Short-Term Memory(BiLSTM) network
language model
Named Entity Recognition(NER)
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合词性的双注意力Bi-LSTM情感分析
被引量:13
- 3
-
-
作者
赵富
杨洋
蒋瑞
张利君
任晓雷
-
机构
四川大学计算机学院
四川省计算机研究院
成都瑞贝英特信息技术有限公司
四川智仟科技有限公司
四川黑马数码科技有限公司
-
出处
《计算机应用》
CSCD
北大核心
2018年第A02期103-106,147,共5页
-
文摘
针对大多数情感分析文本过短、提取文本特征不足的问题,提出一种融合词性的双注意力机制的双向长短期记忆网络模型(CWPAT-Bi-LSTM)。首先,区别于一般情感分析只用词作为特征,该模型也使用了字和单词的词性作为神经网络的输入来丰富文本的特征;然后,融合字、词和词性的深层语义表达;最后,使用注意力机制关注对情感分析有价值的部分,更好地把握文本的情感,提高情感分类的精度。实验结果表明,与未融合词性的模型(CWATBi-LSTM)相比,该模型在4个数据集上情感分类的准确率分别提高1. 35、1. 25、0. 93、1. 5个百分点,验证了所提方法能够有效提高情感分类的准确率。
-
关键词
情感分析
自然语言处理
字向量
词向量
词性
注意力机制
双向长短期记忆网络
-
Keywords
sentiment analysis
Natural Language Processing(NLP)
character embedding
word embedding
part-of-speech
attention mechanism
Bidirectional Long Short-Term Memory(Bi-LSTM)
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于锚点的无监督跨模态哈希算法
- 4
-
-
作者
胡鹏
彭玺
彭德中
-
机构
四川大学计算机学院
-
出处
《软件学报》
EI
2024年第8期3739-3751,共13页
-
基金
国家自然科学基金(62102274,62176171,U21B2040 U19A2078)
四川省科技计划(2021YFS0389,2022YFQ0014,2022YFSY0047,2022YFH0021)
+1 种基金
中央高校基本科研业务费专项资金(YJ202140)
中国博士后科学基金(2021M692270)。
-
文摘
基于图的无监督跨模态哈希学习具有存储空间小、检索效率高等优点,受到学术界和工业界的广泛关注,已成为跨模态检索不可或缺的工具之一.然而,图构造的高计算复杂度阻碍其应用于大规模多模态应用.主要尝试解决基于图的无监督跨模态哈希学习面临的两个重要挑战:1)在无监督跨模态哈希学习中如何高效地构建图?2)如何解决跨模态哈希学习中的离散值优化问题?针对这两个问题,分别提出基于锚点图的跨模态学习和可微分哈希层.具体地,首先从训练集中随机地选择若干图文对作为锚点集,利用该锚点集作为中介计算每批数据的图矩阵,以该图矩阵指导跨模态哈希学习,从而能极大地降低空间与时间开销;其次,提出的可微分哈希层可在网络前向传播时直接由二值编码计算,在反向传播时亦可产生梯度进行网络更新,而无需连续值松弛,从而具有更好的哈希编码效果;最后,引入跨模态排序损失,使得在训练过程中考虑排序结果,从而提升跨模态检索正确率.通过在3个通用数据集上与10种跨模态哈希算法进行对比,验证了提出算法的有效性.
-
关键词
无监督哈希学习
跨模态检索
锚点图
可微分哈希
公共汉明空间
-
Keywords
unsupervised hashing learning
cross-modal retrieval
anchor graph
differentiable hashing
common Hamming space
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-