期刊文献+
共找到347篇文章
< 1 2 18 >
每页显示 20 50 100
基于词-主题-文本异质网络的短文本分类方法
1
作者 徐涛 赵星甲 卢敏 《计算机应用与软件》 北大核心 2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学... 针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。 展开更多
关键词 -主题-文本异质网络 词共现 文本-主题分布 短文本分类
下载PDF
多词共现分析方法在暴雨-地质灾害应急任务研究中的应用
2
作者 杨炼卿 许铭 +3 位作者 马成龙 戴彩岩 赵红 龙昭岳 《灾害学》 CSCD 北大核心 2024年第2期208-211,234,共5页
为快速制定救援行动方案,提出了一种多词共现分析方法将灾害应急任务从历史发生的灾害案例中提取出来的方法。该方法首先利用K-means聚类算法将预处理好的文本进行聚类分析,归纳出应急任务集。然后利用关联规则挖掘Apriori算法提取案例... 为快速制定救援行动方案,提出了一种多词共现分析方法将灾害应急任务从历史发生的灾害案例中提取出来的方法。该方法首先利用K-means聚类算法将预处理好的文本进行聚类分析,归纳出应急任务集。然后利用关联规则挖掘Apriori算法提取案例文本中的频繁项集作为共现词集,分析解释共现词集与应急任务之间的关系。最后,运用Gephi软件将共现词语网络可视化,进一步分析应急任务中要素之间的相关关系。以暴雨引发的地质灾害事故为例,对该方法进行了实验,结果表明该方法能有效的将暴雨-地质灾害事故案例文本中的应急任务提取出来,并通过网络可视化分析发现,在救援过程中,应急任务之间是联动配合的一个体系,协调好各个应急任务能缩短应急响应的时间,为制定或完善救援行动方案提供参考。 展开更多
关键词 暴雨-地质灾害 应急任务 文本挖掘 多词共现 关联规则挖掘 K-MEANS聚类算法
下载PDF
word2vec-ACV:OOV语境含义的词向量生成模型 被引量:7
3
作者 王永贵 郑泽 李玥 《计算机应用研究》 CSCD 北大核心 2019年第6期1623-1628,共6页
针对word2vec模型生成的词向量缺乏语境的多义性以及无法创建集外词(OOV)词向量的问题,引入相似信息与word2vec模型相结合,提出word2vec-ACV模型。该模型首先基于连续词袋(CBOW)和Hierarchical softmax的word2vec模型训练出词向量矩阵... 针对word2vec模型生成的词向量缺乏语境的多义性以及无法创建集外词(OOV)词向量的问题,引入相似信息与word2vec模型相结合,提出word2vec-ACV模型。该模型首先基于连续词袋(CBOW)和Hierarchical softmax的word2vec模型训练出词向量矩阵即权重矩阵;然后将共现矩阵进行归一化处理得到平均上下文词向量,再将词向量组成平均上下文词向量矩阵;最后将平均上下文词向量矩阵与权重矩阵相乘得到词向量矩阵。为了能同时解决集外词及多义性问题,将平均上下文词向量分为全局平均上下文词向量(global ACV)和局部平均上下文词向量(local ACV)两种,并对两者取权值组成新的平均上下文词向量矩阵,并将word2vec-ACV模型和word2vec模型分别进行类比任务实验和命名实体识别任务实验。实验结果表明,word2vec-ACV模型同时解决了语境多义性以及创建集外词词向量的问题,降低了时间消耗,提升了词向量表达的准确性和对海量词汇的处理能力。 展开更多
关键词 word2vec模型 词向量 共现矩阵 平均上下文词向量
下载PDF
基于TF-IDF与word2vec的台词文本分类研究 被引量:4
4
作者 但宇豪 黄继风 +1 位作者 杨琳 高海 《上海师范大学学报(自然科学版)》 2020年第1期89-95,共7页
为提高文本分类的准确性,针对健康节目台词文本各类别之间样本数量及各样本之间词数不平衡的特点,提出了一种基于word2vec均值算法及改进的词频-逆文本频率(TFIDF)算法的分类方法.该方法通过引入信息熵及修正因子,缓解了数据不平衡对分... 为提高文本分类的准确性,针对健康节目台词文本各类别之间样本数量及各样本之间词数不平衡的特点,提出了一种基于word2vec均值算法及改进的词频-逆文本频率(TFIDF)算法的分类方法.该方法通过引入信息熵及修正因子,缓解了数据不平衡对分类准确率及召回率造成的不良影响.实验结果表明:所提出的分类方法在准确率及召回率上与word2vec均值模型相比,分别提高7.3%及10.5%. 展开更多
关键词 词频-逆文本频率(TF-IDF) word2vec 信息熵 文本分类 机器学习 加权
下载PDF
Distribution and occurrence of trace elements in the No.14 coal from the Huolinhe mine 被引量:5
5
作者 Xiangfei Bai Yue Wang Wenhua Li 《International Journal of Coal Science & Technology》 EI 2017年第3期199-213,共15页
Optical microscopy, and scanning electron microscopy in conjunction with energy dispersed X-ray spectrometry (SEM-EDX), have been used to study the minerals and the concentrations of 12 trace elements in the No.14 c... Optical microscopy, and scanning electron microscopy in conjunction with energy dispersed X-ray spectrometry (SEM-EDX), have been used to study the minerals and the concentrations of 12 trace elements in the No.14 coal from the Huolinhe mine, Inner Mongolia China. The distribution, affinity and removability of the trace elements were studied by float-sink experiments and petrological methods. A high mineral content, dominated by clay minerals, was found in the No.14 coal from the Huolinhe mine. The concentrations of As, Sb and Hg are relatively high compared to the average values for Chinese coals. As, Cr, Hg, Li, Mn, Pb are mainly associated with the minerals while Cd, Co, Ni, Sb, and Se are evenly distributed between the minerals and the organic matter. Be and Ba are mainly distributed in the minerals with a minor proportion in the organic matter. Most elements have a low organic affinity, although Sb, Se, Co, Cd, Ni are closely integrated with the organic matter. High theoretical removabilities are indicated for most trace elements. So it may be possible to lower the concentrations of trace elements during coal preparation. 展开更多
关键词 Trace elements Modes of occurrence - Organic affinity REMOVABILITY Huolinhe coal
下载PDF
WORD NEWS IN BRIEF(February 16-28, 1993)
6
《国际展望》 北大核心 1993年第5期32-32,共1页
In his first speech on February 17 to a joint session of Congress, US President Bill Clinton outlined his wision of smaller deficits through higher income taxes on the wealthy, increased energy taxes and selected spen... In his first speech on February 17 to a joint session of Congress, US President Bill Clinton outlined his wision of smaller deficits through higher income taxes on the wealthy, increased energy taxes and selected spending cuts including a one-year freeze on federal pay. US Secretary of State Warren Christopher arrived in Cairo on February 18 to start his six nation Middle East tour which will also take him to Jordan, Syria, Saudi Arahia, Kuwait, Israel and Lebanon. 展开更多
关键词 CLINTON SPENDING session SECRETARY INCOME FEBRUARY 16-28 Israel word Warren Jordan
下载PDF
WORD NEWS IN BRIEF(April 16-30, 1992)
7
《国际展望》 北大核心 1992年第9期32-32,共1页
China announced on April 16 its decision to send military observers and engineers to join UN transitional authorities in Cambodia. The contingent left Beijing on the same day. On April 21, Peruvian President Alberto F... China announced on April 16 its decision to send military observers and engineers to join UN transitional authorities in Cambodia. The contingent left Beijing on the same day. On April 21, Peruvian President Alberto Fujimori announced a 12-month plan to return Peru to democracy. He said he never intended to create a dictatorship when he launched his militarybacked crackdown on April 5 aimed at fighting corruption, 展开更多
关键词 NEWS word NEWS IN BRIEF April 16-30
下载PDF
KEY WORDS INDEX, 《RICE SCIENCE》, VOL. 12, NO. 1-4, 2005
8
《Rice science》 SCIE 2005年第4期I0007-I0009,共3页
关键词 VOL KEY wordS INDEX RICE SCIENCE VOL.12 NO.1-4 2005 NO
下载PDF
KEY WORDS INDEX, RICE SCIENCE, VOL. 16, NOS. 1-4, 2009
9
《Rice science》 SCIE 2009年第4期I0005-I0006,共2页
关键词 gene NOS KEY wordS INDEX RICE SCIENCE VOL.16 NOS.1-4 2009 VOL
下载PDF
KEY WORDS INDEX, RICE SCIENCE, VOL. 14, NOS. 1-4, 2007
10
《Rice science》 SCIE 2007年第4期I0005-I0006,共2页
关键词 VOL KEY wordS INDEX RICE SCIENCE VOL.14 NOS.1-4 2007 gene NOS
下载PDF
KEY WORDS INDEX, RICE SCIENCE, VOL. 13, NO. 1-4, 2006
11
《Rice science》 SCIE 2006年第4期I0005-I0006,共2页
关键词 VOL KEY wordS INDEX RICE SCIENCE VOL.13 NO.1-4 2006 NO
下载PDF
融合双图卷积与门控线性单元的方面级情感分析模型
12
作者 杨春霞 吴亚雷 +1 位作者 闫晗 黄昱锟 《计算机工程》 CAS CSCD 北大核心 2024年第4期141-149,共9页
方面级情感分析旨在确定句子中给定方面的情感极性。现有的基于图神经网络的方面级情感分析存在以下2个方面的不足:忽略了不同类型的句法依存关系和语料库中的词共现信息,以及不能准确地控制情感信息流向给定方面。针对以上问题,提出融... 方面级情感分析旨在确定句子中给定方面的情感极性。现有的基于图神经网络的方面级情感分析存在以下2个方面的不足:忽略了不同类型的句法依存关系和语料库中的词共现信息,以及不能准确地控制情感信息流向给定方面。针对以上问题,提出融合双图卷积与门控线性单元(GLU)的方面级情感分析模型。该模型首先采用全局词汇图来编码语料库中的词共现信息,在词汇图和句法图上利用分类概括结构来区分各种词共现频率和不同类型的句法依存关系。然后分别在2个图上进行双层卷积,继而使用Bi Affine变换模块作为桥梁,在2个图卷积网络模块之间有效地交换相关特征,从而有效地融合句法信息和词汇信息。最后利用GLU控制情感信息流向给定方面,使模型可以更专注地分析与该方面相关的情感信息,避免不相关的情感信息影响对给定方面的情感分析结果,从而提高分析的准确性。实验结果表明,在Twitter、Laptop14、Restaurant15和Restaurant16数据集上,该模型的准确率分别达到74.82%、77.61%、82.29%和89.81%,F1值分别达到72.97%、73.52%、67.72%和73.37%,方面级情感分类效果明显优于其他基线模型。 展开更多
关键词 方面级情感分析 词共现信息 双图卷积 信息交互 门控线性单元
下载PDF
基于CiteSpace的河洛文化研究态势分析
13
作者 郭瑞青 《洛阳理工学院学报(社会科学版)》 2024年第2期6-9,共4页
河洛文化是中华民族的根文化和中国传统文化的源头。研究解读河洛文化,对于建设新时代中华民族精神家园,实现中华民族伟大复兴意义重大。基于SiteSpace科学文献计量知识图谱研究方法,以1984~2023年间中国知网收录的757篇河洛文化论文为... 河洛文化是中华民族的根文化和中国传统文化的源头。研究解读河洛文化,对于建设新时代中华民族精神家园,实现中华民族伟大复兴意义重大。基于SiteSpace科学文献计量知识图谱研究方法,以1984~2023年间中国知网收录的757篇河洛文化论文为研究对象,从“发文时间分布”“关键词共现”“关键词聚类”“关键词突显”4个方面,探究其发展历程与现状。目前,河洛文化研究虽然取得了一系列丰硕成果,但仍有需要深入拓展的学术领域。 展开更多
关键词 河洛文化 CiteSpace知识图谱分析 关键词共现 关键词聚类 关键词突显
下载PDF
高斯混合模型与文本图卷积网络结合的虚假评论识别算法
14
作者 王星 刘贵娟 陈志豪 《计算机应用》 CSCD 北大核心 2024年第2期360-368,共9页
针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度,提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评... 针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度,提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评论在训练数据上相对正常评论数不足的边信号强度;然后,考虑到信源的多样性,综合文档、词汇和评论以及非文本特征构造邻接矩阵;最后,通过Text GCN的谱分解提取邻接矩阵的虚假评论关联结构实施预测。根据国内某大型电商平台采集的126086条实际中文评论数据开展实证研究,实验结果表明,F-Text GCN识别虚假评论的F1值达到82.92%,与预训练表征模型BERT和文本卷积神经网络相比分别提升了10.46%和11.60%,相较于只使用评论文本信源的Text GCN模型F1值提升了2.94%;研究了高仿虚假评论的预测错误率,在支持向量机(SVM)作用后难识别的评论样本上尝试二次识别,F-Text GCN整体预测准确率可达94.71%,相较于Text GCN和SVM,在识别准确率上分别提升了2.91%和14.54%。研究发现,虚假评论的二阶图邻居结构显示出较强的干预消费者决策的词汇,这表明所提算法特别适用于提取用于虚假评论检测的长程词语搭配结构和全局句子特征模式变化的场景。 展开更多
关键词 高斯混合模型 虚假评论识别 文本图卷积神经网络 邻接矩阵 词汇共现网络
下载PDF
融合共现和语义信息的药对提取方法研究及应用
15
作者 唐静 杨涛 +1 位作者 朱垚 胡孔法 《世界科学技术-中医药现代化》 CSCD 北大核心 2024年第1期88-98,共11页
目的针对处方数据特点,提出一种融合共现和语义信息的药对提取算法。方法将处方数据转化为矩阵数据,计算药物之间的关联信息作为初始筛选指标,再根据处方数据构建词向量,计算药物之间的语义相似度,作为第二筛选指标,从而提取潜在药对。... 目的针对处方数据特点,提出一种融合共现和语义信息的药对提取算法。方法将处方数据转化为矩阵数据,计算药物之间的关联信息作为初始筛选指标,再根据处方数据构建词向量,计算药物之间的语义相似度,作为第二筛选指标,从而提取潜在药对。将本文算法与经典的Apriori算法分别对1090条肺癌门诊处方用药数据进行实验,对比分析实验提取结果,从而验证本算法提取的有效性及实用性。结果与Apriori算法相比,本算法提取药对效果较好,可以在药物频次相差较大的情况下合理地缩小潜在药对选择范围,此外对阈值结果进行比对,针对本文数据根据数量变化与专家经验,分别推出两组建议阈值,在推荐阈值设置的范围下分别成功提取出医案中的88组与33组药对。结论词频结合语义信息用于筛选潜在药对的方法是可行且有效的,可为中医临床处方用药经验挖掘提供方法参考。 展开更多
关键词 药对筛选 药物共现 语义信息 词向量 数据挖掘
下载PDF
基于ICE-LDA模型的中英文跨语言话题发现研究 被引量:7
16
作者 陈兴蜀 罗梁 +2 位作者 王海舟 王文贤 高悦 《工程科学与技术》 EI CAS CSCD 北大核心 2017年第2期100-106,共7页
近年来互联网在全球化的大背景下飞速发展,针对跨语言的网络数据挖掘成为国内外舆情分析的热点问题,有效实时地检测中英文网络环境下的热点话题对舆情的掌握和舆情的发展有着至关重要的作用。网络新闻作为网络信息舆情中的重要组成部分... 近年来互联网在全球化的大背景下飞速发展,针对跨语言的网络数据挖掘成为国内外舆情分析的热点问题,有效实时地检测中英文网络环境下的热点话题对舆情的掌握和舆情的发展有着至关重要的作用。网络新闻作为网络信息舆情中的重要组成部分,由于互联网的大规模普及而成为人们方便快捷获知信息的重要来源。首先,本文选择中文与英文的网络新闻作为数据源进行采集,提出了在LDA模型上改进的ICE-LDA模型进行跨英汉语言网络环境下的共现话题发现。采用话题向量化的方式,对建模产生的话题进行JS距离检测和话题文本分布相似度度量。其次,本文分别对爬虫采集到的中英混合新闻数据分别构建可对比平行语料集和非可对比语料集进行话题建模,在建模过程中利用TF-IDF算法对文档提取特征词去噪,提高话题特征表示去除无意义噪音词。最后,分别采用两种不同的话题向量化方式进行跨语言的共现话题发现建模。实验结果表明,在本文设计的爬虫采集构建的真实数据集上,改进后的话题模型不仅能够在不需要先验话题对的情况下对可对比语料集进行跨语言共现话题进行发现,而且能够对语料不平衡的情况进行共现话题发现。 展开更多
关键词 话题发现 跨英汉文本 ICE-LDA模型 TF-IDF特征提取 共现话题
下载PDF
基于节点词全句共现的动态词义消歧研究
17
作者 闫亚亚 邢红兵 《语言科学》 CSSCI 北大核心 2024年第4期354-364,共11页
文章根据词义消歧即将词义回归语境这一特性,提出了一种基于节点词全句共现的动态词义消歧方法。该方法首先以全句为窗口限定节点词的使用语境,其次使用互信息(MI)、卡方检验(χ^(2)检验)和相对词序比(RRWR)等统计方法抽取节点词的语义... 文章根据词义消歧即将词义回归语境这一特性,提出了一种基于节点词全句共现的动态词义消歧方法。该方法首先以全句为窗口限定节点词的使用语境,其次使用互信息(MI)、卡方检验(χ^(2)检验)和相对词序比(RRWR)等统计方法抽取节点词的语义相关词,并参照《同义词词林》构建相关词语义范畴库,最后以共现频数作为加权系数,依靠单义词语义聚类分布率对中低频共现多义词进行消歧。采用该方法对与“美丽”共现的1030个小于7义类的多义词进行消歧的测试试验中取得了85.2%的正确率。 展开更多
关键词 节点词 全句共现 词义消歧 语义聚类 无指导学习
下载PDF
两阶段问答范式的生物医学事件触发词检测
18
作者 行帅 熊玉洁 +1 位作者 苏前敏 黄继汉 《计算机工程与应用》 CSCD 北大核心 2024年第10期121-131,共11页
现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识... 现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识别阶段,采用基于句法距离的注意力捕获更有意义的上下文特征,排除无关信息的干扰;为了有效利用实体中的潜在特征,采用全局统计的单词-实体-事件共现特征,指导事件类型感知注意力挖掘词与事件之间的强关联性。在触发词定位阶段,根据识别出的事件类型,制定问题回答该事件对应的触发词索引,从而利用丰富的问答数据库实现数据增强。在MLEE语料库上的结果表明,两阶段问答范式、句法距离和事件类型感知注意力都有效地提升了模型性能,所提出的模型取得了81.39%的F1分数,并在多个事件类型上的详细结果均优于其他基线模型。 展开更多
关键词 生物医学事件 触发词检测 句法距离 单词-实体-事件共现特征 两阶段问答范式
下载PDF
国内图书馆采访研究论文的计量分析:2000-2010 被引量:2
19
作者 朱一红 周卫华 汤建民 《图书馆论坛》 CSSCI 北大核心 2012年第1期99-103,107,共6页
运用词频统计、共现分析及信息可视化等文献计量学方法,对2000-2010年间CNKI有关图书馆采访研究论文的年度发文量、期刊分布、作者发文量、基金资助分布和关键词词频变化等进行统计分析,探索图书馆采访研究的演变过程及发展态势,为图书... 运用词频统计、共现分析及信息可视化等文献计量学方法,对2000-2010年间CNKI有关图书馆采访研究论文的年度发文量、期刊分布、作者发文量、基金资助分布和关键词词频变化等进行统计分析,探索图书馆采访研究的演变过程及发展态势,为图书馆采访的深入研究和拓展提供有益启示。 展开更多
关键词 图书馆采访 词频统计 共现分析 信息可视化
下载PDF
2010-2016年大数据与健康相关SCI论文的聚类分析 被引量:4
20
作者 范婷 娄岩 《中国数字医学》 2017年第1期3-5,8,共4页
目的:检索大数据与健康相关的SCI论文,分析当前该领域的研究方向。方法:对Web of Science^(TM)核心合集数据库中该主题的SCI论文进行文献计量学分析,统计频次大于等于28次的高频主题词并生成共现矩阵,使用SPSS软件进行聚类分析,进而获... 目的:检索大数据与健康相关的SCI论文,分析当前该领域的研究方向。方法:对Web of Science^(TM)核心合集数据库中该主题的SCI论文进行文献计量学分析,统计频次大于等于28次的高频主题词并生成共现矩阵,使用SPSS软件进行聚类分析,进而获得该领域的研究热点。结果:经检索得出相关论文979篇,高频主题词14个,获得该领域六个主要研究热点。结论:近年来有关大数据与健康相关的SCI论文主要研究方向包括:人口患病率研究、儿童健康领域研究、卫生保健领域研究、护理质量的效果与控制、健康和风险研究、疾病死亡率研究。 展开更多
关键词 大数据 共现矩阵 聚类分析
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部