期刊文献+
共找到1,099篇文章
< 1 2 55 >
每页显示 20 50 100
Vari-gram language model based on word clustering
1
作者 袁里驰 《Journal of Central South University》 SCIE EI CAS 2012年第4期1057-1062,共6页
Category-based statistic language model is an important method to solve the problem of sparse data.But there are two bottlenecks:1) The problem of word clustering.It is hard to find a suitable clustering method with g... Category-based statistic language model is an important method to solve the problem of sparse data.But there are two bottlenecks:1) The problem of word clustering.It is hard to find a suitable clustering method with good performance and less computation.2) Class-based method always loses the prediction ability to adapt the text in different domains.In order to solve above problems,a definition of word similarity by utilizing mutual information was presented.Based on word similarity,the definition of word set similarity was given.Experiments show that word clustering algorithm based on similarity is better than conventional greedy clustering method in speed and performance,and the perplexity is reduced from 283 to 218.At the same time,an absolute weighted difference method was presented and was used to construct vari-gram language model which has good prediction ability.The perplexity of vari-gram model is reduced from 234.65 to 219.14 on Chinese corpora,and is reduced from 195.56 to 184.25 on English corpora compared with category-based model. 展开更多
关键词 统计语言模型 词聚类 词语相似度 聚类分析方法 预测能力 聚类方法 聚类算法 相似性
下载PDF
Research status and hotspots of economic evaluation in nursing by co-word clustering analysis
2
作者 Yao-Ji Liao Guo-Zhen Gao 《Frontiers of Nursing》 CAS 2019年第3期233-239,共7页
Objective:The aim of this study is to discover research status and hotspots of economic evaluation(EE)in nursing area using co-word cluster analysis.Methods:Medical Subject Heading(MeSH)term“cost–benefit analysis”w... Objective:The aim of this study is to discover research status and hotspots of economic evaluation(EE)in nursing area using co-word cluster analysis.Methods:Medical Subject Heading(MeSH)term“cost–benefit analysis”was searched in PubMed and nursing journals were limited by the function of filter.The information of author,country,year,journal,and keywords of collected paper was extracted and exported to Bicomb 2.0 system,where high-frequency terms and other data could be further mined.SPSS 19.0 was used for cluster analysis to generate dendrogram.Results:In all,3,020 articles were found and 10,573 MeSH terms were detected;among them,1,909 were MeSH major topics and generated 42 high-frequency terms.The consequence of dendrogram showed seven clusters,representing seven research hotspots:skin administration,infection prevention,education program,nurse education and management,EE research,neoplasm patient,and extension of nurse function.Conclusions:Nursing EE research involved multiple aspects in nursing area,which is an important indicator for decision-making.Although the number of papers is increasing,the quality of study is not promising.Therefore,further study may be required to detect nurses’knowledge of economic analysis method and their attitude to apply it into nursing research.More nursing economics course could carry out in nursing school or hospitals. 展开更多
关键词 cost–benefit ANALYSIS co-word clustering ANALYSIS ECONOMIC evaluation NURSING NURSING education
下载PDF
Co-word clustering analysis for nursing safety management research focuses by PubMed 被引量:1
3
作者 Yong-Hong Deng Xue-Yun Hao +1 位作者 Hui Zhang Guo-Min Song 《TMR Integrative Nursing》 2018年第3期108-114,共7页
目的:基于Pubmed数据库分析护理安全管理研究的现状及热点。方法:以“safety management”为主题词,检索2007年9月至2017年9月PubMed数据库中有关护理安全管理的文献,并使用Bicomb软件、SPSS20.0对主题词进行共词聚类分析。结果:... 目的:基于Pubmed数据库分析护理安全管理研究的现状及热点。方法:以“safety management”为主题词,检索2007年9月至2017年9月PubMed数据库中有关护理安全管理的文献,并使用Bicomb软件、SPSS20.0对主题词进行共词聚类分析。结果:共获得文献2353篇,提取高频主题词19个,占总频次的27.50%,通过对高频主题词词篇矩阵进行共词聚类,得到5个研究热点:护理安全文化的研究、团队协作促进护理安全、护理安全管理实践、护理人员工作场所暴力以及护理安全质量评价标准的相关研究。结论:对近10年护理安全管理研究热点的分析有助于了解该领域研究重点及发展趋势,为随后护理安全管理研究及实践提供参考。 展开更多
关键词 护理安全管理 聚类分析 协同词分析 研究重点
下载PDF
基于Word Smith软件的典型语料库文体学分析
4
作者 马瑞 马艳 《中阿科技论坛(中英文)》 2024年第7期120-124,共5页
文章运用WordSmith 8.0对艾丽斯·沃克小说《紫色》中的关键词和特殊词簇进行分析,揭示了《紫色》在词汇上的整体分布特征,并指出文中所使用的词汇与句式均与主人公非裔女性这一人物形象相吻合。通过Word Smith 8.0检索发现,沃克小... 文章运用WordSmith 8.0对艾丽斯·沃克小说《紫色》中的关键词和特殊词簇进行分析,揭示了《紫色》在词汇上的整体分布特征,并指出文中所使用的词汇与句式均与主人公非裔女性这一人物形象相吻合。通过Word Smith 8.0检索发现,沃克小说中的关键词和词簇搭配对于促进故事情节和人物刻画方面有重要作用。研究结果表明,语料库文体学有助于学者发现以往研究中忽视的深层文本含义,是对以往《紫色》文学定性研究结果的再次验证,是定性研究和定量研究的积极结合,也是对学界“经典重读”的积极响应。 展开更多
关键词 语料库文体学 艾丽斯·沃克 词簇 《紫色》
下载PDF
国内亚健康状态中医临床试验的文献计量学研究
5
作者 孙璇 王哲 +6 位作者 田春颖 王东军 关媛媛 田之魁 朱青青 周宗慧 王泓午 《天津中医药大学学报》 CAS 2024年第6期538-543,共6页
[目的]探讨国内亚健康状态中医临床试验方法、干预措施及目前研究热点分布领域,为日后临床研究及干预提供参考。[方法]采用循证医学定性系统综述研究方法,检索中国知网(CNKI)、维普(VIP)及万方数据库(WANFANG DATA)文献,应用Note Expres... [目的]探讨国内亚健康状态中医临床试验方法、干预措施及目前研究热点分布领域,为日后临床研究及干预提供参考。[方法]采用循证医学定性系统综述研究方法,检索中国知网(CNKI)、维普(VIP)及万方数据库(WANFANG DATA)文献,应用Note Express 3.2.0软件结合人工阅读文章的方式对检索的文献进行筛选,分别从文献研究方法、干预措施、有效率、受试人群、发表时间、核心作者、期刊分布、基金分布等方面进行定性系统综述分析。[结果]纳入141篇文献,近5年发文量明显降低,可见近几年国内对亚健康状态中医临床试验的关注度呈下降趋势;临床试验研究方法以随机对照试验居多,占总文献的78.72%,但阐明随机化方法的仅占32.43%,且样本含量普遍较低,以致文章可信度低;共有38种结局指标,累计频次279次,说明中医临床试验已有较成熟体系;涉及作者389位,根据普赖斯定律尚未形成核心作者群;涉及期刊67种,尚未形成核心期刊;省级基金项目最多,国家级次之;高频关键词分析,亚健康仍为热点词,其次为亚健康状态,临床疗效;受试人群有25种,较为广泛。干预措施以中药治疗者居多,其次为中医综合疗法、中医推拿法,由此可见,中药在本研究所提及的众多干预措施中是认可度最高的。[结论]研究表明,亚健康状态中医临床试验研究热度有所降低,但受试人群比较广,相对具有代表性,现亚健康人群较多,应重视亚健康状态临床试验的研究及研究的严谨性。 展开更多
关键词 亚健康状态 中医临床试验 文献计量学 共词聚类分析
下载PDF
基于组合相似度动态聚类和词熵的网络话题在线检测
6
作者 郭慧 王亚楠 +2 位作者 王欣艳 魏艺泽 王养廷 《情报杂志》 北大核心 2024年第5期159-166,共8页
[研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题... [研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题的实体相似度,再取文本词向量与话题中心余弦相似度的最大值作为词向量相似度,二者结合判断文本所属话题。在聚类过程中利用时间窗口策略实现话题中心和成员文本的动态更新。同时,计算文本词熵,生成话题的词熵和列表,实现话题主题词提取和演化跟踪。实验以新冠疫情新闻为数据实现话题在线检测,并展示了话题主题词的演化和跟踪过程。[研究结论]实验表明,与传统相似度计算方法相比,组合相似度能够获得更好的聚类效果,聚类过程中提取出的话题主题词也正确地反映了原始数据的热点话题内容。 展开更多
关键词 网络话题 在线话题检测 增量式聚类 主题词提取 组合相似度 动态聚类算法 词熵
下载PDF
基于战略坐标图的我国“互联网+护理服务”研究主题分析
7
作者 张锦锦 姜虹 +3 位作者 刘胜娟 权月 王晓萍 田丽 《天津护理》 2024年第1期55-59,共5页
目的:分析国内“互联网+护理服务”研究主题和发展态势,以期为“互联网+护理服务”高质量、可持续发展提供参考。方法:以“互联网+护理服务”为主题,检索建库至2022年12月期间中国知网收录的文献,使用文献计量学分析软件BICOMB进行计量... 目的:分析国内“互联网+护理服务”研究主题和发展态势,以期为“互联网+护理服务”高质量、可持续发展提供参考。方法:以“互联网+护理服务”为主题,检索建库至2022年12月期间中国知网收录的文献,使用文献计量学分析软件BICOMB进行计量分析,使用统计分析软件SPSS进行聚类分析,绘制研究主题战略坐标图,揭示核心主题及其发展态势。结果:共纳入327篇文献,论文发文量快速增加,期刊分布相对集中。通过关键词聚类出9大研究主题,其中核心且成熟的主题是“互联网+护理服务”护患体验、“互联网+护理服务”护患双方认知意愿需求以及老年慢性病延续护理;核心不成熟主题是“互联网+护理服务”质量;待发展主题是上门服务、“互联网+护理服务”现状及影响因素、“互联网+护理服务”风险防控以及护士培训。结论:国内“互联网+护理服务”研究目前处于快速发展阶段,受到众多研究者的关注。各研究主题发展阶段不同,逐渐向“互联网+护理服务”内涵发展。研究者应关注热点主题的进展,进一步推动风险防控、质量评价等发展潜力主题的研究。 展开更多
关键词 互联网+护理服务 共词聚类分析 主题战略坐标
下载PDF
国内智慧教育领域研究热点与趋势 被引量:2
8
作者 吴军其 张逵 《长春师范大学学报》 2024年第1期121-128,共8页
近年来,智慧教育的兴起引起人们的广泛关注。本文以2013—2022年CSSCI数据库中关于智慧教育的572篇文献的高频关键词为原始数据,运用Bibexcel、Ucinet和SPSS软件对高频关键词数据进行共词分析、社会网络分析、多维尺度分析和聚类分析,... 近年来,智慧教育的兴起引起人们的广泛关注。本文以2013—2022年CSSCI数据库中关于智慧教育的572篇文献的高频关键词为原始数据,运用Bibexcel、Ucinet和SPSS软件对高频关键词数据进行共词分析、社会网络分析、多维尺度分析和聚类分析,揭示智慧教育领域的研究热点和发展趋势。研究结果显示智慧教育研究的热点主要体现在:教育信息化、教育现代化等政策、战略;智慧教育的内涵、特征、功能等;智慧教育的体系架构与智慧环境建设等;智慧教育的技术支撑及实践。本文还基于智慧教育研究现状,提出未来发展需要关注的四个方向。 展开更多
关键词 智慧教育 共词分析 社会网络分析 聚类分析 多维尺度分析
下载PDF
基于CiteSpace的河洛文化研究态势分析
9
作者 郭瑞青 《洛阳理工学院学报(社会科学版)》 2024年第2期6-9,共4页
河洛文化是中华民族的根文化和中国传统文化的源头。研究解读河洛文化,对于建设新时代中华民族精神家园,实现中华民族伟大复兴意义重大。基于SiteSpace科学文献计量知识图谱研究方法,以1984~2023年间中国知网收录的757篇河洛文化论文为... 河洛文化是中华民族的根文化和中国传统文化的源头。研究解读河洛文化,对于建设新时代中华民族精神家园,实现中华民族伟大复兴意义重大。基于SiteSpace科学文献计量知识图谱研究方法,以1984~2023年间中国知网收录的757篇河洛文化论文为研究对象,从“发文时间分布”“关键词共现”“关键词聚类”“关键词突显”4个方面,探究其发展历程与现状。目前,河洛文化研究虽然取得了一系列丰硕成果,但仍有需要深入拓展的学术领域。 展开更多
关键词 河洛文化 CiteSpace知识图谱分析 关键词共现 关键词聚类 关键词突显
下载PDF
乡村环境治理:制度、技术与效能——基于中央政策文本分析
10
作者 邓学衷 唐滔 《智慧农业导刊》 2024年第13期82-86,共5页
基于新公共治理理论的“制度-技术-效能”框架,运用词频和词频聚类分析法,对1978—2022年中国中央政府机构关于乡村环境治理政策文件进行文本分析发现,乡村环境治理政策的阶段性演变逐步聚焦到治理效能,政策的制度设计走向系统化和协调... 基于新公共治理理论的“制度-技术-效能”框架,运用词频和词频聚类分析法,对1978—2022年中国中央政府机构关于乡村环境治理政策文件进行文本分析发现,乡村环境治理政策的阶段性演变逐步聚焦到治理效能,政策的制度设计走向系统化和协调性,技术工具转向开发和运用适用技术进行精细化治理,以实现乡村绿色发展和全面振兴的效能目标。为此,乡村环境治理实践应立足于治理区域的实际情况,强化治理机制的协同效能、提升数字化治理效能、增强适应性治理效能。 展开更多
关键词 乡村环境治理 “制度-技术-效能”分析框架 政策文本 治理效能 词频聚类分析法
下载PDF
基于隐含空间模型降维和LDA模型的学科主题识别研究
11
作者 王婧 武帅 《情报探索》 2024年第2期1-11,共11页
【目的/意义】现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。【方法/过程】首先,运用传统... 【目的/意义】现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。【方法/过程】首先,运用传统LDA模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。【结果/结论】提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。 展开更多
关键词 学科主题识别 LDA主题挖掘 图书情报与档案管理学科词库 隐含位置聚类模型 共词网络
下载PDF
利用word2vec对中文词进行聚类的研究 被引量:29
12
作者 郑文超 徐鹏 《软件》 2013年第12期160-162,共3页
文本聚类在数据挖掘和机器学习中发挥着重要的作用,该技术经过多年的发展,已产生了一系列的理论成果。本文在前人研究成果的基础上,探索了一种新的中文聚类方法。本文先提出了一种中文分词算法,用来将中文文本分割成独立的词语。再对处... 文本聚类在数据挖掘和机器学习中发挥着重要的作用,该技术经过多年的发展,已产生了一系列的理论成果。本文在前人研究成果的基础上,探索了一种新的中文聚类方法。本文先提出了一种中文分词算法,用来将中文文本分割成独立的词语。再对处理后的语料使用Word2Vec工具集,应用深度神经网络算法,转化为对应的词向量。最后,将词向量之间的余弦距离定义为词之间的相似度,通过使用K-means聚类算法将获取的词向量进行聚类,最终可以返回语料库中同输入词语语意最接近的词。本文从网络上抓取了2012年的网络新闻数据,应用上述方法进行了实验,取得了不错的实验效果。 展开更多
关键词 数据挖掘 聚类 分词 词向量 神经网络
下载PDF
苗语东部方言“非叠音状词”问题讨论
13
作者 吴琳 麻勇斌 《贵州师范学院学报》 2024年第1期69-77,共9页
非叠音状词,是状词的一个种类,由两个声、韵、调完全不同的音节连在一起组成,是结构稳定和功能明确的固定语词。大多数学者认为,苗语东部方言存在非叠音状词,这一观点可能有一定的瑕疵,因为其所列举的非叠音状词,多数是由一个单音节拟... 非叠音状词,是状词的一个种类,由两个声、韵、调完全不同的音节连在一起组成,是结构稳定和功能明确的固定语词。大多数学者认为,苗语东部方言存在非叠音状词,这一观点可能有一定的瑕疵,因为其所列举的非叠音状词,多数是由一个单音节拟声词与一个无语义的词前缀组合而成,少量由两个声、韵、调不同的拟声词组合而成,这些语词的结构都存在不稳定性。而苗语东部方言不存在结构固定的单词意义上的非叠音状词,但存在一些以某个拟声词为核心的结构不太稳定的同义非叠音状词丛。因此,有必要对其进行详细探讨。 展开更多
关键词 苗语东部方言 非叠音状词 同义不稳定非叠音状词丛
下载PDF
首辅音r的音义理据性研究
14
作者 关秋红 范森 朱元海 《黑河学院学报》 2024年第1期124-126,共3页
根据拟象理论和卷舌摩擦音/r/的发音特征,由4个音义联想起点自然引出20个语义相关的词簇,囊括了几乎所有r开头的常见英语单词和词根。这种首辅音存在的音义联想关系可能暗示语言原始词的理据性。
关键词 卷舌摩擦音 语义词簇 拟象说 语音理据性
下载PDF
教育数字化转型研究热点与演进趋势分析——基于C0-ocurrence可视化
15
作者 石晓芬 石贤超 +1 位作者 郑俊杰 尹东江 《遵义师范学院学报》 2024年第1期139-145,共7页
文章选取中国知网数据库296篇CSSCI来源期刊教育数字研究文献数据,采用科学计量方法,借助C0-ocurrence(简称Cooc)可视化软件,采取共词分析、聚类分析及突变监测分析法,分别绘制教育数字化转型研究领域的发文量、研究机构合作、作者合作... 文章选取中国知网数据库296篇CSSCI来源期刊教育数字研究文献数据,采用科学计量方法,借助C0-ocurrence(简称Cooc)可视化软件,采取共词分析、聚类分析及突变监测分析法,分别绘制教育数字化转型研究领域的发文量、研究机构合作、作者合作和关键词聚类等相关知识图谱,通过描绘知识图谱深入探究我国教育数字化转型研究热点和未来研究方向。我国教育数字化转型于2011年从出版行业萌芽,2019年之前发文量增长缓慢;研究以清华大学、华东师范大学和华中师范大学为主。其他地区研究零散;研究领域集中于高等教育,职业教育、基础教育和终身教育领域相对较少。笔者基于教育数字化转型研究现状,对未来该领域研究动向进行预测,并提出研究建议。 展开更多
关键词 教育数字化转型 共词分析 聚类分析 研究热点 演进趋势
下载PDF
基于Word2Vec模型特征扩展的Web搜索结果聚类性能的改进 被引量:5
16
作者 杨楠 李亚平 《计算机应用》 CSCD 北大核心 2019年第6期1701-1706,共6页
对于用户泛化和模糊的查询,将Web搜索引擎返回的列表内容聚类处理,便于用户有效查找感兴趣的内容。由于返回的列表由称为片段(snippet)的短文本组成,而传统的单词频率-逆文档频率(TF-IDF)特征选择模型不能适用于稀疏的短文本,使得聚类... 对于用户泛化和模糊的查询,将Web搜索引擎返回的列表内容聚类处理,便于用户有效查找感兴趣的内容。由于返回的列表由称为片段(snippet)的短文本组成,而传统的单词频率-逆文档频率(TF-IDF)特征选择模型不能适用于稀疏的短文本,使得聚类性能下降。一个有效的方法就是通过一个外部的知识库对短文本进行扩展。受到基于神经网络词表示方法的启发,提出了通过词嵌入技术的Word2Vec模型对短文本扩展,即采用Word2Vec模型的TopN个最相似的单词用于对片段(snippet)的扩展,扩展文档使得TF-IDF模型特征选择得到聚类性能的提高。同时考虑到通用性单词造成的噪声引入,对扩展文档的TF-IDF矩阵进行了词频权重修正。实验在两个公开数据集ODP239和SearchSnippets上完成,将所提方法和纯snippet无扩展的方法、基于Wordnet的特征扩展方法和基于Wikipedia的特征扩展方法进行了对比。实验结果表明,所提方法在聚类性能方面优于对比方法。 展开更多
关键词 特征扩展 片段 词嵌入技术 搜索结果聚类
下载PDF
基于表示学习的告警数据流压缩算法
17
作者 阴振生 陈佳 +1 位作者 王鹏 汪卫 《计算机应用与软件》 北大核心 2024年第7期34-41,共8页
大型在线服务系统的告警数量巨大且关联关系复杂,运维人员进行故障诊断的难度较大。为此,提出一种基于表示学习的告警数据流压缩算法。该算法包含离线学习和在线压缩阶段:离线学习阶段,采用嵌入技术对告警内容的语义信息及服务组件的拓... 大型在线服务系统的告警数量巨大且关联关系复杂,运维人员进行故障诊断的难度较大。为此,提出一种基于表示学习的告警数据流压缩算法。该算法包含离线学习和在线压缩阶段:离线学习阶段,采用嵌入技术对告警内容的语义信息及服务组件的拓扑信息进行表示学习;在线压缩阶段,采用流式聚类方法对表示学习得到的告警向量进行聚合并生成告警事件。在合成数据集与真实数据集上的实验表明,该算法的各项评价指标均优于已有算法,更能满足告警数据流压缩的实时性和有效性要求。 展开更多
关键词 在线服务系统 告警数据流压缩 表示学习 词嵌入 图嵌入 流式聚类
下载PDF
基于战略坐标图的共同富裕研究热点分析
18
作者 李征 叶竞洁 《老区建设》 2024年第1期35-44,共10页
共同富裕是一个内涵淹博、辐射宽阔的理论和实践话题,既需要宏观辨识,也需要微观探析,厘清共同富裕领域的研究现状,有助于更好了解其特征和研究趋势。以中国知网(CNKI)中的1844篇共同富裕领域的期刊文献为数据来源,运用Bicomb和SPSS软... 共同富裕是一个内涵淹博、辐射宽阔的理论和实践话题,既需要宏观辨识,也需要微观探析,厘清共同富裕领域的研究现状,有助于更好了解其特征和研究趋势。以中国知网(CNKI)中的1844篇共同富裕领域的期刊文献为数据来源,运用Bicomb和SPSS软件从发文量统计、高频关键词共现、聚类等方面进行现状分析,并绘制战略坐标图直观展示各类团的发展趋势。研究发现:收入分配制度、高质量发展、社会主义等关键词的频次位居前列,受到较多的关注;“高质量发展促进共同富裕”“社会主义本质”等类团是当前共同富裕领域较为成熟的研究热点。在未来的研究中,应加强对共同富裕领域核心问题的研究,深入挖掘战略坐标中的潜在型区域,并注重实证研究与案例分析。 展开更多
关键词 共同富裕 共词聚类分析 战略坐标图 研究热点
下载PDF
基于深度学习的医院海量档案特征快速查询算法研究
19
作者 尹声声 《自动化技术与应用》 2024年第5期114-117,共4页
为提高档案特征查询结果的查全率和查准率,提出基于深度学习的医院海量档案特征快速查询算法。通过深度学习,建立深度卷积神经网络,采用文本聚类算法,划分档案文本类别,利用图搜图的方式,通过神经网络,提取指定档案的图像特征,得到图像... 为提高档案特征查询结果的查全率和查准率,提出基于深度学习的医院海量档案特征快速查询算法。通过深度学习,建立深度卷积神经网络,采用文本聚类算法,划分档案文本类别,利用图搜图的方式,通过神经网络,提取指定档案的图像特征,得到图像内容对应的文本注释,搜索该文本归属簇集,将簇集内所有文本的特征词和主题作为文本特征,将文本数据匹配到的图像作为图形特征。选取医学领域公共数据集作为实验数据,实验结果表明,针对海量档案文本特征和图像特征,设计算法提高了特征查询查全率和查准率,档案特征快速查询精度更优。 展开更多
关键词 深度学习 档案特征 查询算法 神经网络 文本聚类 特征词
下载PDF
多词共现分析方法在暴雨-地质灾害应急任务研究中的应用
20
作者 杨炼卿 许铭 +3 位作者 马成龙 戴彩岩 赵红 龙昭岳 《灾害学》 CSCD 北大核心 2024年第2期208-211,234,共5页
为快速制定救援行动方案,提出了一种多词共现分析方法将灾害应急任务从历史发生的灾害案例中提取出来的方法。该方法首先利用K-means聚类算法将预处理好的文本进行聚类分析,归纳出应急任务集。然后利用关联规则挖掘Apriori算法提取案例... 为快速制定救援行动方案,提出了一种多词共现分析方法将灾害应急任务从历史发生的灾害案例中提取出来的方法。该方法首先利用K-means聚类算法将预处理好的文本进行聚类分析,归纳出应急任务集。然后利用关联规则挖掘Apriori算法提取案例文本中的频繁项集作为共现词集,分析解释共现词集与应急任务之间的关系。最后,运用Gephi软件将共现词语网络可视化,进一步分析应急任务中要素之间的相关关系。以暴雨引发的地质灾害事故为例,对该方法进行了实验,结果表明该方法能有效的将暴雨-地质灾害事故案例文本中的应急任务提取出来,并通过网络可视化分析发现,在救援过程中,应急任务之间是联动配合的一个体系,协调好各个应急任务能缩短应急响应的时间,为制定或完善救援行动方案提供参考。 展开更多
关键词 暴雨-地质灾害 应急任务 文本挖掘 多词共现 关联规则挖掘 K-MEANS聚类算法
下载PDF
上一页 1 2 55 下一页 到第
使用帮助 返回顶部