期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于百度百科与文本分类的网络文本语义主题抽取方法 被引量:9
1
作者 陈叶旺 王华珍 +2 位作者 李海波 钟必能 陈锻生 《小型微型计算机系统》 CSCD 北大核心 2012年第12期2605-2610,共6页
网络上存在海量中文文本资源,其中许多具有稀疏性与不规范性,难于处理与挖掘.百度百科是一个丰富的与社会热点、网络流行紧密相关的动态中文知识库,基于百度百科本文提出一种网络文本语义主题抽取方法.首先利用百度百科的知识关系将文... 网络上存在海量中文文本资源,其中许多具有稀疏性与不规范性,难于处理与挖掘.百度百科是一个丰富的与社会热点、网络流行紧密相关的动态中文知识库,基于百度百科本文提出一种网络文本语义主题抽取方法.首先利用百度百科的知识关系将文本映射到侯选语义主题空间中,根据训练数据进行分类,找出最大可能的分类,选出属于该分类的候选语义主题.最后提出根据语义离散度确定最终语义主题.在两个数据集上的实验结果表明,该方法不仅对网络不规范文本而且对于规则文本都具有较好的语义主题抽取性能. 展开更多
关键词 百度百科 语义主题 主题抽取 语义离散度
下载PDF
基于潜语义主题加强的跨媒体检索算法 被引量:11
2
作者 黄育 张鸿 《计算机应用》 CSCD 北大核心 2017年第4期1061-1064,1110,共5页
针对不同模态数据对相同语义主题表达存在差异性,以及传统跨媒体检索算法忽略了不同模态数据能以合作的方式探索数据的内在语义信息等问题,提出了一种新的基于潜语义主题加强的跨媒体检索(LSTR)算法。首先,利用隐狄利克雷分布(LDA)模型... 针对不同模态数据对相同语义主题表达存在差异性,以及传统跨媒体检索算法忽略了不同模态数据能以合作的方式探索数据的内在语义信息等问题,提出了一种新的基于潜语义主题加强的跨媒体检索(LSTR)算法。首先,利用隐狄利克雷分布(LDA)模型构造文本语义空间,然后以词袋(Bo W)模型来表达文本对应的图像;其次,使用多分类逻辑回归对图像和文本分类,用得到的基于多分类的后验概率表示文本和图像的潜语义主题;最后,利用文本潜语义主题去正则化图像的潜语义主题,使图像的潜语义主题得到加强,同时使它们之间的语义关联最大化。在Wikipedia数据集上,文本检索图像和图像检索文本的平均查准率为57.0%,比典型相关性分析(CCA)、SM(Semantic Matching)、SCM(Semantic Correlation Matching)算法的平均查准率分别提高了35.1%、34.8%、32.1%。实验结果表明LSTR算法能有效地提高跨媒体检索的平均查准率。 展开更多
关键词 跨媒体检索 语义主题 多分类逻辑回归 后验概率 正则化
下载PDF
基于视觉语义主题的图像自动标注 被引量:3
3
作者 孙君顶 李海华 靳姣林 《测控技术》 CSCD 2016年第12期11-15,共5页
为减小图像检索中语义鸿沟的影响,提出了一种基于视觉语义主题的图像自动标注方法。首先,提取图像前景与背景区域,并分别进行预处理;然后,基于概率潜在语义分析与高斯混合模型建立图像底层特征、视觉语义主题与标注关键词间的联系,并基... 为减小图像检索中语义鸿沟的影响,提出了一种基于视觉语义主题的图像自动标注方法。首先,提取图像前景与背景区域,并分别进行预处理;然后,基于概率潜在语义分析与高斯混合模型建立图像底层特征、视觉语义主题与标注关键词间的联系,并基于该模型实现对图像的自动标注。采用corel 5数据库进行验证,实验结果证明了本文方法的有效性。 展开更多
关键词 视觉语义主题 概率潜在语义分析 高斯混合模型 图像自动标注
下载PDF
基于语义主题相似度的Web教育资源查询方法 被引量:1
4
作者 王杨 尤科本 +3 位作者 吴梦婷 虞威 陈付龙 赵传信 《计算机技术与发展》 2014年第2期104-106,110,共4页
针对传统Web教育主体难以获得高可用教育资源的问题,提出了一种面向语义主题相似度的Web教育资源查询方法。该方法建立了本体概念语义网络(Ontology Concept Semantic Network,OCSN),在此基础上,设计了基于语义主题相似度匹配的概念检... 针对传统Web教育主体难以获得高可用教育资源的问题,提出了一种面向语义主题相似度的Web教育资源查询方法。该方法建立了本体概念语义网络(Ontology Concept Semantic Network,OCSN),在此基础上,设计了基于语义主题相似度匹配的概念检索方法:在检索前主动将教育资源根据其语义和主题组织到本体概念语义网络中,然后建立一个基于语义特性的Web教育资源发现的垂直搜索引擎,并通过构造满足条件的相似度函数,将对应的语义距离映射为相似度,有效地提高了查询效率。实验结果表明此方法能够提高Web教育资源的查准率和查全率。 展开更多
关键词 语义主题 本体知识库 资源组织框架 相似度匹配
下载PDF
基于“语义主题模型”的知识系统框架设计及应用研究
5
作者 李颖 张毅 《数字图书馆论坛》 2012年第4期24-27,共4页
构建语义化知识服务系统是数字图书馆在语义Web环境下的发展方向。针对目前各种语义Web技术在数字图书馆开发应用的现状和问题,本研究融合国际基于Topic的语义知识组织技术,结合国内的需求,提出了“语义主题模型”,目标为构建可实... 构建语义化知识服务系统是数字图书馆在语义Web环境下的发展方向。针对目前各种语义Web技术在数字图书馆开发应用的现状和问题,本研究融合国际基于Topic的语义知识组织技术,结合国内的需求,提出了“语义主题模型”,目标为构建可实施的语义化知识系统。文章首先对以“概念化主题、主题关联、语义标签”为内涵的“语义主题化模型”概念进行定义;其次,设计基于此模型的语义化知识系统框架;再次,对相关应用进行了探讨;最后,对未来开发工作进行了规划。 展开更多
关键词 语义主题模型 知识系统框架 主题
下载PDF
基于支持向量机的线条图像语义主题自动发现方法
6
作者 金聪 刘金安 《图像与信号处理》 2014年第3期78-85,共8页
提出了一种基于支持向量机分类器的线条图像语义主题自动发现方法。首先对训练图像进行分块,在对图像子块进行聚类后,得到由聚类中心构成的类集合;从每幅训练图像的注释文字中提取所有名词构成关键词集合。其次,对未标注的测试图像进行... 提出了一种基于支持向量机分类器的线条图像语义主题自动发现方法。首先对训练图像进行分块,在对图像子块进行聚类后,得到由聚类中心构成的类集合;从每幅训练图像的注释文字中提取所有名词构成关键词集合。其次,对未标注的测试图像进行同样分块处理,计算子块与每个关键词的相关性,得到每个子块的标注词集合。最后,计算每个关键词在各个子块标注中出现的次数,取出现次数最多的关键词作为图像的语义主题。实验结果表明,所提出的方法对于线条图像的语义主题自动发现是有效的,具有比较好的性能。 展开更多
关键词 数字图像 语义主题发现 图像块聚类 支持向量机
下载PDF
基于潜在语义主题融合的铁路扣件状态检测 被引量:6
7
作者 狄仕磊 刘甲甲 +1 位作者 罗建桥 李柏林 《传感器与微系统》 CSCD 2016年第7期19-21,25,共4页
针对现有单一底层特征识别扣件状态的算法存在描述能力差、特征维度过高等问题,提出一种基于两种扣件底层特征的潜在语义主题融合的扣件检测模型。通过潜在狄利克雷分布(LDA)模型分别获取扣件图像的局部二值模式(LBP)特征和方向梯度直方... 针对现有单一底层特征识别扣件状态的算法存在描述能力差、特征维度过高等问题,提出一种基于两种扣件底层特征的潜在语义主题融合的扣件检测模型。通过潜在狄利克雷分布(LDA)模型分别获取扣件图像的局部二值模式(LBP)特征和方向梯度直方图(HOG)特征的扣件语义主题向量。将这两种语义主题向量进行加权融合,权值由该图像LBP特征图和其梯度图的信息熵来确定。以该向量训练分类器,判断待检扣件状态。实验表明:与目前的主流扣件检测方法相比,该方法的漏检率和误检率明显降低,检测能力显著增强。 展开更多
关键词 铁路扣件检测 语义主题 潜在狄利克雷分布模型 信息熵 加权融合
下载PDF
基于最小二乘支持向量机的网页主题语义分类的研究 被引量:2
8
作者 樊中华 侯占斌 +1 位作者 张晨星 马骁 《计算机应用与软件》 CSCD 2009年第12期53-55,59,共4页
提出了对网页主题进行语义扩展的方法,利用最小二乘支持向量机LSSVM(least squares support vector machines)来代替传统的支持向量机SVM(support vector machine)的分类技术。在建立LSSVM模型的多类别分类算法基础上,将其应用到网页主... 提出了对网页主题进行语义扩展的方法,利用最小二乘支持向量机LSSVM(least squares support vector machines)来代替传统的支持向量机SVM(support vector machine)的分类技术。在建立LSSVM模型的多类别分类算法基础上,将其应用到网页主题语义分类。实验表明,最小二乘支持向量机学习速度快,在小样本情况下具有良好的非线性建模和泛化能力,对网页主题语义分类具有很好的效果。 展开更多
关键词 最小二乘支持向量机 语义建模 网页主题语义分类
下载PDF
基于语义相关度主题爬虫的语料采集方法 被引量:6
9
作者 周昆 王钊 于碧辉 《计算机系统应用》 2019年第5期190-195,共6页
针对特定领域语料采集任务,设计了基于语义相关度主题爬虫的语料采集方法.根据选定的主题词,利用页面描述信息,基于维基百科中文语料训练出的词分布式表示综合HowNet计算页面信息相关度,结合URL的结构信息预测未访问URL链指的页面内容... 针对特定领域语料采集任务,设计了基于语义相关度主题爬虫的语料采集方法.根据选定的主题词,利用页面描述信息,基于维基百科中文语料训练出的词分布式表示综合HowNet计算页面信息相关度,结合URL的结构信息预测未访问URL链指的页面内容与特定领域的相关程度.实验表明,系统能够有效的采集互联网中的党建领域页面内容作为党建领域生语料,在党建领域网站上的平均准确率达到94.87%,在门户网站上的平均准确率达到64.20%. 展开更多
关键词 生语料采集 语义相关度主题爬虫 页面信息相关度 URL结构信息
下载PDF
基于混合主题语义特征提取的旅游吸引物地理画像 被引量:1
10
作者 温梦甜 张岩 +1 位作者 陈能成 陈泽强 《地理与地理信息科学》 CSCD 北大核心 2022年第6期1-8,51,共9页
通过刻画城市旅游吸引物地理画像,可为城市旅游吸引物建设和游客出行提供参考,但现有相关研究较少考虑到旅游吸引物的空间位置和配套设施等因素。该文提出从地理空间和地理语义两个角度构建城市旅游吸引物地理画像的方法,首先基于兴趣点... 通过刻画城市旅游吸引物地理画像,可为城市旅游吸引物建设和游客出行提供参考,但现有相关研究较少考虑到旅游吸引物的空间位置和配套设施等因素。该文提出从地理空间和地理语义两个角度构建城市旅游吸引物地理画像的方法,首先基于兴趣点(POI)数据通过隐式狄利克雷分布(LDA)模型提取主题语义特征,然后通过空间聚类分析旅游吸引物的空间格局,最后计算旅游吸引物集群的主题多样性,据此衡量游客对不同旅游目的地的满足度。以武汉市为研究区进行实验,结果表明:该文方法能客观地刻画旅游吸引物的配套设施建设情况,定量计算旅游吸引物集群的主题混合度和优势度,很好地融合了地理语义特征和地理空间关系,可为景区规划建设和游客选择旅游目的地提供参考。 展开更多
关键词 旅游吸引物地理画像 LDA POI 主题语义特征提取 主题多样性
下载PDF
主题语义域视角下的媒介批评话语分析 被引量:2
11
作者 彭汪鑫 《惠州学院学报》 2017年第2期91-95,共5页
文章运用语料库驱动方法,从批评话语分析角度出发,通过比较英国新闻媒体对中国国家主席习近平访英报道、美国新闻媒体对习近平访美报道的主题语义域,分析立场异同,揭示其中的权力关系与意识形态。研究显示,英美媒体都为中国贴上了"... 文章运用语料库驱动方法,从批评话语分析角度出发,通过比较英国新闻媒体对中国国家主席习近平访英报道、美国新闻媒体对习近平访美报道的主题语义域,分析立场异同,揭示其中的权力关系与意识形态。研究显示,英美媒体都为中国贴上了"独裁"、"人权危机"和"中国威胁论"的模式化标签;英媒对中英经贸合作前景相对乐观,但担心中英伙伴关系影响英美传统盟友关系;美媒对中美经贸合作前景不甚乐观,并刻意挑选网络安全和南海争端两大议题进行高频报道以对中国进行批判。 展开更多
关键词 Wmatrix 主题语义 批评话语分析 语料库
下载PDF
模块化网络主题语义分类算法的设计与仿真
12
作者 周瑛 刘仁芬 李娜 《计算机仿真》 北大核心 2022年第7期502-506,共5页
由于目前已有算法没有对网络主题语义流行度进行计算,构建流行度序列,导致分类结果不理想,运行时间增加。提出一种基于特征序列的模块化网络主题语义分类算法,通过Ochiia系数方法将高频关键词同时出现的次数转换为网络主题语义相似性。... 由于目前已有算法没有对网络主题语义流行度进行计算,构建流行度序列,导致分类结果不理想,运行时间增加。提出一种基于特征序列的模块化网络主题语义分类算法,通过Ochiia系数方法将高频关键词同时出现的次数转换为网络主题语义相似性。将语义相似性较强的网络主题聚集到一个簇中,形成主题簇。根据特征序列获取网络主题簇的平均热度和描述词,以此为依据构建流行度序列。采用特征序列对全部序列进行分类,实现模块化网络主题语义分类。仿真结果表明,所提算法能够快速准确完成模块化网络主题语义分类。 展开更多
关键词 特征序列 模块化 网络主题语义 分类
下载PDF
基于主题隐马尔科夫模型的人体异常行为识别 被引量:38
13
作者 朱旭东 刘志镜 《计算机科学》 CSCD 北大核心 2012年第3期251-255,275,共6页
针对基于监控视频的人体异常行为识别问题,提出了基于主题隐马尔科夫模型的人体异常行为识别方法,即通过无任何人工标注的视频训练集自动学习人体行为模型,并能够应用学到的人体行为模型实时检测异常行为和识别正常行为。这一方法主要围... 针对基于监控视频的人体异常行为识别问题,提出了基于主题隐马尔科夫模型的人体异常行为识别方法,即通过无任何人工标注的视频训练集自动学习人体行为模型,并能够应用学到的人体行为模型实时检测异常行为和识别正常行为。这一方法主要围绕"低层视频表示-中层语义行为建模-高层语义分类"3个方面进行:1)基于时-空间兴趣点构建了一种紧凑的和有效的视频表示方法。2)提出一种新颖的语义主题模型(Topic Model,TM)——主题隐马尔科夫模型(Topic Hidden Markov Model,THMM),它能够自然地分组视频中检测到的人体行为。主题隐马尔科夫模型基于已有的马尔科夫模型和主题模型构造,不但聚类运动词汇成简单动作,而且聚类简单动作成全局行为,同时建模了行为时间上的相关性。THMM是一个4层贝叶斯主题模型,它将视频序列建模为行为的马尔科夫链,同时行为是视频序列中某些视频剪辑(Clip)的概率分布;将视频剪辑建模为动作的随机组合,同时动作是视频剪辑中运动词汇的概率分布。克服了传统隐马尔科夫模型和主题模型在人体复杂行为建模过程中精度、鲁棒性和计算效率上的不足。3)提出运行时累积的异常性测度及其在线异常行为检测方法和基于在线似然比检验(Likelihood Ratio Test,LRT)的实时正常行为分类方法,从而克服了实时行为识别过程中由于缺乏充分的视觉证据而引发的行为类型歧义,能完较好地完成监控场景中实时异常行为检测和在线正常行为识别的任务。取自实际监控场景的实验数据集上的实验结果证明了本方法的有效性。 展开更多
关键词 计算机视觉 语义主题模型 异常检测 运动词包 行为聚类
下载PDF
基于PLSA模型的Web页面语义标注算法研究 被引量:5
14
作者 王云英 《情报杂志》 CSSCI 北大核心 2013年第1期141-144,共4页
高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对We... 高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对Web页面的结构特征和文本特征构建独立的PLSA主题模型,采用自适应不对称学习算法对这些独立的PLSA主题模型进行集成和优化,最终形成新的综合性的PLSA主题模型进行未知Web页面的自动语义标注。实验结果表明,该算法能够显著提高Web页面语义标注的准确率和效率,可以有效地解决大规模Web页面语义标注问题。 展开更多
关键词 语义标注 PLSA模型 潜在语义主题 标注算法 WEB页面
下载PDF
基于词汇树层次语义模型的图像检索算法 被引量:2
15
作者 张月辉 吴健 +1 位作者 陆姗姗 崔志明 《微电子学与计算机》 CSCD 北大核心 2012年第11期172-176,共5页
解决语义鸿沟必须建立图像低层特征到高层语义的映射,针对此问题,本文提出了一种基于词汇树层次语义模型的图像检索方法.首先提取图像包含颜色信息的SIFT特征来构造图像库的特征词汇树,生成描述图像视觉信息的视觉词汇.并在此基础上利用... 解决语义鸿沟必须建立图像低层特征到高层语义的映射,针对此问题,本文提出了一种基于词汇树层次语义模型的图像检索方法.首先提取图像包含颜色信息的SIFT特征来构造图像库的特征词汇树,生成描述图像视觉信息的视觉词汇.并在此基础上利用Bayesian决策理论实现视觉词汇到语义主题信息的映射,进而构造了一个层次语义模型,并在此模型基础上完成了基于内容的语义图像检索算法.通过检索过程中用户的相关反馈,不仅可以加入正反馈图像扩展图像查询库,同时能够修正高层语义映射.实验结果表明,基于该模型的图像检索算法性能稳定,并且随着反馈次数的增加,检索效果明显提升. 展开更多
关键词 词汇树 语义主题信息 层次语义模型 语义映射 图像检索
下载PDF
短句语义向量计算方法 被引量:3
16
作者 陈福 林闯 +3 位作者 薛超 徐月梅 孟坤 倪艺函 《通信学报》 EI CSCD 北大核心 2016年第2期11-19,共9页
提出了一种基于人工神经网络的短文语义向量放缩算法,结合社交节点自身信息和短文语义,给出社交网络短文语义计算方法和突发话题发现算法。通过文本数值化实现语义距离的计算、比较、节点的分类及社区发现等。通过自行开发的微博采集工... 提出了一种基于人工神经网络的短文语义向量放缩算法,结合社交节点自身信息和短文语义,给出社交网络短文语义计算方法和突发话题发现算法。通过文本数值化实现语义距离的计算、比较、节点的分类及社区发现等。通过自行开发的微博采集工具Argus采集的大量新浪微博内容对所提模型和算法进行了验证,最后对未来工作进行了展望。 展开更多
关键词 在线社会网络 主题语义计算 人工神经网络 突发话题发现
下载PDF
主题地图约束的合法性验证
17
作者 吴笑凡 丁秋林 +1 位作者 张磊 周良 《现代图书情报技术》 CSSCI 北大核心 2006年第3期36-41,共6页
主题地图作为异构信息检索的重要手段之一,在以分类目录为目的的文件存档和以概念化导航为目的的Web浏览中得到广泛应用。为了保证作为其基础的下层语义网络的完备性和健壮性,验证主题地图在语法和语义上的合法性非常重要。为此,提出了... 主题地图作为异构信息检索的重要手段之一,在以分类目录为目的的文件存档和以概念化导航为目的的Web浏览中得到广泛应用。为了保证作为其基础的下层语义网络的完备性和健壮性,验证主题地图在语法和语义上的合法性非常重要。为此,提出了主题地图模式及约束语言规范,研究了Schema约束和上下文语义约束,并建立了与之相配套的主题地图语义验证器,实现了对于主题地图约束的合法性验证。 展开更多
关键词 主题地图 模式及约束语言规范 Schema约束 上下文语义约束 主题地图语义验证器
下载PDF
基于新型主题信息量化方法的Web主题信息提取研究 被引量:1
18
作者 吕聚旺 都云程 +1 位作者 王弘蔚 施水才 《现代图书情报技术》 CSSCI 北大核心 2008年第12期48-53,共6页
针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采... 针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采用分治思想,先定位到包含主题信息的区域,后过滤噪音信息。实验证明本文提出的方法能够较好地解决主题信息自动提取存在的信息完整性和准确性的矛盾。 展开更多
关键词 网页主题信息信息抽取信息块语义信息IB—DOM树
下载PDF
基于LDA 模型与语义网络对评论文本进行挖掘
19
作者 谭瑾娜 《信息与电脑》 2020年第21期58-60,共3页
本文基于LDA主题聚类与语义网络模型LTC-SNM的方法,依据客户价值理论对时尚租赁APP在线评论文本进行研究;对在线评价文本进行数据清洗和关键特征提取,使用Word2vec生成词向量,利用分类器对评价文本进行情感二分类,再通过LDA模型进行文... 本文基于LDA主题聚类与语义网络模型LTC-SNM的方法,依据客户价值理论对时尚租赁APP在线评论文本进行研究;对在线评价文本进行数据清洗和关键特征提取,使用Word2vec生成词向量,利用分类器对评价文本进行情感二分类,再通过LDA模型进行文本聚类,提取在线文本主题词转换为共线矩阵,最后利用ROSTCM软件生成语义网络图。实验结果表明:基于LTC-SNM的挖掘方法更能全方位地表达在线用户评论的主题。 展开更多
关键词 时尚租赁 数据挖掘 LDA主题聚类语义网络模型
下载PDF
大规模图像集中的代表性图像选取 被引量:2
20
作者 齐美彬 朱俊俊 +1 位作者 纪平 蒋建国 《自动化学报》 EI CSCD 北大核心 2014年第4期706-712,共7页
针对传统图像检索系统通过关键字搜索图像时缺乏语义主题多样性的问题,提出了一种基于互近邻一致性和近邻传播的代表性图像选取算法,为每个查询选取与其相关的不同语义主题的图像集合.该算法利用互近邻一致性调整图像间的相似度,再进行... 针对传统图像检索系统通过关键字搜索图像时缺乏语义主题多样性的问题,提出了一种基于互近邻一致性和近邻传播的代表性图像选取算法,为每个查询选取与其相关的不同语义主题的图像集合.该算法利用互近邻一致性调整图像间的相似度,再进行近邻传播(AP)聚类将图像集分为若干簇,最后通过簇排序选取代表性图像簇并从中选取中心图像为代表性图像.实验表明,本文方法的性能超过基于K-means的方法和基于Greedy K-means的方法,所选图像能直观有效地概括源图像集的内容,并且在语义上多样化. 展开更多
关键词 代表性图像 语义主题 互近邻一致性 AP聚类 图像簇排名
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部