期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于向量空间模型的浮选泡沫图像分类方法研究 被引量:1
1
作者 王雅琳 张润钦 +1 位作者 谢永芳 桂卫华 《高技术通讯》 CAS CSCD 北大核心 2013年第9期973-979,共7页
针对基于图像底层特征的泡沫图像分类识别正确率不高、存在语义鸿沟问题,提出一种基于向量空间模型(VSM)的浮选泡沫图像分类方法。该方法借鉴文本分类方法,对工业摄像机获取的大量泡沫图像通过分块、底层特征提取和聚类,构造泡沫状态词... 针对基于图像底层特征的泡沫图像分类识别正确率不高、存在语义鸿沟问题,提出一种基于向量空间模型(VSM)的浮选泡沫图像分类方法。该方法借鉴文本分类方法,对工业摄像机获取的大量泡沫图像通过分块、底层特征提取和聚类,构造泡沫状态词汇表;在此基础上,经词汇相似度和词频计算,用词袋向量描述泡沫图像;最后,采用VSM实现实时泡沫图像的有监督分类识别。用某金属浮选过程工业现场泡沫图像数据对该方法进行了实验验证,实验结果表明,该方法的工况识别平均准确率近90%,明显优于基于底层特征的分类方法,并在一定程度上解决了语义鸿沟问题,具有很好的应用价值。 展开更多
关键词 泡沫图像 分类识别 向量空间模型vsm 泡沫状态词汇 纹理
下载PDF
基于VSM和LDA模型相结合的新闻文本分类研究 被引量:4
2
作者 彭雨龙 《山东工业技术》 2016年第6期202-203,共2页
针对传统KNN算法在处理新闻分类时仅仅考虑文字层面上的相似性,而未涉及语义层面,本文提出了一种基于VSM和LDA模型相融合的新闻分类算法。首先,在深入研究VSM和LDA模型的基础上,对新闻文档进行VSM和LDA主题建模,结合LDA模型与VSM模型计... 针对传统KNN算法在处理新闻分类时仅仅考虑文字层面上的相似性,而未涉及语义层面,本文提出了一种基于VSM和LDA模型相融合的新闻分类算法。首先,在深入研究VSM和LDA模型的基础上,对新闻文档进行VSM和LDA主题建模,结合LDA模型与VSM模型计算文档之间的相似度;其次,以复合相似度运用到基于相似度加权表决的KNN算法对新闻报道集合进行分类。实验验证了改进后的相似度计算方法的有效性,实验结果表明改进后的KNN算法与传统算法相比,具有较好的效果。 展开更多
关键词 潜在狄利克雷分布(LDA) 向量空间模型(vsm) 文本相似度 KNN分类
下载PDF
基于LDA主题模型的短文本分类 被引量:19
3
作者 杨萌萌 黄浩 +2 位作者 程露红 马平 包武杰 《计算机工程与设计》 北大核心 2016年第12期3371-3377,共7页
针对传统VSM(vector space model)在短文本分类中维数高、语义特征不明显的问题,提出基于LDA(latent Dirichlet allocation)模型主题分布相似度分类方法;针对短文本内容少、长度短、特征稀疏的问题,提出基于LDA模型主题-词分布矩阵的主... 针对传统VSM(vector space model)在短文本分类中维数高、语义特征不明显的问题,提出基于LDA(latent Dirichlet allocation)模型主题分布相似度分类方法;针对短文本内容少、长度短、特征稀疏的问题,提出基于LDA模型主题-词分布矩阵的主题分布向量改进方法。与传统VSM分类方法相比,该方法降低了相似度计算维度,融合了一定语义特征。实验结果表明,与传统VSM分类方法相比,基于主题分布相似度方法的平均F1值提高了4.5%,基于LDA模型主题-词分布矩阵主题分布向量改进方法的平均F1值提高了5.2%,验证了以上方法的有效性。 展开更多
关键词 潜在狄利克雷分布(LDA) 向量空间模型(vsm) 短文本分类 K近邻(K-nearest neighbor) 吉布斯采样 相似度计算
下载PDF
一种基于关键特征的搜索引擎结果聚类算法 被引量:4
4
作者 张辉 谢科 +1 位作者 庞斌 吴辉 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2007年第6期739-742,共4页
为了解决用户在搜索引擎结果列表中寻找所需信息困难的问题,帮助用户快速有效地定位有价值的Web文档,与向量空间模型方法不同,采用基于关键特征的聚类算法(KFC).首先从搜索引擎返回结果的关键词里选择重要的词作为关键特征,然后通过分... 为了解决用户在搜索引擎结果列表中寻找所需信息困难的问题,帮助用户快速有效地定位有价值的Web文档,与向量空间模型方法不同,采用基于关键特征的聚类算法(KFC).首先从搜索引擎返回结果的关键词里选择重要的词作为关键特征,然后通过分析特征间的关系对特征聚类,最后基于特征聚类结果实现文档的聚类.通过对实验结果的测试表明了算法的有效性. 展开更多
关键词 搜索引擎 算法 特征提取 文档聚类 向量空间模型vsm KFC算法
下载PDF
文本分类中结合评估函数的TEF-WA权值调整技术 被引量:26
5
作者 唐焕玲 孙建涛 陆玉昌 《计算机研究与发展》 EI CSCD 北大核心 2005年第1期47-53,共7页
文本自动分类面临的难题之一是如何从高维的特征空间中选取对文本分类有效的特征,以适应文本分类算法并提高分类精度.针对这一问题,在分析比较特征选择和权值调整对文本分类精度和效率的影响后,提出了一种结合评估函数的TEF-WA权重调整... 文本自动分类面临的难题之一是如何从高维的特征空间中选取对文本分类有效的特征,以适应文本分类算法并提高分类精度.针对这一问题,在分析比较特征选择和权值调整对文本分类精度和效率的影响后,提出了一种结合评估函数的TEF-WA权重调整技术,设计了一种新的权重函数,将特征评估函数蕴含到权值函数,按照特征对文本分类的辨别能力调整其在分类器中的贡献.实验结果证明了TEF-WA权值调整技术在提高分类精度和降低算法的时间复杂度方面都是有效的. 展开更多
关键词 向量空间模型(vsm) 特征选择 权重调整 特征评估函数 文本分类
下载PDF
基于减少相似主题分类错误的权重分配新策略
6
作者 唐焕玲 王敬东 陆玉昌 《计算机工程与应用》 CSCD 北大核心 2004年第13期185-188,共4页
文本分类的研究者一直在提高文本的分类精度方面做着不懈的努力,在实验中发现,相似主题的文档的分类错误率比较高,该文尝试着提出了一种二次权重分配的新的特征权值分配策略,构造了一种计算难以区分的主题类别的特征辨别能力的权值函数... 文本分类的研究者一直在提高文本的分类精度方面做着不懈的努力,在实验中发现,相似主题的文档的分类错误率比较高,该文尝试着提出了一种二次权重分配的新的特征权值分配策略,构造了一种计算难以区分的主题类别的特征辨别能力的权值函数,目的是减少相似主题类别的文档的分类错误。 展开更多
关键词 向量空间模型(vsm) 特征选择 权值调整 贝叶斯分类
下载PDF
中文网页自动分类系统研究
7
作者 廖文军 叶喜民 《新乡师范高等专科学校学报》 2007年第2期67-69,共3页
给出了一个网页自动分类系统的设计,讨论了预处理、批量训练、特征选择等模块的设计过程。本系统采用空间向量模型作为分类模型,在分类开始前对网页信息进行了预处理。
关键词 网页 文本分类 向量空间模型(vsm) 中文信息处理
下载PDF
关系智能匹配在SNS中的应用
8
作者 陈岱珏 《科技信息》 2009年第21期56-56,308,共2页
本文从SNS的实际应用出发,针对用户间对关系匹配的切实需求,提出以VSM(向量空间模型)为基础,选取用户的静态属性和动态活动为特征项,并为每个特征项设定其权重策略,最终通过计算用户间的相似度达到智能匹配的效果,提供更好的服务。
关键词 SNS 六度空间理论 关系智能匹配 vsm(向量空间模型)
下载PDF
基于语义的聚焦爬虫算法研究 被引量:9
9
作者 孙红光 藏润强 +2 位作者 姬传德 杨凤芹 冯国忠 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2018年第2期51-57,共7页
针对现存的语义主题爬虫没有考虑主题意义的延伸、页面与主题的相似度计算模型存在的缺陷及主题词项细化过于苛刻导致返回结果较少等不足,采用LDA(Latent Dirichlet Allocation)模型,对主题词项描述文档进行降维,改进语义相似度计算模型... 针对现存的语义主题爬虫没有考虑主题意义的延伸、页面与主题的相似度计算模型存在的缺陷及主题词项细化过于苛刻导致返回结果较少等不足,采用LDA(Latent Dirichlet Allocation)模型,对主题词项描述文档进行降维,改进语义相似度计算模型.引入语义信息的相似度计算模型(SVSM),用SVSM计算文档和主题模型的相似度.从本体中获取该主题词项的上位词,构建主题上位词的主题模型,爬虫依据现有网络中的主题重新获取主题相关信息,提出语义聚焦爬虫(ESVSM),通过不同主题下多个爬虫进行实验对比,发现所提出的基于主题建模和上位词替换的ESVSM算法在收获率、相关网页数量和网页平均相关度中均优于其他算法,平均抓取精度达到85%. 展开更多
关键词 聚焦爬虫 LDA 主题模型 向量空间模型(vsm) 语义相似度
下载PDF
基于个性化服务的相关性算法的研究
10
作者 王元直 卢潇 +1 位作者 钱建立 欧阳辉 《电子设计工程》 2010年第9期1-3,共3页
在介绍个性化服务的相关知识的基础上,通过个性化服务的技术来提高用户和系统的互动性,从而提高搜索的查准率。并针对当前搜索引擎查询的信息太多,用户查询效率不高等问题,研究个性化搜索,并结合用户兴趣度完善了向量空间模型,提出一种... 在介绍个性化服务的相关知识的基础上,通过个性化服务的技术来提高用户和系统的互动性,从而提高搜索的查准率。并针对当前搜索引擎查询的信息太多,用户查询效率不高等问题,研究个性化搜索,并结合用户兴趣度完善了向量空间模型,提出一种解决搜索查询的方法,通过验证该搜索查询方法达到比较满意的结果。 展开更多
关键词 个性化服务 向量空间模型(vsm) 兴趣度 搜索引擎 查询
下载PDF
互联网信息资源的个性化搜索研究
11
作者 陈弄祺 《中国人口·资源与环境》 CSSCI CSCD 北大核心 2016年第S2期432-435,共4页
本文根据未来搜索引擎个性化发展方向,提出和检验了具有个性化特色的搜索引擎算法设计。通过向量空间模型(VSM)设计个性化互联网信息资源搜索引擎,建立了用户兴趣模型对词条的相似度进行精确化处理,得出了关键词相关性排序算法。最后,... 本文根据未来搜索引擎个性化发展方向,提出和检验了具有个性化特色的搜索引擎算法设计。通过向量空间模型(VSM)设计个性化互联网信息资源搜索引擎,建立了用户兴趣模型对词条的相似度进行精确化处理,得出了关键词相关性排序算法。最后,使用关键词数据进行了基础模型检验,说明VSM法达到较高水准,在此基础上完善了本文搜索理论。运用向量空间模型(VSM)进行个性化搜索引擎设计,搜索算法特色鲜明,搜索结果更符合用户的兴趣需求,具有一定的创新性。 展开更多
关键词 互联网 信息资源 个性化搜索 向量空间模型(vsm)
下载PDF
基于任务的用户需求建模
12
作者 赵博 黄志良 +1 位作者 何文思 王适之 《信息系统工程》 2021年第9期80-83,共4页
在军事活动中,情报往往不能及时准确匹配给指定用户。针对这一情况,提出一种基于用户任务属性的用户需求建模方法,改善推荐系统推荐效果。用户需求建模是个性化服务的信息来源,用户需求建模分析用户需求和偏好。论文结合LDA主题模型方法... 在军事活动中,情报往往不能及时准确匹配给指定用户。针对这一情况,提出一种基于用户任务属性的用户需求建模方法,改善推荐系统推荐效果。用户需求建模是个性化服务的信息来源,用户需求建模分析用户需求和偏好。论文结合LDA主题模型方法,通过提取任务的关键主题,寻找用户的需求,拟合向量空间的建模方法,建立了LDA_VSM数学模型,从而进行用户需求建模。通过数据仿真实验,结果表明,该模型能够较好地实现建模效果。 展开更多
关键词 用户任务 推荐服务 用户需求模型 LDA主题模型 vsm向量空间模型
下载PDF
Meaningful String Extraction Based on Clustering for Improving Webpage Classification
13
作者 Chen Jie Tan Jianlong +1 位作者 Liao Hao Zhou Yanquan 《China Communications》 SCIE CSCD 2012年第3期68-77,共10页
Since webpage classification is different from traditional text classification with its irregular words and phrases,massive and unlabeled features,which makes it harder for us to obtain effective feature.To cope with ... Since webpage classification is different from traditional text classification with its irregular words and phrases,massive and unlabeled features,which makes it harder for us to obtain effective feature.To cope with this problem,we propose two scenarios to extract meaningful strings based on document clustering and term clustering with multi-strategies to optimize a Vector Space Model(VSM) in order to improve webpage classification.The results show that document clustering work better than term clustering in coping with document content.However,a better overall performance is obtained by spectral clustering with document clustering.Moreover,owing to image existing in a same webpage with document content,the proposed method is also applied to extract image meaningful terms,and experiment results also show its effectiveness in improving webpage classification. 展开更多
关键词 webpage classification meaningfulstring extraction document clustering term cluste-ring K-MEANS spectral clustering
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部