期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种基于词聚类的中文文本主题抽取方法 被引量:17
1
作者 陈炯 张永奎 《计算机应用》 CSCD 北大核心 2005年第4期754-756,共3页
提出了一种基于词聚类的中文文本主题抽取方法,该方法利用相关度对词的共现进行分 析,建立词之间的语义关联,并生成代表某一主题概念的用种子词表示的词类。对于给定文档,先进 行特征词抽取,再借助词类生成该文档的主题因子,最后按... 提出了一种基于词聚类的中文文本主题抽取方法,该方法利用相关度对词的共现进行分 析,建立词之间的语义关联,并生成代表某一主题概念的用种子词表示的词类。对于给定文档,先进 行特征词抽取,再借助词类生成该文档的主题因子,最后按权重输出主题因子,作为文本的主题。实 验结果表明,该方法具有较高的抽准率。 展开更多
关键词 主题抽取 词聚类 种子词 主题因子 信息论 词同现 CHI统计
下载PDF
一种多特征因子融合的PageRank算法研究 被引量:3
2
作者 齐向明 孙文心 《计算机工程与应用》 CSCD 北大核心 2017年第7期97-103,共7页
针对PageRank算法完全依据链接结构排序,未考虑网页内容分析,造成平均分配PR值、主题漂移、偏重旧网页的现象,且已有改进算法存在单一性优化等问题,提出一种多特征因子融合的PageRank算法。该算法为使搜索结果更接近用户查询需求,同时... 针对PageRank算法完全依据链接结构排序,未考虑网页内容分析,造成平均分配PR值、主题漂移、偏重旧网页的现象,且已有改进算法存在单一性优化等问题,提出一种多特征因子融合的PageRank算法。该算法为使搜索结果更接近用户查询需求,同时兼顾搜索内容的相关度和查准率,通过添加链入链出权重因子、用户反馈因子、主题相关因子和时间因子,共同改善PageRank算法存在的不足。实验结果表明,所提算法在内容相关性和查准率方面,较其他网页排序算法有明显提高,达到优化Page Rank算法的目的。 展开更多
关键词 PAGERANK算法 链接结构 网页内容 链入链出权重因子 用户反馈因子 主题相关因子 时间因子
下载PDF
基于加权LeaderRank的用户社交网络排序算法 被引量:3
3
作者 孙连 李书琴 刘斌 《计算机工程》 CAS CSCD 北大核心 2019年第10期196-202,共7页
针对加权LeaderRank算法存在的权值均分、主题漂移等问题,提出一种用户社交网络排序算法。结合GloVe模型、余弦相似度计算方法和牛顿冷却定律,通过引入链入链出因子、主题相关度因子和时间衰减度因子,改善加权LeaderRank算法的不足。实... 针对加权LeaderRank算法存在的权值均分、主题漂移等问题,提出一种用户社交网络排序算法。结合GloVe模型、余弦相似度计算方法和牛顿冷却定律,通过引入链入链出因子、主题相关度因子和时间衰减度因子,改善加权LeaderRank算法的不足。实验结果表明,与加权LeaderRank算法相比,该算法的精确率、点击率和NDCG值分别提高7.80%、6.73%和4.75%,可有效提高排序质量。 展开更多
关键词 加权LeaderRank算法 链入链出因子 主题相关度因子 时间衰减度因子 GloVe模型
下载PDF
网络舆情主题信息采集研究 被引量:10
4
作者 黄炜 金雅博 胡昌龙 《现代图书情报技术》 CSSCI 北大核心 2012年第11期65-71,共7页
网络舆情的主题不确定性问题在网络治理中越来越突出,通过研究网络舆情的相关特征及其演化机制,在基于内容的主题选择策略上,引入时间维和空间维的主题因子,设计并实现网络舆情的主题信息爬虫。实验结果表明,该主题信息爬虫不仅执行的... 网络舆情的主题不确定性问题在网络治理中越来越突出,通过研究网络舆情的相关特征及其演化机制,在基于内容的主题选择策略上,引入时间维和空间维的主题因子,设计并实现网络舆情的主题信息爬虫。实验结果表明,该主题信息爬虫不仅执行的效率较高,而且主题约束性稳定,为后期网络群体性事件的舆情处理提供主题样本。 展开更多
关键词 网络群体性事件 网络舆情 主题爬虫 领域本体 主题因子
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部