期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
语义Web链接结构分析之综述 被引量:4
1
作者 葛唯益 程龚 瞿裕忠 《计算机科学》 CSCD 北大核心 2010年第3期17-21,45,共6页
随着语义Web研究的发展,其数据量也不断增长,要实现语义Web追求的目标——数据的共享和重用,语义Web上的实体搜索和文档搜索必不可少。而面对这样不断增长的数据以及不同于传统Web的搜索要求,就需要使用链接结构分析来指导语义Web上的... 随着语义Web研究的发展,其数据量也不断增长,要实现语义Web追求的目标——数据的共享和重用,语义Web上的实体搜索和文档搜索必不可少。而面对这样不断增长的数据以及不同于传统Web的搜索要求,就需要使用链接结构分析来指导语义Web上的搜索。同时,语义Web的发展现状也无时无刻不吸引着研究人员的关注,而链接结构分析对于揭示其宏观结构起着关键作用。分别从实体和文档两个粒度对面向语义Web链接结构分析的研究进行总结,特别关注链接模型的构建以及链接结构分析方法的应用。 展开更多
关键词 语义WEB 模型 分析
下载PDF
基于概率隐含语义分析模型的人脸识别算法 被引量:3
2
作者 邹修明 孙怀江 杨赛 《南京理工大学学报》 EI CAS CSCD 北大核心 2016年第5期594-598,共5页
该文提出一种基于概率隐含语义分析(PLSA)的新的人脸识别算法。首先建立人脸图像的词袋模型,然后使用概率隐含语义分析模型得到词袋特征在隐含主题空间中的分布,并将其作为人脸图像的最终语义特征表示,最后采用支持向量机(SVM)对人脸进... 该文提出一种基于概率隐含语义分析(PLSA)的新的人脸识别算法。首先建立人脸图像的词袋模型,然后使用概率隐含语义分析模型得到词袋特征在隐含主题空间中的分布,并将其作为人脸图像的最终语义特征表示,最后采用支持向量机(SVM)对人脸进行识别。Multi-PIE和人脸识别竞赛(FRGC)数据库上的实验结果表明,该文方法的性能优于目前多个人脸识别方法。 展开更多
关键词 人脸识别 概率隐含语义分析 词袋模型
下载PDF
概率隐含语义分析模型在行为识别中的编码与归一化方法研究 被引量:1
3
作者 徐勤军 周同驰 +1 位作者 周琳 吴镇扬 《信号处理》 CSCD 北大核心 2018年第7期766-775,共10页
在视频中的行为识别的语境下,为了提高概率隐含语义分析模型的识别性能,研究了不同编码方法结合归一化方法对于分类性能的影响;还考察了主成分分析预处理原始特征对于性能的影响,在显著降低特征维度进而降低计算量的同时,当特征包含较... 在视频中的行为识别的语境下,为了提高概率隐含语义分析模型的识别性能,研究了不同编码方法结合归一化方法对于分类性能的影响;还考察了主成分分析预处理原始特征对于性能的影响,在显著降低特征维度进而降低计算量的同时,当特征包含较多噪声成分的情况下性能甚至会有所提升。在KTH和UT-interaction数据库上的实验表明,编码和归一化方法的适当组合可以显著提高模型的性能。在UT-interaction数据库的两个子集上识别精度分别达到了当前最好的结果 96.44%、95%,其中在数据集1上采用稀疏的时空兴趣点特征,得到了94.24%的识别精度。 展开更多
关键词 行为识别 主题模型 概率隐含语义分析 局域软分配
下载PDF
基于超链接多样性分析的新型网页排名算法 被引量:9
4
作者 杨博 陈贺昌 +1 位作者 朱冠宇 赵学华 《计算机学报》 EI CSCD 北大核心 2014年第4期833-847,共15页
作为搜索引擎的核心部件,网页排名算法决定了搜索到的相关结果以何种顺序呈现给用户,其性能的优劣将会直接影响搜索引擎的服务质量和用户的搜索体验.在计算网页的权威性时,现有的基于链接的网页排名算法和网页作弊检测算法仅关注网页的... 作为搜索引擎的核心部件,网页排名算法决定了搜索到的相关结果以何种顺序呈现给用户,其性能的优劣将会直接影响搜索引擎的服务质量和用户的搜索体验.在计算网页的权威性时,现有的基于链接的网页排名算法和网页作弊检测算法仅关注网页的超链接数量和质量,而忽略了超链接来源的多样性———另一种客观评价网页权威性的重要信息.相比于真正的权威页面(具有大量且来源广泛的入链),通过作弊手段提升排名的网页往往不具有入链来源多样性的特征.基于以上思想,文中分别提出了超链接来源多样性判断方法、超链接权值调整方法,进而提出了基于超链接来源多样性分析的网页排名算法Drank.在多个基准数据集上的实验结果表明:与现有最好的同类算法相比,综合寻找优质页面和抑制网页排名作弊两方面,Drank算法表现出更好的性能. 展开更多
关键词 搜索引擎 排名算法 作弊检测 分析 概率计数 社会计算 社交网络
下载PDF
融合链接文本的增量联合主题模型
5
作者 马慧芳 王博 《计算机应用研究》 CSCD 北大核心 2012年第4期1289-1293,共5页
在基于链接的概率隐含语义分析的基础上提出一种融合文本链接的增量方法进行主题建模。首先在原有网页集上进行主题建模;然后随着网页的结构和内容动态变化,利用一种合理的更新机制更新模型参数,从而高效快速地处理在线网页流的动态变... 在基于链接的概率隐含语义分析的基础上提出一种融合文本链接的增量方法进行主题建模。首先在原有网页集上进行主题建模;然后随着网页的结构和内容动态变化,利用一种合理的更新机制更新模型参数,从而高效快速地处理在线网页流的动态变化。此外,提出一个自适应非对称学习方法融合文本与链接模态的隐含主题。对于每个网页,它在两种模态上的主题分布通过加权进行融合,而权值由该网页的特征词分布的熵值确定。由于融合之后的概率结构合理地关联了链接模态和文本模态的信息,故能得到很好的建模效果。两种类型的数据集上的实验结果显示该算法可以有效地节省时间,并对网页分类有较大性能的提高,此外还提供了由本文模型生成的主题显示结果。 展开更多
关键词 主题模型 增量学习 链接—概率隐含语义分析 自适应非对称学习 自适应增量链接—概率隐含语义分析
下载PDF
网络信息采集中链接与主题相关性的判定研究 被引量:1
6
作者 王兰成 朱建华 《计算机应用与软件》 CSCD 北大核心 2012年第5期209-211,240,共4页
面向主题的Web信息采集需判断提取的URL链接主题相关性。基于主题链接上下文提取,主题型语义块采用提取链接周围一定长度的文本,目录型和图片型语义块利用DOM树层次结构,对链接数据进行URL相关性判定;利用知网基于语义相似度的链接判定... 面向主题的Web信息采集需判断提取的URL链接主题相关性。基于主题链接上下文提取,主题型语义块采用提取链接周围一定长度的文本,目录型和图片型语义块利用DOM树层次结构,对链接数据进行URL相关性判定;利用知网基于语义相似度的链接判定,给出一种综合内容和链接结构分析的URL主题相关性判定NPR算法,比较PageRank算法能提供更精确的主题页面。其成果对我国信息机构进行学科网络信息资源的深度建设有实用价值。 展开更多
关键词 WEB信息采集 语义分析 URL 主题相关性
下载PDF
一种基于链接聚类的查询扩展算法 被引量:2
7
作者 李珀瀚 何震瀛 向河林 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期197-204,共8页
潜在语义分析(LSA)是一种用于自动实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从其中挖掘出词语之间的潜在联系.LSA有效地解决了一义多词的问题,但是,由于LSA在大矩阵的计算效率和存储上的不足,这限制了LSA在大... 潜在语义分析(LSA)是一种用于自动实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从其中挖掘出词语之间的潜在联系.LSA有效地解决了一义多词的问题,但是,由于LSA在大矩阵的计算效率和存储上的不足,这限制了LSA在大规模数据集上的应用.另一方面,在关系数据库中,数据对象通过多种类型的链接连接到一起.这些链接中蕴藏了丰富的语义信息.数据对象之间的相似性也可以通过这些链接体现出来.针对这个特点,提出了一种基于链接聚类的查询算法:利用数据对象之间的链接对数据对象进行聚类,用聚类代替文档来进行LSA处理,有效地减少处理文档的个数;在检索的过程中,寻找与关键字序列相似度最接近的簇,然后将簇内的文档返回给用户.实验结果表明,所提出的方法能够充分利用数据对象之间的链接,聚类效果明显;利用聚类后进行LSA处理,能够成倍地提高空间和时间开销,对精确度有提高作用. 展开更多
关键词 潜在语义分析 基于的聚类算法 查询扩展
下载PDF
基于BERT和TextRank关键词提取的实体链接方法 被引量:3
8
作者 詹飞 朱艳辉 +1 位作者 梁文桐 冀相冰 《湖南工业大学学报》 2020年第4期63-70,共8页
提出一种基于BERT(bidirectional encoder representations from transformers)和TextRank关键词提取的实体链接方法。将BERT预训练语言模型引入实体链接任务,进行实体指称上下文和候选实体相关信息的关联度分析,通过提升语义分析的效... 提出一种基于BERT(bidirectional encoder representations from transformers)和TextRank关键词提取的实体链接方法。将BERT预训练语言模型引入实体链接任务,进行实体指称上下文和候选实体相关信息的关联度分析,通过提升语义分析的效果来增强实体链接的结果。采用TextRank关键词提取技术增强目标实体综合描述信息的主题信息,增强文本相似度度量的准确性,从而优化模型效果。使用CCKS2019评测任务二的数据集对模型效果进行验证,实验结果表明,所提方法的实体链接效果明显优于其他实体链接方法,能有效解决实体链接问题。 展开更多
关键词 实体 BERT预训练语言模型 语义分析 TextRank 关键词提取
下载PDF
一个有效融合内容和链接的社区发现算法
9
作者 宋岩巍 赵晓鹏 《软件导刊》 2013年第9期56-57,共2页
设计一个社区发现方法挖掘在线内容网络的潜在结构,在预处理阶段基于网络的链接和节点内容属性对内容网络进行重构,基于重构网络进行链接抽样;在社区发现阶段利用概率链接模型对采样后的网络建模,并用EM算法求解模型参数,根据参数可得... 设计一个社区发现方法挖掘在线内容网络的潜在结构,在预处理阶段基于网络的链接和节点内容属性对内容网络进行重构,基于重构网络进行链接抽样;在社区发现阶段利用概率链接模型对采样后的网络建模,并用EM算法求解模型参数,根据参数可得内容网络的潜在结构。 展开更多
关键词 社区发现算法 分析 内容分析 概率模型
下载PDF
基于本体语义的定题爬虫 被引量:11
10
作者 郑健珍 林坤辉 +1 位作者 周昌乐 康恺 《山东大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期106-110,共5页
定题爬虫能迅速获取网络上特定主题的大量信息,对专业搜索引擎及数据挖掘应用都具有重大价值.针对目前通用的基于关键词主题过滤策略的不足,在概念聚集思想启发下,提出了基于本体语义的主题过滤策略.同时根据网页具有不同位置不同信息... 定题爬虫能迅速获取网络上特定主题的大量信息,对专业搜索引擎及数据挖掘应用都具有重大价值.针对目前通用的基于关键词主题过滤策略的不足,在概念聚集思想启发下,提出了基于本体语义的主题过滤策略.同时根据网页具有不同位置不同信息重要性的特点,提出了改进的加权特征项权值计算公式,实现基于语义的网页实时过滤.为进一步提高爬虫的工作效率提出链接相关度预测算法.对比实验表明此策略具有可行性. 展开更多
关键词 定题爬虫 主题过滤 本体语义 分析
下载PDF
语义网中的排序问题 被引量:4
11
作者 张祥 瞿裕忠 《计算机科学》 CSCD 北大核心 2008年第2期196-200,共5页
网页排序算法的好坏很大程度上影响了万维网搜索引擎的用户体验。语义网为万维网带来了机器可理解的资源描述信息,也为搜索引擎带来了更大的挑战:搜索引擎的检索和排序的对象将不再局限于网页,而是包括了任何可以由URI唯一标识的对象,... 网页排序算法的好坏很大程度上影响了万维网搜索引擎的用户体验。语义网为万维网带来了机器可理解的资源描述信息,也为搜索引擎带来了更大的挑战:搜索引擎的检索和排序的对象将不再局限于网页,而是包括了任何可以由URI唯一标识的对象,比如本体、本体中的词汇等等。本文介绍了语义网中不同的排序问题和目前已有的一些算法,并展望了语义网未来面临的排序问题和可能的解决方法。 展开更多
关键词 语义 本体 排序 分析
下载PDF
语义网站点的发现与排序 被引量:2
12
作者 张祥 葛唯益 瞿裕忠 《软件学报》 EI CSCD 北大核心 2009年第10期2834-2843,共10页
随着语义网中RDF数据的大量涌现,语义搜索引擎为用户搜索RDF数据带来了便利.但是,如何自动地发现包含语义网信息资源的站点,并高效地在语义网站点中收集语义网信息资源,一直是语义搜索引擎所面临的问题.首先介绍了语义网站点的链接模型... 随着语义网中RDF数据的大量涌现,语义搜索引擎为用户搜索RDF数据带来了便利.但是,如何自动地发现包含语义网信息资源的站点,并高效地在语义网站点中收集语义网信息资源,一直是语义搜索引擎所面临的问题.首先介绍了语义网站点的链接模型.该模型刻画了语义网站点、语义网信息资源、RDF模型和语义网实体之间的关系.基于该模型讨论了语义网实体的归属问题,并进一步定义了语义网站点的发现规则;另外,从站点链接模型出发,定义了语义网站点依赖图,并给出了对语义网站点进行排序的算法.将相关算法在一个真实的语义搜索引擎中进行了初步测试.实验结果表明,所提出的方法可以有效地发现语义网站点并对站点进行排序. 展开更多
关键词 语义 资源描述框架 搜索引擎 分析 排序算法
下载PDF
融合语义相似度的商务情报链接分析算法研究 被引量:3
13
作者 何超 张玉峰 《现代图书情报技术》 CSSCI 北大核心 2013年第3期27-32,共6页
针对传统链接分析算法存在的链接丢失问题和语义异构问题,设计基于语义相似度的商务情报链接分析算法。该算法综合应用锚链文本和锚链结构信息解决链接丢失问题,应用领域本体提供语义知识解决语义异构问题。实验结果表明,该算法能够显... 针对传统链接分析算法存在的链接丢失问题和语义异构问题,设计基于语义相似度的商务情报链接分析算法。该算法综合应用锚链文本和锚链结构信息解决链接丢失问题,应用领域本体提供语义知识解决语义异构问题。实验结果表明,该算法能够显著提高商务情报分析结果的准确性。 展开更多
关键词 商务情报 语义相似度 分析
原文传递
基于潜在语义索引的超链接分析模型 被引量:2
14
作者 刘华生 刘刚 吕玉琴 《世界科技研究与发展》 CSCD 2008年第6期743-745,共3页
为了更合理的排名Web文档本文提出了一个新的链接分析模型。该模型结合了基于马尔科夫链的链接分析技术和基于潜在语义索引[1,2]以及文档聚类分析的内容分析技术,能很好的适应新增W eb页面,并且能用来解决基于链接和基于内容的搜索引擎... 为了更合理的排名Web文档本文提出了一个新的链接分析模型。该模型结合了基于马尔科夫链的链接分析技术和基于潜在语义索引[1,2]以及文档聚类分析的内容分析技术,能很好的适应新增W eb页面,并且能用来解决基于链接和基于内容的搜索引擎作弊以及上下文搜索和主题相关搜索问题。 展开更多
关键词 分析模型 潜在语义索引 搜索引擎
原文传递
基于Web的信息检索技术分析与研究
15
作者 李洁 《电脑知识与技术(过刊)》 2010年第9X期7208-7210,共3页
该文对当前Web信息检索技术进行分析和研究。分别介绍了三种经典检索模型和基于潜在语义分析的检索技术,以及基于超级链接分析研究的搜索算法,并进行了比较和分析。最后,指出当前信息检索的智能化发展方向。
关键词 WEB信息检索 潜在语义分析 LSA 分析
下载PDF
基于转移概率的PageRank算法研究 被引量:1
16
作者 李吉平 吴陈 曾庆军 《科学技术与工程》 2008年第8期2071-2074,共4页
PageRank算法是目前一种基于网络链接的比较成功的网页排序算法。首先对PageRank算法做了简单介绍,然后从数学的角度分析,PageRank可以被看作是一个马尔可夫随机游走模型,基于此模型对经典PageRank算法中的转移概率做了改进,根据网页的... PageRank算法是目前一种基于网络链接的比较成功的网页排序算法。首先对PageRank算法做了简单介绍,然后从数学的角度分析,PageRank可以被看作是一个马尔可夫随机游走模型,基于此模型对经典PageRank算法中的转移概率做了改进,根据网页的原PageRank值在链入网页的所有链出网页PageRank值总和所占比例定义转移概率。实验表明,改进后的算法在计算出网页的PageRank值,更具合理性。 展开更多
关键词 PAGERANK 分析 马尔可夫随机游走 转移概率
下载PDF
李白《春思》及其英译文的语篇对比分析
17
作者 陆廷香 唐渠 《海外英语》 2012年第18期162-164,共3页
以Halliday的系统功能语言学为依据,从链接与连贯、逻辑—语义关系这两个方面对唐代诗人李白的《春思》及其英译文进行语篇对比分析。通过对比,链接上,汉语语篇比较隐晦,英语语篇比较明晰;逻辑-语义关系上,英语语篇较紧密。系统功能语... 以Halliday的系统功能语言学为依据,从链接与连贯、逻辑—语义关系这两个方面对唐代诗人李白的《春思》及其英译文进行语篇对比分析。通过对比,链接上,汉语语篇比较隐晦,英语语篇比较明晰;逻辑-语义关系上,英语语篇较紧密。系统功能语言学相关理论在汉英语篇对比分析上是合理性的。 展开更多
关键词 系统功能语言学 与连贯 逻辑—语义关系 语篇对比分析
下载PDF
开放内容中的知识发现——基于WIKIPEDIA链接分析 被引量:3
18
作者 余旸 林漳希 夏国平 《情报杂志》 CSSCI 北大核心 2009年第7期141-144,136,共5页
作为世界上最大的开放内容工程,Wikipedia仅其英文版本就拥有超过200万的条目数以及超过1亿的内部链接。目前,Wikipedia中的相关内容查询是采用关键词匹配的方法,其中丰富的链接结构所蕴涵大量的相关信息未充分利用。利用Wikipedia中的... 作为世界上最大的开放内容工程,Wikipedia仅其英文版本就拥有超过200万的条目数以及超过1亿的内部链接。目前,Wikipedia中的相关内容查询是采用关键词匹配的方法,其中丰富的链接结构所蕴涵大量的相关信息未充分利用。利用Wikipedia中的内部链接关系析取语义关系,进而提高查询的精度。定义了一种新的算法,使用词条"相容率"(Mutual Awareness Ratio)来描述词间距及对知识空间节点(词条)进行相关度的重新排序,从而重新构造知识空间。实验证明,此算法有效地提高了查询精度与用户满意度。 展开更多
关键词 开放内容 语义析取 分析 知识发现
下载PDF
英语链接动词构式语义变化研究--以seem to V和appear to V为例 被引量:1
19
作者 孟庆楠 罗卫华 《外语教学与研究》 CSSCI 北大核心 2022年第4期521-533,638,639,共15页
本研究以“seem to V”和“appear to V”这两个近义链接动词构式为例,借助COCA、COHA语料库及R软件,通过基于类符的语义向量空间模型、聚类分析和对应分析三种可视化手段,对二者在美式英语中的语义变化情况进行定量研究。结果表明:这... 本研究以“seem to V”和“appear to V”这两个近义链接动词构式为例,借助COCA、COHA语料库及R软件,通过基于类符的语义向量空间模型、聚类分析和对应分析三种可视化手段,对二者在美式英语中的语义变化情况进行定量研究。结果表明:这两个构式中搭配词的语义倾向在1900年后均呈现出明显的变化,从而使节点词具有明确的语义分工——seem to多与“认知–施事类”动词连用,表示语言使用者对客观发生事件的主观情感态度,而appear to则主要表现为写实的用法,用于描述可直接感知的物质世界中发生的事件或是客观实体的性质和状态,并逐渐倾向于与静态动词连用。 展开更多
关键词 英语动词构式 语义向量空间模型 聚类分析 对应分析
原文传递
利用相互增强关系迭代计算本体中概念与关系的重要性 被引量:7
20
作者 吴刚 张阔 +1 位作者 李涓子 王克宏 《计算机学报》 EI CSCD 北大核心 2007年第9期1490-1499,共10页
通过排序本体中概念重要性和关系权重的方式评价本体,能够辅助领域专家改进本体设计,辅助语义Web搜索引擎实现.现有链接分析技术不能直接应用于对概念的排序,而且缺乏有效方法对关系赋予权重.文中提出依据本体的图结构特点,以Hub值代替A... 通过排序本体中概念重要性和关系权重的方式评价本体,能够辅助领域专家改进本体设计,辅助语义Web搜索引擎实现.现有链接分析技术不能直接应用于对概念的排序,而且缺乏有效方法对关系赋予权重.文中提出依据本体的图结构特点,以Hub值代替Authority值作为概念重要性,并利用本体中概念和关系相互增强的迭代方式计算概念重要性和关系权重.证明该迭代过程收敛于迭代方程组的不动点.实验初步表明,该方法具有与PageRank接近的收敛速度,并能得到合理的概念重要性与关系权重的排序结果. 展开更多
关键词 本体 语义WEB 排序 分析 收敛
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部