期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
结构化P2P网络上基于类别树的索引机制
1
作者 兰明敬 胡建伟 《计算机工程与设计》 CSCD 北大核心 2013年第8期2908-2912,共5页
为解决结构化P2P系统的模糊检索问题,提出一种新的索引机制,构建并使用类别树对结点和实体进行标识。使用类别的静态描述产生查询请求;使用类别的动态描述优选下一跳结点,使查询始终围绕关键字列表逐步收敛到满足需求的P2P结点上。给出... 为解决结构化P2P系统的模糊检索问题,提出一种新的索引机制,构建并使用类别树对结点和实体进行标识。使用类别的静态描述产生查询请求;使用类别的动态描述优选下一跳结点,使查询始终围绕关键字列表逐步收敛到满足需求的P2P结点上。给出了分类树、静态描述和动态描述的存储、管理策略,避免了性能和可用性瓶颈。实验结果表明,该索引机制具有较好的检索效果,已成功应用于某服务计算平台。 展开更多
关键词 结构化P2P 模糊搜索 类别 静态描述 动态描述
下载PDF
基于Wikipedia的语义相关度计算 被引量:10
2
作者 刘军 姚天昉 《计算机工程》 CAS CSCD 北大核心 2010年第19期42-43,46,共3页
在意见挖掘中,为实现特殊领域知识的语义相关度计算,提出基于Wikipedia的语义相关度计算方法。在构建Wikipedia类别树的基础上,通过Wikipedia类别向量表示Wikipedia中的词汇,形成一部包含各种领域知识的Wikipedia词典,利用该词典计算语... 在意见挖掘中,为实现特殊领域知识的语义相关度计算,提出基于Wikipedia的语义相关度计算方法。在构建Wikipedia类别树的基础上,通过Wikipedia类别向量表示Wikipedia中的词汇,形成一部包含各种领域知识的Wikipedia词典,利用该词典计算语义相关度。实验结果表明,该方法的斯皮尔曼等级相关系数可达到0.77。 展开更多
关键词 语义相关度 领域知识 wikipedia类别树 意见挖掘
下载PDF
深层次分类中候选类别搜索算法 被引量:1
3
作者 张忠林 刘述昌 江粉桃 《计算机应用》 CSCD 北大核心 2017年第3期635-639,672,共6页
针对深层次分类中分类准确率低、处理速度慢等问题,提出一种待分类文本的候选类别搜索算法。首先,引入搜索、分类两阶段的处理思想,结合类别层次树的结构特点和类别间的相关联系等隐含的领域知识,进行了类别层次权重分析和特征项的动态... 针对深层次分类中分类准确率低、处理速度慢等问题,提出一种待分类文本的候选类别搜索算法。首先,引入搜索、分类两阶段的处理思想,结合类别层次树的结构特点和类别间的相关联系等隐含的领域知识,进行了类别层次权重分析和特征项的动态更新,为类树层次结构的各个节点构建更具分类判断力的特征项集合;进而,采用深度优先搜索算法并结合设定阈值的剪枝策略缩小搜索范围,搜索得到待分类文本的最优候选类别;最后,在候选类别的基础上应用经典的K最近邻(KNN)分类算法和支持向量机(SVM)分类算法进行分类测试和对比分析。实验结果显示,所提算法的总体分类性能优于传统的分类算法,而且使平均F1值较基于贪心策略的启发式搜索算法提高了6%左右。该算法显著提高了深层次文本分类的分类准确度。 展开更多
关键词 深层文本分类 类别层次 类别层次 深度优先搜索 候选类别
下载PDF
大规模层次分类问题研究及其进展 被引量:14
4
作者 何力 贾焰 +2 位作者 韩伟红 谭霜 陈志坤 《计算机学报》 EI CSCD 北大核心 2012年第10期2101-2115,共15页
随着信息技术的发展,互联网数据急剧增长.为了有效地组织和管理这些海量网页信息,通常按照一个大规模的概念或主题类别层次对网络上的信息进行分类,以更好地搜索和访问这些网络资源.在这个过程中,大规模层次分类问题研究如何将互联网上... 随着信息技术的发展,互联网数据急剧增长.为了有效地组织和管理这些海量网页信息,通常按照一个大规模的概念或主题类别层次对网络上的信息进行分类,以更好地搜索和访问这些网络资源.在这个过程中,大规模层次分类问题研究如何将互联网上的网页文档准确地分到类别层次中的各个类别.该文对大规模层次分类问题进行了分析.首先,给出了大规模层次分类问题的定义,分析了大规模层次分类问题的求解策略;其次,对大规模层次分类问题的求解方法加以分类,在分类基础上,介绍了各种典型的求解方法并进行了对比;最后总结了各种大规模层次分类问题求解方法并指出了未来的研究方向. 展开更多
关键词 文本分类 大规模层次分类 类别层次 类别层次
下载PDF
多语种网络文本快速新词抽取 被引量:2
5
作者 刘冰洋 刘倩 +2 位作者 张瑾 刘欣然 程学旗 《中文信息学报》 CSCD 北大核心 2014年第2期78-84,共7页
从网络文本中提取新词是网络信息处理中的一个重要问题,在信息检索、文本挖掘、词典编纂、中文分词等领域中都有重要应用。本文提出了一种与语言无关的快速新词提取算法,首先针对后缀树的数据结构将多语言文本进行统一编码,然后使用改... 从网络文本中提取新词是网络信息处理中的一个重要问题,在信息检索、文本挖掘、词典编纂、中文分词等领域中都有重要应用。本文提出了一种与语言无关的快速新词提取算法,首先针对后缀树的数据结构将多语言文本进行统一编码,然后使用改进的统计方法在双后缀树上以线性时间统计重复串与邻接类别,并计算字符串的整体度,同时通过剪枝大幅度减少计算量,在中、英文语料上较好地实现了新词的抽取及排序。 展开更多
关键词 新词 邻接类别 字符串整体度 后缀 多语言
下载PDF
单路径层次化网页分类算法
6
作者 彭小刚 傅向华 《计算机工程与设计》 CSCD 北大核心 2008年第9期2356-2358,2362,共4页
网页自动分类是解决互联网信息检索困难的有效方法。虽然有很多自动分类算法和系统,但是大部分此类算法注重如何将网页准确分到某个独立的类别里面,却忽略类别之间所组成的体系结构本身也具备的一些隐藏分类信息。同时,一般的分类算法... 网页自动分类是解决互联网信息检索困难的有效方法。虽然有很多自动分类算法和系统,但是大部分此类算法注重如何将网页准确分到某个独立的类别里面,却忽略类别之间所组成的体系结构本身也具备的一些隐藏分类信息。同时,一般的分类算法每次分类都需要搜索所有的类别。针对这些缺点,提出了一种基于结构的单路径层次化网页分类算法,该分类方法利用类别之间具有树状结构这一特点,对类别中存在父子关系的类别间进行信息传递,使得每次分类只需要搜索树中一条路径而不用遍历所有树节点。实验结果证明,这种单路径搜索技术与相关的算法相比,在减少搜索节点的同时可以提高6%的准确度。 展开更多
关键词 网页分类 层次结构 信息提取 单路径 类别信息 特征传递
下载PDF
坟场之书
7
作者 尼尔·盖曼 胡雅倩 《疯狂英语(新悦读)》 2015年第10期37-41,共5页
听说读写词英式发音适合精读Track13间想起那部讲述死后审判的《亚尼的死者之书》。但这确确实实是一部讲述爱与温暖、童年与冒险的成长小说。故事讲述一个小婴儿逃离杀手魔掌来到墓地,被一群鬼魂抚养长大,而最后却不得不离开,独自回到... 听说读写词英式发音适合精读Track13间想起那部讲述死后审判的《亚尼的死者之书》。但这确确实实是一部讲述爱与温暖、童年与冒险的成长小说。故事讲述一个小婴儿逃离杀手魔掌来到墓地,被一群鬼魂抚养长大,而最后却不得不离开,独自回到人的世界的经历。故事由八个章节组成,每个章节又可以看作是一个独立的冒险故事。这里除了幽灵,还有吸血鬼、三头怪兽。 展开更多
关键词 冒险故事 成长小说 亚尼 三头 英式 尸鬼 奇幻小说 类别归属 山楂 科幻小说
下载PDF
校园消息树
8
《当代学生(探秘)》 2008年第17期11-11,共1页
业界动态职校学子活跃在奥运舞台2008北京奥运会不仅是世界各地体育健儿的竞技场,同时也成了职业院校学子奉献与展示的舞台。在浩浩荡荡的奥运志愿服务大军中,由全国各职业院校的优秀学生组成的服务队伍特别显眼,他们训练有素、技能过硬。
关键词 奥运舞台 消息 体育健儿 颁奖礼仪 中职校 引导员 《中国教育报》 社会实践课 专业类别 服务工作
原文传递
支持模糊搜索的结构化P2P算法
9
作者 兰明敬 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2013年第5期680-685,共6页
传统的结构化P2P系统不支持模糊搜索,针对结构化P2P系统的模糊搜索问题,提出一种改进的P2P算法。为应用系统建立类别树,使用源自类别树的类别向量而非传统的二进制码标识结点和实体,将实体信息存储在类别相近的结点,形成按类别聚集的结... 传统的结构化P2P系统不支持模糊搜索,针对结构化P2P系统的模糊搜索问题,提出一种改进的P2P算法。为应用系统建立类别树,使用源自类别树的类别向量而非传统的二进制码标识结点和实体,将实体信息存储在类别相近的结点,形成按类别聚集的结点和实体分布。在此基础上,提出路由算法和结点发现算法,实现了模糊搜索功能。实验证明,算法具有较高的查全率。算法已在某服务计算平台中成功应用,该平台已通过验收并连续运行近一年。 展开更多
关键词 结构化P2P 模糊搜索 类别
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部