期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
超文本信息结构导航力分析 被引量:10
1
作者 张海涛 刘甲学 毕强 《情报学报》 CSSCI 北大核心 2002年第2期139-142,共4页
本文以超文本信息组织为基点 ,引入了线性力、自由度和导航力三个术语来对超文本信息结构进行分析 ,通过对它们之间关系的分析 。
关键词 文本信息结构 导航力 线性力 自由度 文本信息组织
下载PDF
基于增强加权共现图和图核相似性的文本分类方法 被引量:1
2
作者 田英 郝兆才 《计算机工程与设计》 北大核心 2023年第5期1434-1440,共7页
为有效表示文本结构信息,提高文本分类性能,提出一种增强加权共现图的文本分类方法。利用加权共现图表征文本,基于术语与文本分类的相关性对术语及其相依性进行加权;通过词相似性矩阵对加权图进行增强,增强图的节点和边。采用基于边匹... 为有效表示文本结构信息,提高文本分类性能,提出一种增强加权共现图的文本分类方法。利用加权共现图表征文本,基于术语与文本分类的相关性对术语及其相依性进行加权;通过词相似性矩阵对加权图进行增强,增强图的节点和边。采用基于边匹配的图核,计算文本之间的相似性。实验在3个公开数据集上进行,在标准设置情况下,相比于其它优秀方法,所提方法在精度、召回率和F1得分提高约5%。在少量标注样本情况下,所提方法Micro-F1的增益在3%到8%之间。 展开更多
关键词 文本结构信息 文本分类 加权共现图 增强图 相似性 相似性矩阵 边匹配
下载PDF
基于多元信息加权协调的超文本分类算法
3
作者 鲁薇 《信息技术与信息化》 2006年第3期104-107,共4页
本文综合利用超文本的各种多元化信息规则,提出一种基于多元信息加权协调的超文本分类算法。该算法在分类时,通过对抽取到的数据集超文本文档中的超文本信息进行加权处理,更好的综合协调地利用了超文本的多元结构化信息。通过三个数据... 本文综合利用超文本的各种多元化信息规则,提出一种基于多元信息加权协调的超文本分类算法。该算法在分类时,通过对抽取到的数据集超文本文档中的超文本信息进行加权处理,更好的综合协调地利用了超文本的多元结构化信息。通过三个数据集的综合实验,结果表明,相较于单独利用某种超文本结构信息进行分类的方法,基于多元信息加权协调超文本算法具有较好的性能。 展开更多
关键词 文本分类 文本结构信息 文本信息使用规则 信息加权协调
下载PDF
一种改进的基于VSM的文本分类算法 被引量:8
4
作者 张彰 樊孝忠 《计算机工程与设计》 CSCD 北大核心 2006年第21期4078-4080,共3页
在文本分类中,向量空间模型(VSM)是常用的文本表示形式,但是它把文本看作词袋,忽略了文本的结构信息。通过区别对待文本的不同部分来改进基本的向量空间方法:对于标题和段落首尾句采用核心词共现的方法来计算其对分类的作用;对其它部分... 在文本分类中,向量空间模型(VSM)是常用的文本表示形式,但是它把文本看作词袋,忽略了文本的结构信息。通过区别对待文本的不同部分来改进基本的向量空间方法:对于标题和段落首尾句采用核心词共现的方法来计算其对分类的作用;对其它部分采用基本的向量空间模型方法进行计算。对这两部分的计算结果进行加权求和,来综合判定文本的类别。对改进的文本分类方法进行了测试,实验结果表明改进的方法提高了分类的精确率、召回率和F1测试值。 展开更多
关键词 文本分类 向量空间模型 文本结构信息 核心词 共现
下载PDF
双语词汇自动获取系统
5
作者 李芳 盛焕烨 《上海交通大学学报》 EI CAS CSCD 北大核心 2001年第9期1386-1389,1394,共5页
介绍了一个基于 Internet的双语词汇获取系统 ,提出了根据文本结构信息和内容信息进行对齐的方法 .该方法的实现不依赖于任何语言的特点 ,从对齐结果中自动抽取双语词汇 ,系统最终的结果词汇又被用作鉴定未知词汇的依据 .所抽取出的词... 介绍了一个基于 Internet的双语词汇获取系统 ,提出了根据文本结构信息和内容信息进行对齐的方法 .该方法的实现不依赖于任何语言的特点 ,从对齐结果中自动抽取双语词汇 ,系统最终的结果词汇又被用作鉴定未知词汇的依据 .所抽取出的词汇反映了大量的新词、专有名词和在不同上下文里的各种译文 ,可以应用在机器翻译和多语种信息检索中 . 展开更多
关键词 词汇获取 自然语言处理 INTERNET 双语词汇 文本结构信息 内容信息 对齐方法
下载PDF
基于异构中文在线百科的层次话题构建
6
作者 王煦中 刘琰 +1 位作者 胡琳梅 陈静 《计算机科学》 CSCD 北大核心 2017年第5期226-231,共6页
中文在线百科包含大量有价值的信息,很多工作成功地将其用于各类知识获取任务。例如,拥有相似话题的文档可以被归为一个概念。从这些在线百科中构建出的针对某一概念的层次话题对于搜索与浏览、信息组织和检索等应用都有很大的帮助。然... 中文在线百科包含大量有价值的信息,很多工作成功地将其用于各类知识获取任务。例如,拥有相似话题的文档可以被归为一个概念。从这些在线百科中构建出的针对某一概念的层次话题对于搜索与浏览、信息组织和检索等应用都有很大的帮助。然而,目前尚未出现对在线百科中某一概念层次话题构建的研究。针对中文在线百科的异构性与粗糙性的问题,提出了一种基于贝叶斯网络的话题层次构建方法。该方法同时综合文档的结构化目录信息和非结构化文本信息,采用最大树形图算法自动地在文档所属概念的贝叶斯话题网络中建立层次话题。实验证明,与原有的百科话题结构相比较,所提方法在保持75%的准确性的同时扩充了4倍的内容。 展开更多
关键词 中文在线百科 层次话题 结构化目录信息 结构文本信息
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部