期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于自适应结构学习的深度文本聚类
1
作者
潘伟
黄瑞章
+1 位作者
任丽娜
薛菁菁
《计算机工程》
CAS
CSCD
北大核心
2024年第11期89-97,共9页
近年来,将结构信息应用于深度文本聚类中以提升聚类效果取得了较优的成果。然而,结构信息的构造方法大多只进行简单的距离测算且近邻数量固定,导致构建的图难以获得较精确的文本结构信息。另外,众多方法对近邻文本只进行一阶挖掘,使图...
近年来,将结构信息应用于深度文本聚类中以提升聚类效果取得了较优的成果。然而,结构信息的构造方法大多只进行简单的距离测算且近邻数量固定,导致构建的图难以获得较精确的文本结构信息。另外,众多方法对近邻文本只进行一阶挖掘,使图结构信息未得到完全挖掘,限制了结合结构信息的深度文本聚类性能。为此,提出一种基于自适应结构学习的深度文本聚类模型DCMBS。首先,设计一种阈值构图方法,动态调整近邻文本数量,解决因近邻文本固定存在结构信息不精确的问题;其次,引入一种拓扑探索近邻的方法,对近邻文本进行多阶挖掘,解决以往方法只进行一阶挖掘存在结构信息不完整的问题。此外,设计了1个阈值衰减策略,避免拓扑过程中因拓扑阶数增加导致学习泛化。在4个真实数据集的实验结果表明,DCMBS与现有较好的聚类模型相比,准确度、归一化互信息(NMI)和调整兰德指数(ARI)平均提高了6.83、2.93、6.23个百分点。
展开更多
关键词
阈值
深度
文本
聚类
文本结构信息
图神经网络
自适应
结构
学习
下载PDF
职称材料
超文本信息结构导航力分析
被引量:
10
2
作者
张海涛
刘甲学
毕强
《情报学报》
CSSCI
北大核心
2002年第2期139-142,共4页
本文以超文本信息组织为基点 ,引入了线性力、自由度和导航力三个术语来对超文本信息结构进行分析 ,通过对它们之间关系的分析 。
关键词
超
文本
信息
结构
导航力
线性力
自由度
超
文本
信息
组织
下载PDF
职称材料
基于增强加权共现图和图核相似性的文本分类方法
被引量:
1
3
作者
田英
郝兆才
《计算机工程与设计》
北大核心
2023年第5期1434-1440,共7页
为有效表示文本结构信息,提高文本分类性能,提出一种增强加权共现图的文本分类方法。利用加权共现图表征文本,基于术语与文本分类的相关性对术语及其相依性进行加权;通过词相似性矩阵对加权图进行增强,增强图的节点和边。采用基于边匹...
为有效表示文本结构信息,提高文本分类性能,提出一种增强加权共现图的文本分类方法。利用加权共现图表征文本,基于术语与文本分类的相关性对术语及其相依性进行加权;通过词相似性矩阵对加权图进行增强,增强图的节点和边。采用基于边匹配的图核,计算文本之间的相似性。实验在3个公开数据集上进行,在标准设置情况下,相比于其它优秀方法,所提方法在精度、召回率和F1得分提高约5%。在少量标注样本情况下,所提方法Micro-F1的增益在3%到8%之间。
展开更多
关键词
文本结构信息
文本
分类
加权共现图
增强图
相似性
相似性矩阵
边匹配
下载PDF
职称材料
基于多元信息加权协调的超文本分类算法
4
作者
鲁薇
《信息技术与信息化》
2006年第3期104-107,共4页
本文综合利用超文本的各种多元化信息规则,提出一种基于多元信息加权协调的超文本分类算法。该算法在分类时,通过对抽取到的数据集超文本文档中的超文本信息进行加权处理,更好的综合协调地利用了超文本的多元结构化信息。通过三个数据...
本文综合利用超文本的各种多元化信息规则,提出一种基于多元信息加权协调的超文本分类算法。该算法在分类时,通过对抽取到的数据集超文本文档中的超文本信息进行加权处理,更好的综合协调地利用了超文本的多元结构化信息。通过三个数据集的综合实验,结果表明,相较于单独利用某种超文本结构信息进行分类的方法,基于多元信息加权协调超文本算法具有较好的性能。
展开更多
关键词
超
文本
分类
超
文本结构信息
超
文本
信息
使用规则
信息
加权协调
下载PDF
职称材料
一种改进的基于VSM的文本分类算法
被引量:
8
5
作者
张彰
樊孝忠
《计算机工程与设计》
CSCD
北大核心
2006年第21期4078-4080,共3页
在文本分类中,向量空间模型(VSM)是常用的文本表示形式,但是它把文本看作词袋,忽略了文本的结构信息。通过区别对待文本的不同部分来改进基本的向量空间方法:对于标题和段落首尾句采用核心词共现的方法来计算其对分类的作用;对其它部分...
在文本分类中,向量空间模型(VSM)是常用的文本表示形式,但是它把文本看作词袋,忽略了文本的结构信息。通过区别对待文本的不同部分来改进基本的向量空间方法:对于标题和段落首尾句采用核心词共现的方法来计算其对分类的作用;对其它部分采用基本的向量空间模型方法进行计算。对这两部分的计算结果进行加权求和,来综合判定文本的类别。对改进的文本分类方法进行了测试,实验结果表明改进的方法提高了分类的精确率、召回率和F1测试值。
展开更多
关键词
文本
分类
向量空间模型
文本结构信息
核心词
共现
下载PDF
职称材料
双语词汇自动获取系统
6
作者
李芳
盛焕烨
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2001年第9期1386-1389,1394,共5页
介绍了一个基于 Internet的双语词汇获取系统 ,提出了根据文本结构信息和内容信息进行对齐的方法 .该方法的实现不依赖于任何语言的特点 ,从对齐结果中自动抽取双语词汇 ,系统最终的结果词汇又被用作鉴定未知词汇的依据 .所抽取出的词...
介绍了一个基于 Internet的双语词汇获取系统 ,提出了根据文本结构信息和内容信息进行对齐的方法 .该方法的实现不依赖于任何语言的特点 ,从对齐结果中自动抽取双语词汇 ,系统最终的结果词汇又被用作鉴定未知词汇的依据 .所抽取出的词汇反映了大量的新词、专有名词和在不同上下文里的各种译文 ,可以应用在机器翻译和多语种信息检索中 .
展开更多
关键词
词汇获取
自然语言处理
INTERNET
双语词汇
文本结构信息
内容
信息
对齐方法
下载PDF
职称材料
基于异构中文在线百科的层次话题构建
7
作者
王煦中
刘琰
+1 位作者
胡琳梅
陈静
《计算机科学》
CSCD
北大核心
2017年第5期226-231,共6页
中文在线百科包含大量有价值的信息,很多工作成功地将其用于各类知识获取任务。例如,拥有相似话题的文档可以被归为一个概念。从这些在线百科中构建出的针对某一概念的层次话题对于搜索与浏览、信息组织和检索等应用都有很大的帮助。然...
中文在线百科包含大量有价值的信息,很多工作成功地将其用于各类知识获取任务。例如,拥有相似话题的文档可以被归为一个概念。从这些在线百科中构建出的针对某一概念的层次话题对于搜索与浏览、信息组织和检索等应用都有很大的帮助。然而,目前尚未出现对在线百科中某一概念层次话题构建的研究。针对中文在线百科的异构性与粗糙性的问题,提出了一种基于贝叶斯网络的话题层次构建方法。该方法同时综合文档的结构化目录信息和非结构化文本信息,采用最大树形图算法自动地在文档所属概念的贝叶斯话题网络中建立层次话题。实验证明,与原有的百科话题结构相比较,所提方法在保持75%的准确性的同时扩充了4倍的内容。
展开更多
关键词
中文在线百科
层次话题
结构
化目录
信息
非
结构
化
文本
信息
下载PDF
职称材料
题名
基于自适应结构学习的深度文本聚类
1
作者
潘伟
黄瑞章
任丽娜
薛菁菁
机构
贵州大学文本计算与认知智能教育部工程研究中心
贵州大学公共大数据国家重点实验室
贵州大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第11期89-97,共9页
基金
国家自然科学基金(62166007)
贵州省自然科学基金(黔科合基础ZK[2022]027)。
文摘
近年来,将结构信息应用于深度文本聚类中以提升聚类效果取得了较优的成果。然而,结构信息的构造方法大多只进行简单的距离测算且近邻数量固定,导致构建的图难以获得较精确的文本结构信息。另外,众多方法对近邻文本只进行一阶挖掘,使图结构信息未得到完全挖掘,限制了结合结构信息的深度文本聚类性能。为此,提出一种基于自适应结构学习的深度文本聚类模型DCMBS。首先,设计一种阈值构图方法,动态调整近邻文本数量,解决因近邻文本固定存在结构信息不精确的问题;其次,引入一种拓扑探索近邻的方法,对近邻文本进行多阶挖掘,解决以往方法只进行一阶挖掘存在结构信息不完整的问题。此外,设计了1个阈值衰减策略,避免拓扑过程中因拓扑阶数增加导致学习泛化。在4个真实数据集的实验结果表明,DCMBS与现有较好的聚类模型相比,准确度、归一化互信息(NMI)和调整兰德指数(ARI)平均提高了6.83、2.93、6.23个百分点。
关键词
阈值
深度
文本
聚类
文本结构信息
图神经网络
自适应
结构
学习
Keywords
threshold
deep document clustering
text structure information
Graph Neural Network(GNN)
adaptive structural learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
超文本信息结构导航力分析
被引量:
10
2
作者
张海涛
刘甲学
毕强
机构
吉林大学管理学院信息管理系
出处
《情报学报》
CSSCI
北大核心
2002年第2期139-142,共4页
基金
国家社科基金项目<超文本信息导航内在机制与认知功能研究>成果之一
文摘
本文以超文本信息组织为基点 ,引入了线性力、自由度和导航力三个术语来对超文本信息结构进行分析 ,通过对它们之间关系的分析 。
关键词
超
文本
信息
结构
导航力
线性力
自由度
超
文本
信息
组织
Keywords
hypertext, information structure,navigation.
分类号
G354 [文化科学—情报学]
下载PDF
职称材料
题名
基于增强加权共现图和图核相似性的文本分类方法
被引量:
1
3
作者
田英
郝兆才
机构
济宁学院教育培训学院
曲阜师范大学数学科学学院
出处
《计算机工程与设计》
北大核心
2023年第5期1434-1440,共7页
基金
山东省自然科学基金面上基金项目(ZR2014AM034)。
文摘
为有效表示文本结构信息,提高文本分类性能,提出一种增强加权共现图的文本分类方法。利用加权共现图表征文本,基于术语与文本分类的相关性对术语及其相依性进行加权;通过词相似性矩阵对加权图进行增强,增强图的节点和边。采用基于边匹配的图核,计算文本之间的相似性。实验在3个公开数据集上进行,在标准设置情况下,相比于其它优秀方法,所提方法在精度、召回率和F1得分提高约5%。在少量标注样本情况下,所提方法Micro-F1的增益在3%到8%之间。
关键词
文本结构信息
文本
分类
加权共现图
增强图
相似性
相似性矩阵
边匹配
Keywords
text structure information
text classification
weighted co-occurrence graph
enhanced graph
similarity
similarity matrix
edge matching
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多元信息加权协调的超文本分类算法
4
作者
鲁薇
机构
湖南铁道职业技术学院
出处
《信息技术与信息化》
2006年第3期104-107,共4页
文摘
本文综合利用超文本的各种多元化信息规则,提出一种基于多元信息加权协调的超文本分类算法。该算法在分类时,通过对抽取到的数据集超文本文档中的超文本信息进行加权处理,更好的综合协调地利用了超文本的多元结构化信息。通过三个数据集的综合实验,结果表明,相较于单独利用某种超文本结构信息进行分类的方法,基于多元信息加权协调超文本算法具有较好的性能。
关键词
超
文本
分类
超
文本结构信息
超
文本
信息
使用规则
信息
加权协调
Keywords
Hypertext classification Information of hypertext Rules of using hypertext information Co-weighting information.
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种改进的基于VSM的文本分类算法
被引量:
8
5
作者
张彰
樊孝忠
机构
北京理工大学计算机科学系
出处
《计算机工程与设计》
CSCD
北大核心
2006年第21期4078-4080,共3页
文摘
在文本分类中,向量空间模型(VSM)是常用的文本表示形式,但是它把文本看作词袋,忽略了文本的结构信息。通过区别对待文本的不同部分来改进基本的向量空间方法:对于标题和段落首尾句采用核心词共现的方法来计算其对分类的作用;对其它部分采用基本的向量空间模型方法进行计算。对这两部分的计算结果进行加权求和,来综合判定文本的类别。对改进的文本分类方法进行了测试,实验结果表明改进的方法提高了分类的精确率、召回率和F1测试值。
关键词
文本
分类
向量空间模型
文本结构信息
核心词
共现
Keywords
text categorization
vector space model
text structural information
core words
co-occurrence
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
双语词汇自动获取系统
6
作者
李芳
盛焕烨
机构
上海交通大学计算机科学与工程系
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2001年第9期1386-1389,1394,共5页
基金
国家自然科学基金资助项目 ( 6 0 0 830 0 3)
文摘
介绍了一个基于 Internet的双语词汇获取系统 ,提出了根据文本结构信息和内容信息进行对齐的方法 .该方法的实现不依赖于任何语言的特点 ,从对齐结果中自动抽取双语词汇 ,系统最终的结果词汇又被用作鉴定未知词汇的依据 .所抽取出的词汇反映了大量的新词、专有名词和在不同上下文里的各种译文 ,可以应用在机器翻译和多语种信息检索中 .
关键词
词汇获取
自然语言处理
INTERNET
双语词汇
文本结构信息
内容
信息
对齐方法
Keywords
bilingual lexicon acquisition
natural language processing
Internet application
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
TP393.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于异构中文在线百科的层次话题构建
7
作者
王煦中
刘琰
胡琳梅
陈静
机构
数学工程与先进计算国家重点实验室
清华大学计算机科学与技术系
出处
《计算机科学》
CSCD
北大核心
2017年第5期226-231,共6页
基金
国家自然科学基金项目(61309007)
国家"八六三"高技术研究发展计划基金项目(2006AA01Z409)资助
文摘
中文在线百科包含大量有价值的信息,很多工作成功地将其用于各类知识获取任务。例如,拥有相似话题的文档可以被归为一个概念。从这些在线百科中构建出的针对某一概念的层次话题对于搜索与浏览、信息组织和检索等应用都有很大的帮助。然而,目前尚未出现对在线百科中某一概念层次话题构建的研究。针对中文在线百科的异构性与粗糙性的问题,提出了一种基于贝叶斯网络的话题层次构建方法。该方法同时综合文档的结构化目录信息和非结构化文本信息,采用最大树形图算法自动地在文档所属概念的贝叶斯话题网络中建立层次话题。实验证明,与原有的百科话题结构相比较,所提方法在保持75%的准确性的同时扩充了4倍的内容。
关键词
中文在线百科
层次话题
结构
化目录
信息
非
结构
化
文本
信息
Keywords
Chinese online encyclopedia, Topic hierarchy, Structured contents table, Unstructured text description
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于自适应结构学习的深度文本聚类
潘伟
黄瑞章
任丽娜
薛菁菁
《计算机工程》
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
超文本信息结构导航力分析
张海涛
刘甲学
毕强
《情报学报》
CSSCI
北大核心
2002
10
下载PDF
职称材料
3
基于增强加权共现图和图核相似性的文本分类方法
田英
郝兆才
《计算机工程与设计》
北大核心
2023
1
下载PDF
职称材料
4
基于多元信息加权协调的超文本分类算法
鲁薇
《信息技术与信息化》
2006
0
下载PDF
职称材料
5
一种改进的基于VSM的文本分类算法
张彰
樊孝忠
《计算机工程与设计》
CSCD
北大核心
2006
8
下载PDF
职称材料
6
双语词汇自动获取系统
李芳
盛焕烨
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2001
0
下载PDF
职称材料
7
基于异构中文在线百科的层次话题构建
王煦中
刘琰
胡琳梅
陈静
《计算机科学》
CSCD
北大核心
2017
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部