期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于检索结果聚类的XML伪相关文档查找
被引量:
1
1
作者
钟敏娟
万常选
+1 位作者
刘德喜
廖述梅
《计算机科学》
CSCD
北大核心
2013年第10期172-177,共6页
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML...
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML内容和结构特征的前提下,提出了基于均衡化权值的簇标签提取方法,并以此为基础,提出了候选簇的排序模型和基于候选簇的文档排序模型。相关实验数据表明,与初始检索结果相比,排序模型获得了较好的性能,有效地查找到了更多的XML伪相关文档。
展开更多
关键词
信息检索
XML伪相关反馈
XML检索结果聚类
簇标签
排序模型
下载PDF
职称材料
基于共识和分类改善文档聚类的识别信息方法
被引量:
6
2
作者
王留洋
俞扬信
+1 位作者
陈伯伦
章慧
《计算机应用》
CSCD
北大核心
2020年第4期1069-1073,共5页
不同的聚类算法用于设计各自的策略,然而,每种技术在执行特定数据集时都有一定的局限性。选择恰当的识别信息方法(DIM)可确保文档聚类的进行。针对这些问题提出一种基于共识和分类的文档聚类(DCCC)的DIM。首先,选择识别信息最大化聚类(C...
不同的聚类算法用于设计各自的策略,然而,每种技术在执行特定数据集时都有一定的局限性。选择恰当的识别信息方法(DIM)可确保文档聚类的进行。针对这些问题提出一种基于共识和分类的文档聚类(DCCC)的DIM。首先,选择识别信息最大化聚类(CDIM)作为数据集生成初始聚类的解决方法,并使用两种不同的CDIM方法生成两个初始聚集;其次,使用不同的参数方法对两初始聚集再进行初始化,通过簇标签信息间的关系建立共识,最大限度地提高文档的识别数总和;最后,选择识别文本权重分类(DTWC)作为文本分类器给共识分配新的簇标签,通过训练文本分类器更改基础分区,并根据预报标签信息生成最后的分区。采用8个网络数据集进行实验,选择BCubed的精度和召回率指标进行聚类验证。实验结果表明,所提出的共识分类方法的聚类结果优于对比方法的聚类结果。
展开更多
关键词
共识聚类
文档聚类
识别信息
簇标签
文本分类器
下载PDF
职称材料
主题模型在检索结果聚类中的应用
被引量:
2
3
作者
蒋宗礼
赵思露
《软件导刊》
2018年第12期177-181,共5页
检索结果聚类能够有效帮助提高获取信息的效率和质量。针对传统文本聚类模型存在数据维数过高、缺乏语义理解等问题,提出一种面向检索结果聚类的融合共现分析主题建模算法。基于改进的LDA模型,对得到的"文档-主题"概率分布进...
检索结果聚类能够有效帮助提高获取信息的效率和质量。针对传统文本聚类模型存在数据维数过高、缺乏语义理解等问题,提出一种面向检索结果聚类的融合共现分析主题建模算法。基于改进的LDA模型,对得到的"文档-主题"概率分布进行聚类分析,采用K-means算法完成聚类过程,最后提出根据聚类中心提取主题词作为类簇标签。实验结果表明,改进的LDA算法在检索结果聚类应用上不仅获得了很好的聚类效果,类簇标签也有良好的可读性。
展开更多
关键词
LDA
共现分析
检索结果聚类
类
簇标签
下载PDF
职称材料
基于语步识别的科技文献结构化自动综合工具构建
被引量:
1
4
作者
刘熠
张智雄
+1 位作者
王宇飞
李雪思
《数据分析与知识发现》
EI
CSSCI
CSCD
北大核心
2024年第2期65-73,共9页
【目的】借鉴文献综合(Synthesis)的思想,利用人工智能技术构建科技文献结构化自动综合工具,以结构化的形式自动梳理文献集的研究脉络与研究骨架,揭示文献集的要点与看点。【方法】提出了一种基于语步识别的科技文献结构化自动综合工具...
【目的】借鉴文献综合(Synthesis)的思想,利用人工智能技术构建科技文献结构化自动综合工具,以结构化的形式自动梳理文献集的研究脉络与研究骨架,揭示文献集的要点与看点。【方法】提出了一种基于语步识别的科技文献结构化自动综合工具的建设思路,即通过语步识别与研究问题、研究方法、研究进展短语抽取,自动揭示单篇文献中的关键知识内容;通过层次聚类与类簇标签生成,实现多篇文献的知识整理归纳;通过设计树形综合结构,指导结构化综合结果输出。【结果】研发了结构化自动综合工具,能够自动综合文献集内容,并按照“研究问题-研究方法-研究进展”的树形结构揭示文献集的研究脉络与骨架。【局限】由于聚类技术的限制,目前还存在聚类准确率不足、聚类簇个数难以确定等问题,影响了自动综合效果。【结论】基于语步识别技术,构建面向实际应用的结构化自动综合工具,支持文献检索、自动综合、结果循证等功能,验证了基于语步识别实现结构化自动综合思路的可行性和有效性。
展开更多
关键词
科技文献
语步识别
结构化自动综合
短语抽取
层次聚类
类
簇标签
生成
原文传递
题名
基于检索结果聚类的XML伪相关文档查找
被引量:
1
1
作者
钟敏娟
万常选
刘德喜
廖述梅
机构
江西财经大学信息管理学院
江西财经大学数据与知识工程江西省高校重点实验室
出处
《计算机科学》
CSCD
北大核心
2013年第10期172-177,共6页
基金
国家自然基金项目(61173146
61262035
+1 种基金
60763001)
国家社会科学基金(12CTQ042)资助
文摘
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML内容和结构特征的前提下,提出了基于均衡化权值的簇标签提取方法,并以此为基础,提出了候选簇的排序模型和基于候选簇的文档排序模型。相关实验数据表明,与初始检索结果相比,排序模型获得了较好的性能,有效地查找到了更多的XML伪相关文档。
关键词
信息检索
XML伪相关反馈
XML检索结果聚类
簇标签
排序模型
Keywords
Information retrieval, XML pseudo-relevance feedback, XML search results clustering, Cluster label, Ran-king model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于共识和分类改善文档聚类的识别信息方法
被引量:
6
2
作者
王留洋
俞扬信
陈伯伦
章慧
机构
淮阴工学院计算机与软件工程学院
出处
《计算机应用》
CSCD
北大核心
2020年第4期1069-1073,共5页
基金
国家自然科学基金资助项目(61602202)。
文摘
不同的聚类算法用于设计各自的策略,然而,每种技术在执行特定数据集时都有一定的局限性。选择恰当的识别信息方法(DIM)可确保文档聚类的进行。针对这些问题提出一种基于共识和分类的文档聚类(DCCC)的DIM。首先,选择识别信息最大化聚类(CDIM)作为数据集生成初始聚类的解决方法,并使用两种不同的CDIM方法生成两个初始聚集;其次,使用不同的参数方法对两初始聚集再进行初始化,通过簇标签信息间的关系建立共识,最大限度地提高文档的识别数总和;最后,选择识别文本权重分类(DTWC)作为文本分类器给共识分配新的簇标签,通过训练文本分类器更改基础分区,并根据预报标签信息生成最后的分区。采用8个网络数据集进行实验,选择BCubed的精度和召回率指标进行聚类验证。实验结果表明,所提出的共识分类方法的聚类结果优于对比方法的聚类结果。
关键词
共识聚类
文档聚类
识别信息
簇标签
文本分类器
Keywords
consensus clustering
document clustering
discrimination information
cluster label
text classifier
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
主题模型在检索结果聚类中的应用
被引量:
2
3
作者
蒋宗礼
赵思露
机构
北京工业大学信息学部
出处
《软件导刊》
2018年第12期177-181,共5页
文摘
检索结果聚类能够有效帮助提高获取信息的效率和质量。针对传统文本聚类模型存在数据维数过高、缺乏语义理解等问题,提出一种面向检索结果聚类的融合共现分析主题建模算法。基于改进的LDA模型,对得到的"文档-主题"概率分布进行聚类分析,采用K-means算法完成聚类过程,最后提出根据聚类中心提取主题词作为类簇标签。实验结果表明,改进的LDA算法在检索结果聚类应用上不仅获得了很好的聚类效果,类簇标签也有良好的可读性。
关键词
LDA
共现分析
检索结果聚类
类
簇标签
Keywords
LDA
co-occurrence analysis
clustering of search results
cluster label
分类号
TP319 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于语步识别的科技文献结构化自动综合工具构建
被引量:
1
4
作者
刘熠
张智雄
王宇飞
李雪思
机构
中国科学院文献情报中心
中国科学院大学经济与管理学院信息资源管理系
出处
《数据分析与知识发现》
EI
CSSCI
CSCD
北大核心
2024年第2期65-73,共9页
基金
中国科学院特别研究助理资助项目(项目编号:E1290905)
国家科技图书文献中心(NSTL)专项(项目编号:2022XM28)的研究成果之一。
文摘
【目的】借鉴文献综合(Synthesis)的思想,利用人工智能技术构建科技文献结构化自动综合工具,以结构化的形式自动梳理文献集的研究脉络与研究骨架,揭示文献集的要点与看点。【方法】提出了一种基于语步识别的科技文献结构化自动综合工具的建设思路,即通过语步识别与研究问题、研究方法、研究进展短语抽取,自动揭示单篇文献中的关键知识内容;通过层次聚类与类簇标签生成,实现多篇文献的知识整理归纳;通过设计树形综合结构,指导结构化综合结果输出。【结果】研发了结构化自动综合工具,能够自动综合文献集内容,并按照“研究问题-研究方法-研究进展”的树形结构揭示文献集的研究脉络与骨架。【局限】由于聚类技术的限制,目前还存在聚类准确率不足、聚类簇个数难以确定等问题,影响了自动综合效果。【结论】基于语步识别技术,构建面向实际应用的结构化自动综合工具,支持文献检索、自动综合、结果循证等功能,验证了基于语步识别实现结构化自动综合思路的可行性和有效性。
关键词
科技文献
语步识别
结构化自动综合
短语抽取
层次聚类
类
簇标签
生成
Keywords
Scientific and Technological Literature
Move Recognition
Automatic Structured Synthesis
Phrase Extraction
Hierarchical Clustering
Label Generation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
G35 [文化科学—情报学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于检索结果聚类的XML伪相关文档查找
钟敏娟
万常选
刘德喜
廖述梅
《计算机科学》
CSCD
北大核心
2013
1
下载PDF
职称材料
2
基于共识和分类改善文档聚类的识别信息方法
王留洋
俞扬信
陈伯伦
章慧
《计算机应用》
CSCD
北大核心
2020
6
下载PDF
职称材料
3
主题模型在检索结果聚类中的应用
蒋宗礼
赵思露
《软件导刊》
2018
2
下载PDF
职称材料
4
基于语步识别的科技文献结构化自动综合工具构建
刘熠
张智雄
王宇飞
李雪思
《数据分析与知识发现》
EI
CSSCI
CSCD
北大核心
2024
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部