期刊文献+
共找到258篇文章
< 1 2 13 >
每页显示 20 50 100
The Research of an Incremental Conceptive Clustering Algorithm and Its Application in Detecting Money Laundering
1
作者 CHEN Yunkai LU Zhengding LI Ruixuan LI Yuhua SUN Xiaolin 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1076-1080,共5页
Considering the constantly increasing of data in large databases such as wire transfer database, incremental clustering algorithms play a more and more important role in Data Mining (DM). However, Few of the traditi... Considering the constantly increasing of data in large databases such as wire transfer database, incremental clustering algorithms play a more and more important role in Data Mining (DM). However, Few of the traditional clustering algorithms can not only handle the categorical data, but also explain its output clearly. Based on the idea of dynamic clustering, an incremental conceptive clustering algorithm is proposed in this paper. Which introduces the Semantic Core Tree (SCT) to deal with large volume of categorical wire transfer data for the detecting money laundering. In addition, the rule generation algorithm is presented here to express the clustering result by the format of knowledge. When we apply this idea in financial data mining, the efficiency of searching the characters of money laundering data will be improved. 展开更多
关键词 CATEGORICAL DM incremental conceptive clustering SCT money laundering
下载PDF
Concept Association and Hierarchical Hamming Clustering Model in Text Classification
2
作者 SuGui-yang LiJian-hua MaYing-hua LiSheng-hong YinZhong-hang 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第3期339-342,共4页
We propose two models in this paper. The concept of association model is put forward to obtain the co-occurrence relationships among keywords in the documents and the hierarchical Hamming clustering model is used to r... We propose two models in this paper. The concept of association model is put forward to obtain the co-occurrence relationships among keywords in the documents and the hierarchical Hamming clustering model is used to reduce the dimensionality of the category feature vector space which can solve the problem of the extremely high dimensionality of the documents' feature space. The results of experiment indicate that it can obtain the co-occurrence relations among key-words in the documents which promote the recall of classification system effectively. The hierarchical Hamming clustering model can reduce the dimensionality of the category feature vector efficiently, the size of the vector space is only about 10% of the primary dimensionality. Key words text classification - concept association - hierarchical clustering - hamming clustering CLC number TN 915. 08 Foundation item: Supporteded by the National 863 Project of China (2001AA142160, 2002AA145090)Biography: Su Gui-yang (1974-), male, Ph. D candidate, research direction: information filter and text classification. 展开更多
关键词 text classification concept association hierarchical clustering hamming clustering
下载PDF
一般信息系统的PoClustering与概念格 被引量:1
3
作者 吴强 《绍兴文理学院学报》 2008年第9期12-18,33,共8页
传统聚类方法生成的子集,一般来说都是不相交的.而严格的不相交分类结构,不能充分表现象本体这样的事物间丰富的类关系.在基因本体中,类与子类既不是简单的树也不是格结构,而是一个有向非循环图,其任何子女都可能有多个父结点.PoCluster... 传统聚类方法生成的子集,一般来说都是不相交的.而严格的不相交分类结构,不能充分表现象本体这样的事物间丰富的类关系.在基因本体中,类与子类既不是简单的树也不是格结构,而是一个有向非循环图,其任何子女都可能有多个父结点.PoClustering是相异数据的一种无损聚类方法,概念格则反映了数据的对象和属性的对应关系.采用了PoClustering方法,在保持尽量多的信息的前提下建立一般数据集(信息系统)的属性确定下的概念化分类,讨论了它的算法,从概念格的角度研究了这种类的结构特征. 展开更多
关键词 偏序集 聚类 概念格
下载PDF
Identification and Prediction of Interdisciplinary Research Topics: A Study Based on the Concept Lattice Theory 被引量:4
4
作者 Haiyun Xu Chao Wang +1 位作者 Kun Dong Zenghui Yue 《Journal of Data and Information Science》 CSCD 2019年第1期60-88,共29页
Purpose: Formal concept analysis(FCA) and concept lattice theory(CLT) are introduced for constructing a network of IDR topics and for evaluating their effectiveness for knowledge structure exploration.Design/methodolo... Purpose: Formal concept analysis(FCA) and concept lattice theory(CLT) are introduced for constructing a network of IDR topics and for evaluating their effectiveness for knowledge structure exploration.Design/methodology/approach: We introduced the theory and applications of FCA and CLT, and then proposed a method for interdisciplinary knowledge discovery based on CLT. As an example of empirical analysis, interdisciplinary research(IDR) topics in Information & Library Science(LIS) and Medical Informatics, and in LIS and Geography-Physical, were utilized as empirical fields. Subsequently, we carried out a comparative analysis with two other IDR topic recognition methods.Findings: The CLT approach is suitable for IDR topic identification and predictions.Research limitations: IDR topic recognition based on the CLT is not sensitive to the interdisciplinarity of topic terms, since the data can only reflect whether there is a relationship between the discipline and the topic terms. Moreover, the CLT cannot clearly represent a large amounts of concepts.Practical implications: A deeper understanding of the IDR topics was obtained as the structural and hierarchical relationships between them were identified, which can help to get more precise identification and prediction to IDR topics.Originality/value: IDR topics identification based on CLT have performed well and this theory has several advantages for identifying and predicting IDR topics. First, in a concept lattice, there is a partial order relation between interconnected nodes, and consequently, a complete concept lattice can present hierarchical properties. Second, clustering analysis of IDR topics based on concept lattices can yield clusters that highlight the essential knowledge features and help display the semantic relationship between different IDR topics. Furthermore, the Hasse diagram automatically displays all the IDR topics associated with the different disciplines, thus forming clusters of specific concepts and visually retaining and presenting the associations of IDR topics through multiple inheritance relationships between the concepts. 展开更多
关键词 INTERDISCIPLINARY research IDR TOPICS concept lattice FORMAL ANALYSIS cluster ANALYSIS
下载PDF
结合软约束的演化数据流模糊聚类算法
5
作者 代少升 边志奇 袁中明 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第2期287-298,共12页
多源局部放电检测中,不同类型的局放信号同时存在且不断变化使得信号的分离更具挑战,而这种情况同样存在于许多数据流的聚类分析场景中。为了能够适应类簇内的不均匀密度和类簇间的重叠边界问题,同时对数据流的漂移和演化进行及时跟踪,... 多源局部放电检测中,不同类型的局放信号同时存在且不断变化使得信号的分离更具挑战,而这种情况同样存在于许多数据流的聚类分析场景中。为了能够适应类簇内的不均匀密度和类簇间的重叠边界问题,同时对数据流的漂移和演化进行及时跟踪,提出了一种结合软约束的实时数据流模糊聚类算法。算法引入2种模糊性软约束来描述微簇距离和密度上的不确定度,通过阈值划分出核心微簇、边界微簇和离群微簇;在类簇边缘使用模糊隶属度,给予微簇分属不同类簇的可能性,保证类簇的完整性并提高聚类效果;使用两阶段的流程结构和2种时间窗口模型,赋予算法具有对可变化数据流的适应能力和更低的时间空间占用率。在多种数据集上的实验表明,该算法相比同类型算法在聚类效果上提升了1%~3%,且平均运行时间缩短5%~20%,在实际硬件平台的测试中也验证了算法的聚类分离性能。 展开更多
关键词 数据流聚类 密度聚类 模糊聚类 概念漂移 局部放电
下载PDF
基于快速康复理念的集束化护理方案对颈椎病手术患者术后康复的影响研究 被引量:1
6
作者 吴明华 张凤霞 张明毓 《中外医疗》 2024年第8期138-141,共4页
目的探究基于快速康复理念的集束化护理方案对颈椎病手术患者术后康复的影响。方法方便选取2020年9月—2022年9月福建省泉州市第一医院骨科收治的116例颈椎病手术患者为研究对象,根据住院编号的单双数将其分为对照组(单数)和观察组(双... 目的探究基于快速康复理念的集束化护理方案对颈椎病手术患者术后康复的影响。方法方便选取2020年9月—2022年9月福建省泉州市第一医院骨科收治的116例颈椎病手术患者为研究对象,根据住院编号的单双数将其分为对照组(单数)和观察组(双数),每组58例。对照组实施常规护理,观察组实施基于快速康复理念的集束化护理,比较两组干预前后的颈椎活动度和生活质量。结果干预后,观察组患者颈椎前屈后伸、左右弯屈、左右旋转的活动度大于对照组,差异有统计学意义(P均<0.05);观察组颈椎病临床评价量表的主观症状、临床体征及适应能力评分及总分高于对照组,差异有统计学意义(P均<0.05)。结论颈椎病手术患者采用基于快速康复理念的集束化护理方案,可以促进其颈椎功能改善,提升其生活质量。 展开更多
关键词 快速康复理念 集束化护理方案 颈椎病手术患者 术后康复
下载PDF
基于聚簇模型重用的概念漂移数据流半监督分类算法 被引量:1
7
作者 康伟 黎利辉 文益民 《计算机科学》 CSCD 北大核心 2024年第4期124-131,共8页
带概念漂移的半监督数据流分类任务中,仅有少部分的数据被标记,这给分类器的训练、概念漂移的检测以及分类器对新概念的适应带来了巨大的挑战。现有的半监督聚簇分类算法仅对分类器池中的聚簇模型进行简单的增量更新,未能有效重用历史... 带概念漂移的半监督数据流分类任务中,仅有少部分的数据被标记,这给分类器的训练、概念漂移的检测以及分类器对新概念的适应带来了巨大的挑战。现有的半监督聚簇分类算法仅对分类器池中的聚簇模型进行简单的增量更新,未能有效重用历史聚簇模型。因此,文中提出了一种新的聚簇模型重用的半监督分类算法,称为CDCMR。首先,数据流以数据块的形式到来,对数据块分完类后,训练一个簇数自适应确定的聚簇模型。其次,通过计算分类器池中的各组件分类器与聚簇模型之间的相似度,挑选多个组件分类器。再次,用当前数据块对挑选出来的组件分类器进行模型重用后,与聚簇模型集成。然后,将分类器池划分为新旧更替和多样性最大化分类器池进行更新。最后,对下一个数据块的样本进行集成分类。在多个人工和真实数据集上进行实验,结果表明,所提算法1)能有效适应概念漂移,与现有方法相比其性能有显著性提升。 展开更多
关键词 数据流 半监督学习 概念漂移 聚簇模型重用 集成学习
下载PDF
基于改进模糊聚类算法的大数据随机挖掘仿真 被引量:1
8
作者 李萍 刘金金 《计算机仿真》 2024年第2期496-499,521,共5页
大数据挖掘是从大量有噪声的、随机模糊的大数据中提取有价值信息的过程,由于海量大数据具有多维性、稀疏性以及动态性等特点,准确获取其分布特征的难度较大,随机挖掘难以直接实现。为此提出基于改进模糊聚类算法的大数据随机挖掘方法... 大数据挖掘是从大量有噪声的、随机模糊的大数据中提取有价值信息的过程,由于海量大数据具有多维性、稀疏性以及动态性等特点,准确获取其分布特征的难度较大,随机挖掘难以直接实现。为此提出基于改进模糊聚类算法的大数据随机挖掘方法。利用建立的语义概念树模型获取大数据的特征分布关系,并根据模糊语义分析法得出大数据的语义相似性、关联性条件,提取大数据特征。优先确定最佳聚类数,采用改进模糊聚类算法对其聚类,实现基于改进模糊算法的大数据随机挖掘。实验结果表明,上述方法的大数据模糊聚类效果较好,随机挖掘准确率可达到95%以上,实验所得结果验证了上述方法较强的应用有效性。 展开更多
关键词 改进模糊聚类算法 大数据随机挖掘 语义概念树 特征提取 特征聚类
下载PDF
基于异构网络语言形式背景的知识发现及规则提取
9
作者 沙立伟 杨政 +1 位作者 刘红平 邹丽 《模式识别与人工智能》 EI CSCD 北大核心 2024年第5期469-478,共10页
在不确定性环境下,如何处理具有复杂关系的数据是研究热点之一.网络形式背景将复杂网络分析和形式概念分析结合,为复杂关系数据的知识发现提供一种有效的数学工具.文中首先从网络结构的异构性出发,提出异构网络语言形式背景.异构网络包... 在不确定性环境下,如何处理具有复杂关系的数据是研究热点之一.网络形式背景将复杂网络分析和形式概念分析结合,为复杂关系数据的知识发现提供一种有效的数学工具.文中首先从网络结构的异构性出发,提出异构网络语言形式背景.异构网络包含专家给出的主观网络,又包含通过对象的特征挖掘的客观网络.然后,考虑网络的连通性,得到全局和局部异构网络语言概念,并给出异构网络下的全局连通及局部连通知识发现算法.最后,基于异构网络语言形式背景构建关联规则提取模型,通过实例验证知识发现及规则提取的合理性和有效性. 展开更多
关键词 形式概念分析 异构网络 模糊聚类 知识发现 规则提取
下载PDF
基于ESG理念的水生态PPP项目运营期绩效评价
10
作者 罗夏玙 刘博 《建筑经济》 2024年第5期64-70,共7页
PPP项目运营期绩效评价对保障项目健康合理运营、促进项目可持续发展具有重要意义。以ESG理念为基础建立水生态PPP项目运营期绩效评价指标体系,并综合使用熵权法和序关系分析法确定指标权重,结合灰色聚类评价模型确定绩效评价结果。最后... PPP项目运营期绩效评价对保障项目健康合理运营、促进项目可持续发展具有重要意义。以ESG理念为基础建立水生态PPP项目运营期绩效评价指标体系,并综合使用熵权法和序关系分析法确定指标权重,结合灰色聚类评价模型确定绩效评价结果。最后,通过案例验证了该方法的可行性与适用性,希望为水生态PPP项目运营期的绩效评价提供有效支撑。 展开更多
关键词 运营期绩效评价 水生态PPP项目 ESG理念 灰色聚类
下载PDF
基于概念相似度的档案数据自动分类算法
11
作者 何庆 《办公自动化》 2024年第14期54-56,共3页
针对现有分类算法存在的分类准确性差,并且分类过程中造成档案数据缺失的问题,引入概念相似度,开展档案数据自动分类算法研究。通过档案资源标记矩阵的建立,采集档案数据;结合概念相似度,对不确定分类数据进行聚类;引入融合学习技术,实... 针对现有分类算法存在的分类准确性差,并且分类过程中造成档案数据缺失的问题,引入概念相似度,开展档案数据自动分类算法研究。通过档案资源标记矩阵的建立,采集档案数据;结合概念相似度,对不确定分类数据进行聚类;引入融合学习技术,实现自动化分类档案数据。通过对比实验证明,文章算法的应用可保证档案数据分类的准确性,并且在分类过程中不会出现数据丢失的问题。 展开更多
关键词 概念相似度 档案数据 自动分类 数据聚类
下载PDF
数字图书馆个性化服务用户模型研究 被引量:45
12
作者 宋丽哲 牛振东 +2 位作者 宋瀚涛 余正涛 师雪霖 《北京理工大学学报》 EI CAS CSCD 北大核心 2005年第1期58-62,共5页
提出了一种数字图书馆个性化服务用户模型构架,并对实现过程中的几个关键问题,包括用户模型表示方法,用户模型的建立以及更新算法进行了详细论述.提出了基于本体论的空间向量用户模型表示方法,建立了简单的数字图书馆领域本体,以空间向... 提出了一种数字图书馆个性化服务用户模型构架,并对实现过程中的几个关键问题,包括用户模型表示方法,用户模型的建立以及更新算法进行了详细论述.提出了基于本体论的空间向量用户模型表示方法,建立了简单的数字图书馆领域本体,以空间向量表示用户模型,以本体概念作为向量的特征项;采用支持向量机分类算法和无监督聚类算法相结合提取用户兴趣;在用户模型更新方法上,采用渐进遗忘和滑动窗口相结合的方法实现用户兴趣概念的漂移. 展开更多
关键词 用户模型 个性化服务 本体 聚类 概念漂移
下载PDF
一种基于语义内积空间模型的文本聚类算法 被引量:44
13
作者 彭京 杨冬青 +2 位作者 唐世渭 付艳 蒋汉奎 《计算机学报》 EI CSCD 北大核心 2007年第8期1354-1363,共10页
现有数据聚类方法在处理文本数据,尤其是短文本数据时,由于没有考虑词之间潜在存在的相似情况,因此导致聚类效果不理想.文中针对文本数据高维度和稀疏空间的特点,提出了一种基于语义内积空间模型的文本聚类算法.算法首先利用内积空间的... 现有数据聚类方法在处理文本数据,尤其是短文本数据时,由于没有考虑词之间潜在存在的相似情况,因此导致聚类效果不理想.文中针对文本数据高维度和稀疏空间的特点,提出了一种基于语义内积空间模型的文本聚类算法.算法首先利用内积空间的定义建立了针对中文概念、词和文本的相似度度量方法,然后从理论上进行了分析.最后通过一个两阶段处理过程,即向下分裂和向上聚合,完成文本数据的聚类.该方法成功用于中文短文本数据的聚类.实验表明相对于传统方法,文中提供的方法聚类质量更好. 展开更多
关键词 内积空间 文本聚类 概念相似度 相似计算 数据挖掘
下载PDF
Web信息检索研究进展 被引量:118
14
作者 王继成 萧嵘 +1 位作者 孙正兴 张福炎 《计算机研究与发展》 EI CSCD 北大核心 2001年第2期187-193,共7页
Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,... Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,有关 Web信息检索最新技术的比较完整的分析又十分缺乏 .在此 ,对 Web信息检索技术进行了综述 ,从 Web信息检索系统的层次化分类 (搜索引擎与目录、元搜索引擎、信息检索 agent)、一般机制和关键新技术 (基于超链的相关度排序、检索结果的联机聚类、基于概念的检索、相关度反馈 )等方面加以阐述 。 展开更多
关键词 WEB 信息检索 搜索引擎 元搜索引擎 INTERNET
下载PDF
一种基于概念的数据聚类模型 被引量:15
15
作者 张明卫 刘莹 +1 位作者 张斌 朱志良 《软件学报》 EI CSCD 北大核心 2009年第9期2387-2396,共10页
在数据挖掘研究领域,现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制.为了解决这一难题,提出了一种基于概念的数据聚类模型.该模型从描述数据样本的数据本身出发,首先在预处理后的数据集上提取基本概念,再对这些概念进行... 在数据挖掘研究领域,现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制.为了解决这一难题,提出了一种基于概念的数据聚类模型.该模型从描述数据样本的数据本身出发,首先在预处理后的数据集上提取基本概念,再对这些概念进行概化,形成表示聚类结果的高层概念,最后基于这些高层概念进行样本划分,从而完成整个聚类过程.该模型能够在保证聚类准确性的基础上,很大程度地减少要处理的数据量,提高原算法的可伸缩性.另外,该模型基于概念进行知识的发现与分析,能够提高聚类结果的可解释性,便于与用户交互.实验结果表明,该模型对于聚类结果较好且复杂度较高的算法尤为有效. 展开更多
关键词 数据挖掘 聚类 概念 概念元组 模型
下载PDF
一种基于GN算法的文本概念聚类新方法 被引量:7
16
作者 安娜 谢福鼎 +1 位作者 张永 刘绍海 《计算机工程与应用》 CSCD 北大核心 2008年第14期142-144,180,共4页
文本聚类是当前文本信息挖掘的基础和研究的重点。给出一种新的文本聚类方法,它将概念格和复杂网络有机地结合起来,以达到更优的聚类效果。首先计算关键词特征权值并对特征向量进行降维处理,然后根据关键词权值大小映射到形式背景中,通... 文本聚类是当前文本信息挖掘的基础和研究的重点。给出一种新的文本聚类方法,它将概念格和复杂网络有机地结合起来,以达到更优的聚类效果。首先计算关键词特征权值并对特征向量进行降维处理,然后根据关键词权值大小映射到形式背景中,通过本文所给出的新的相似度公式,计算出形式背景中概念相似度的大小,从而构造GN网络并应用GN算法进行文本概念聚类。最后通过实例,验证了方法的可行性。 展开更多
关键词 复杂网络 GN算法 文本聚类 概念格
下载PDF
基于聚类分析策略的用户偏好挖掘 被引量:8
17
作者 刘远超 王晓龙 +1 位作者 刘秉权 钟彬彬 《计算机应用研究》 CSCD 北大核心 2005年第12期21-23,共3页
利用训练文档集准确高效地挖掘隐藏的用户文本偏好和概念向量是文本信息过滤和多文档自动文摘等自然语言处理应用的关键技术之一。针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的文本偏好挖掘方法。其基本思... 利用训练文档集准确高效地挖掘隐藏的用户文本偏好和概念向量是文本信息过滤和多文档自动文摘等自然语言处理应用的关键技术之一。针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的文本偏好挖掘方法。其基本思路是对训练文档集进行聚类处理,然后对同主题文档进行共性分析,并经过特征权值调整和特征约简,获得表示用户不同主题偏好的概念向量。实验结果表明该方法具有对用户的文本偏好刻画更加精确,对相关阈值变化不敏感等优点,可以与Rocchio等算法结合来进行用户兴趣建模。 展开更多
关键词 偏好挖掘:文档聚类 概念向量 Rocchio算法
下载PDF
产业集群的内涵及其政策含义 被引量:38
18
作者 柳卸林 段小华 《研究与发展管理》 CSSCI 2003年第6期55-61,共7页
现在,产业集群的研究非常多。但对这一概念的内涵及政策含义的理解,则相差很大。在参阅大量国内外关于集群的多种文献的基础上,对产业集群研究领域的相关概念、集群形成的动机及其表现特征,国家、部门和企业三个层次的产业集群形成的条... 现在,产业集群的研究非常多。但对这一概念的内涵及政策含义的理解,则相差很大。在参阅大量国内外关于集群的多种文献的基础上,对产业集群研究领域的相关概念、集群形成的动机及其表现特征,国家、部门和企业三个层次的产业集群形成的条件,以及竞争环境下的产业集群结构、产业集群的优势与劣势等进行了一个较为全面的描述。 展开更多
关键词 产业集群 概念 特征 政策含义
下载PDF
文档聚类综述 被引量:65
19
作者 刘远超 王晓龙 +1 位作者 徐志明 关毅 《中文信息学报》 CSCD 北大核心 2006年第3期55-62,共8页
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行... 聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行了综述。最后还介绍了聚类质量评测问题。 展开更多
关键词 计算机应用 中文信息处理 综述 文档聚类 降维 概念相关 聚类算法
下载PDF
一种基于本体的抽象度可调文档聚类 被引量:3
20
作者 王晓东 郭雷 +2 位作者 方俊 杨宁 邓涛 《计算机工程与应用》 CSCD 北大核心 2007年第29期172-175,共4页
文档聚类随着网上文本数量的激增以及实际应用中的需求,引起了人们广泛的关注。针对目前文档聚类的主要缺陷,提出了一种新的基于本体的抽象度可调文档聚类(Adjustable Text Clustering using Abstract Degreeof Concept,ATCADC)。该方... 文档聚类随着网上文本数量的激增以及实际应用中的需求,引起了人们广泛的关注。针对目前文档聚类的主要缺陷,提出了一种新的基于本体的抽象度可调文档聚类(Adjustable Text Clustering using Abstract Degreeof Concept,ATCADC)。该方法采用Wordnet对VSM特征词进行概念映射和消歧处理,利用生成的特征概念实现文档语义层面上的矢量描述,并在二次特征选择的基础上,完成合成聚类(AHC)。方法能够依据用户设定的概念抽象度,借助专门设计的语义中心矢量调节聚类,还可利用关键特征概念对聚类簇进行解释。实验结果证明,聚类精度高,聚类簇可解释,调节效果有效,能够满足用户不同概念抽象度层次上的聚类。 展开更多
关键词 本体 文档聚类 概念 消歧 抽象度
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部