期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于K-Means聚类算法的自动图谱识别在电缆局部放电在线监测系统中的应用 被引量:46
1
作者 靖小平 彭小圣 +3 位作者 姜伟 周文俊 周承科 唐泽洋 《高电压技术》 EI CAS CSCD 北大核心 2012年第9期2437-2446,共10页
局部放电相位谱图(phase resolved partial discharge pattern)是局部放电模式识别普遍采用的重要方法。但在中高压电缆在线局放监测系统中,电缆中的电压信号难以直接获取,使得局放相位谱图分析的开展遇到了重大的挑战。为此,在多年局... 局部放电相位谱图(phase resolved partial discharge pattern)是局部放电模式识别普遍采用的重要方法。但在中高压电缆在线局放监测系统中,电缆中的电压信号难以直接获取,使得局放相位谱图分析的开展遇到了重大的挑战。为此,在多年局放理论研究和局放现场应用研究的基础上,提出了基于K-Means聚类的局部放电相位谱图自动模式识别技术。该技术通过信号提取、坐标变换、K-Means聚类、中心点平移、模式判断的流程,克服了电缆局放监测中相位信息难以直接获取的缺点,能对来自三相的局部放电信号进行自动识别判断。5个应用实例证明,该方法能对电晕放电、内部放电、沿面放电和干扰信号做出准确的判断,必将在电缆在线监测系统中获得广泛的应用。 展开更多
关键词 局部放电(PD) K-MEANS 局部放电相位 自动模式识别 在线监测 电力电缆
下载PDF
基于半监督自动谱聚类算法的网络故障检测 被引量:6
2
作者 姜大庆 夏士雄 周勇 《计算机工程与应用》 CSCD 2012年第30期89-94,共6页
针对网络故障检测中利用先验知识不足和多数谱聚类算法需事先确定聚类数的问题,提出一种新的基于成对约束信息传播与自动确定聚类数相结合的半监督自动谱聚类算法。通过学习一种新的相似性测度函数来满足约束条件,改进NJW聚类算法,对非... 针对网络故障检测中利用先验知识不足和多数谱聚类算法需事先确定聚类数的问题,提出一种新的基于成对约束信息传播与自动确定聚类数相结合的半监督自动谱聚类算法。通过学习一种新的相似性测度函数来满足约束条件,改进NJW聚类算法,对非规范化的Laplacian矩阵特征向量进行自动谱聚类,从而提高聚类性能。在UCI标准数据集和网络实测数据上的实验表明,该算法较相关比对算法聚类准确率更高,可满足网络故障检测的实际需要。 展开更多
关键词 半监督 成对约束 相似度矩阵 自动 网络故障检测
下载PDF
跨层精度自动调节的k均值聚类近似计算方法 被引量:3
3
作者 李钊 袁文浩 +2 位作者 任崇广 黄程程 董霄霄 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2020年第3期50-57,共8页
随着人工智能在嵌入式平台上的应用,k均值聚类算法作为人工智能方法的基础,促使其在嵌入式平台上实现,而能耗是制约算法在嵌入式平台上实现的关键。为了降低k均值聚类在嵌入式平台上的能耗,提出一种针对k均值聚类的跨层精度自动调节的... 随着人工智能在嵌入式平台上的应用,k均值聚类算法作为人工智能方法的基础,促使其在嵌入式平台上实现,而能耗是制约算法在嵌入式平台上实现的关键。为了降低k均值聚类在嵌入式平台上的能耗,提出一种针对k均值聚类的跨层精度自动调节的近似计算方法。首先,分别从数据点到质心的距离和数据点变化趋势两个方面对迭代过程进行约束,提出精度自动调节的方法;然后,从结构级设计外部存储器的数据重组与访问方法,实现存储器的近似访问;设计精度自动调节的近似加法器与乘法器,最终实现k均值聚类算法的近似计算。实验结果表明,这种近似计算方法在基本不影响聚类质量的前提下,与精确计算相比较可降低55%~58%的能耗,节省能耗的比例最高。 展开更多
关键词 近似计算 精度自动调节 K均值 能耗
下载PDF
基于全序列比对相似度的用户会话自动谱聚类 被引量:2
4
作者 姜大庆 周勇 《计算机科学》 CSCD 北大核心 2012年第11期142-144,148,共4页
针对现有个性化推荐服务系统中用户会话聚类算法存在相似性度量准确性低和需要事先确定聚类数目的问题,对序化的用户访问页面和对应的访问时间信息进行整合,提出一种基于动态规划算法的全序列比对方法来度量用户会话的相似性。在此基础... 针对现有个性化推荐服务系统中用户会话聚类算法存在相似性度量准确性低和需要事先确定聚类数目的问题,对序化的用户访问页面和对应的访问时间信息进行整合,提出一种基于动态规划算法的全序列比对方法来度量用户会话的相似性。在此基础上,运用改进的NJW谱聚类算法对用户会话进行自动谱聚类。实验结果表明,算法充分考虑了用户会话的整体特征和局部信息,较相关比对算法具有更高的聚类性能,可以提高网站个性化推荐服务的效率。 展开更多
关键词 全序列比对 相似度 用户会话 自动
下载PDF
谱聚类递归神经网络集成的全自动公开区分计算机和人的图灵测试识别算法 被引量:2
5
作者 张亮 陈睿 邱小松 《计算机应用》 CSCD 北大核心 2014年第5期1383-1385,共3页
针对粘着全自动公开的区分计算机和人的图灵测试(CAPTCHA)的识别问题,提出了一种基于谱聚类递归神经网络(RNN)集成的识别算法。该算法首先使用不一致测度度量两个RNN之间的距离,构建出一张由多个候选RNN形成的图;然后基于谱图聚类理论,... 针对粘着全自动公开的区分计算机和人的图灵测试(CAPTCHA)的识别问题,提出了一种基于谱聚类递归神经网络(RNN)集成的识别算法。该算法首先使用不一致测度度量两个RNN之间的距离,构建出一张由多个候选RNN形成的图;然后基于谱图聚类理论,将多个RNN划分为不同的簇,并在每个簇上选择最佳RNN参与集成。实验结果表明:相对于单个候选RNN,该算法的识别率提高了约16%;相对于全部候选RNN构成的集成系统,该算法形成的集成规模更小,仅为原来的23%。 展开更多
关键词 自动公开区分计算机和人的图灵测试识别 递归神经网络 网络安全 多分器集成
下载PDF
聚类中心自动确定的谱聚类算法研究 被引量:1
6
作者 陈晋音 吴洋洋 林翔 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1729-1736,共8页
目前的谱聚类算法主要存在难以选取合适的尺度参数,需要人工确定聚类个数,参数依赖性大等问题.针对这些问题,本文提出了聚类中心自动确定的谱聚类算法(ADNC-SC).针对难以确定合适的尺度参数来反映数据结构的问题,ADNC-SC算法依据数据点... 目前的谱聚类算法主要存在难以选取合适的尺度参数,需要人工确定聚类个数,参数依赖性大等问题.针对这些问题,本文提出了聚类中心自动确定的谱聚类算法(ADNC-SC).针对难以确定合适的尺度参数来反映数据结构的问题,ADNC-SC算法依据数据点与临近点的距离均值定义局部尺度参数,充分利用数据点的局部特征来反映数据结构;针对谱聚类算法需要预先设定聚类个数的困难,本文采用了一种自动确定聚类个数的策略,通过分析数据对象的密度和距离的分布规律自动确定聚类中心;针对参数依赖性大的问题,ADNC-SC算法设计了一个Fitness函数作为评价不同临近点个数所对应的聚类结果的指标,选取最优临近点个数,并依据算法的时间复杂度和空间复杂度的关系确定划分区间个数.最终将所提出算法与部分较优秀算法在多个数据集上展开聚类效果比较,验证提出的ADNC-SC算法的有效性,并将其应用于人脸识别. 展开更多
关键词 自动确定中心 局部尺度参数 参数自适应 人脸识别
下载PDF
融合t-分布随机邻域嵌入与自动谱聚类的脑功能精细分区方法 被引量:2
7
作者 胡颖 王丽嘉 聂生东 《波谱学杂志》 北大核心 2021年第3期392-402,共11页
本文针对目前脑功能分区不够准确的问题,基于静息态功能磁共振数据,提出了一种融合t-分布随机邻域嵌入(t-SNE)与自动谱聚类(ASC)的人脑功能精细分区的算法.首先,基于静息态功能磁共振图像,对需功能划分的脑区与全脑的时间序列作相关分析... 本文针对目前脑功能分区不够准确的问题,基于静息态功能磁共振数据,提出了一种融合t-分布随机邻域嵌入(t-SNE)与自动谱聚类(ASC)的人脑功能精细分区的算法.首先,基于静息态功能磁共振图像,对需功能划分的脑区与全脑的时间序列作相关分析,得到需划分脑区的功能连接模式;然后,利用t-SNE算法提取高维功能连接模式特征;最后,通过基于本征间隙的ASC算法自动确定聚类数目,并对降维后的脑区特征分类,得到精细划分的脑亚区.模拟种子区域上的实验结果表明,相较谱聚类算法,以及结合主成分分析的谱聚类算法,本文方法对脑功能体素划分更优.进一步将本方法应用到真实人脑的功能分区中,成功地将海马旁回分为左右半球各3个亚区.本研究表明使用t-SNE与ASC融合的算法可提高脑功能分区准确性,是脑功能精细分区、进而构建脑功能图谱的一种有效方法. 展开更多
关键词 静息态功能磁共振成像 功能连接 功能分区 t-分布随机邻域嵌入 自动
下载PDF
PID参数调节的谱多流形聚类算法研究 被引量:2
8
作者 罗养霞 马迪 常言说 《计算机科学与探索》 CSCD 北大核心 2019年第8期1360-1369,共10页
数据的复杂和多样性使得对大数据处理和分析能力有更高的要求。流形聚类在数据挖掘中取得显著的成功,但参数调整是聚类算法研究中的难点之一,直接影响聚类性能。传统的聚类算法参数调节一般依赖于经验,或者因参数调节的盲目性和随机性,... 数据的复杂和多样性使得对大数据处理和分析能力有更高的要求。流形聚类在数据挖掘中取得显著的成功,但参数调整是聚类算法研究中的难点之一,直接影响聚类性能。传统的聚类算法参数调节一般依赖于经验,或者因参数调节的盲目性和随机性,而使得算法失效或复杂度较高。提出了一种基于比例-积分-微分(PID)控制约束的主动控制机制,约束谱多流形聚类参数调整的新方法。通过构造相似度矩阵,使用多个主成分分析器来估计局部切线空间。模型逼近过程由参数传递和PID调节控制。在调整过程中,采用三维ZN方法调整模型参数,扩展搜索空间,根据反馈结果控制谱多流形聚类过程,提高了算法的准确性和复杂性。通过在合成和实际中的不同类型的数据特征集进行检验,可以获得更好的聚类性能。 展开更多
关键词 多流形 子空间 参数调节 比例-积分-微分(PID)
下载PDF
船舶AIS轨迹快速自适应谱聚类算法 被引量:25
9
作者 牟军敏 陈鹏飞 +3 位作者 贺益雄 张行健 朱剑峰 荣昊 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2018年第3期428-432,共5页
为了对船舶AIS轨迹数据进行快速聚类,本文提出了一种基于Hausdorff距离的船舶轨迹快速自适应谱聚类算法(fast self-tune spectral clustering,FSSC)。在保留轨迹特征的情况下,利用Douglas-Peucker(DP)算法对船舶轨迹数据进行预处理;基于... 为了对船舶AIS轨迹数据进行快速聚类,本文提出了一种基于Hausdorff距离的船舶轨迹快速自适应谱聚类算法(fast self-tune spectral clustering,FSSC)。在保留轨迹特征的情况下,利用Douglas-Peucker(DP)算法对船舶轨迹数据进行预处理;基于Hausdorff距离,设计自动选取尺度参数的相似度度量函数,构造相似度矩阵并采用谱聚类算法对船舶轨迹进行聚类。以长江口水域船舶实际AIS数据为样本对算法进行了验证,结果表明:聚类结果能够准确提取水域船舶主要航路,算法消耗系统资源少,计算速度快。该方法对水域船舶主要航路识别,提高海事监管效率等方面具有参考意义。 展开更多
关键词 船舶自动识别系统 船舶轨迹 DOUGLAS-PEUCKER算法 数据压缩 HAUSDORFF距离
下载PDF
一种面向大数据的快速自动聚类算法 被引量:8
10
作者 陈小玉 李晓静 马海英 《计算机应用研究》 CSCD 北大核心 2017年第9期2651-2654,2658,共5页
针对大数据环境下高维数据聚类速度慢、准确率低的问题,提出了一种面向大数据的快速自动聚类算法(FACABD)。FACABD聚类算法利用谱聚类算法对大数据集进行归一化和列降维,提出了一种新的快速区域进化的粒子群算法(FRE-PSO),并利用该算法... 针对大数据环境下高维数据聚类速度慢、准确率低的问题,提出了一种面向大数据的快速自动聚类算法(FACABD)。FACABD聚类算法利用谱聚类算法对大数据集进行归一化和列降维,提出了一种新的快速区域进化的粒子群算法(FRE-PSO),并利用该算法进行行降维;然后在行列降维的基础上,引入聚类模糊隶属度基数,自动发现簇的数目,根据类簇数目,采用FRE-PSO算法结合模糊聚类算法,实现了快速自动聚类。在多个不同数据集上的实验结果表明,该算法能够在数据驱动下快速自动聚类,与其他聚类算法相比,有效地提高了运行速度和精度。 展开更多
关键词 粒子群优化 区域进化 自动
下载PDF
基于改进谱聚类算法的航路辨识 被引量:5
11
作者 李爽 史国友 +2 位作者 高邈 陈晓 吴京霖 《上海海事大学学报》 北大核心 2019年第4期1-6,共6页
为解决船舶自动识别系统(automatic identification system, AIS)数据挖掘不够充分,对航路辨识分析不够全面等问题,提出一种基于改进谱聚类算法的数据挖掘方式。利用Sliding Window算法对船舶轨迹AIS数据进行压缩,减少数据冗余提高聚类... 为解决船舶自动识别系统(automatic identification system, AIS)数据挖掘不够充分,对航路辨识分析不够全面等问题,提出一种基于改进谱聚类算法的数据挖掘方式。利用Sliding Window算法对船舶轨迹AIS数据进行压缩,减少数据冗余提高聚类效率。改进亲和距离函数,提出新的亲和矩阵的标准,提高聚类的稳定性,进一步对数据去噪,减少噪声敏感。通过优化初始中心对k均值算法进行改进,优化全局搜索能力,缓解初始值的选取对聚类效果的影响。以天津港AIS数据为样本进行算法验证。结果表明,该聚类算法能准确提取和划分某水域船舶主要航迹段,算法消耗系统资源少,计算速度快。改进后的算法可为航路辨识、分道通航制定等提供理论支持。 展开更多
关键词 航路辨识 船舶自动识别系统(AIS) 大数据 K均值算法
下载PDF
加权PageRank改进地标表示的自编码谱聚类算法 被引量:2
12
作者 储德润 周治平 《智能系统学报》 CSCD 北大核心 2020年第2期302-309,共8页
针对传统谱聚类算法在处理大规模数据集时,聚类精度低并且存在相似度矩阵存储开销大和拉普拉斯矩阵特征分解计算复杂度高的问题。提出了一种加权PageRank改进地标表示的自编码谱聚类算法,首先选取数据亲和图中权重最高的节点作为地标点... 针对传统谱聚类算法在处理大规模数据集时,聚类精度低并且存在相似度矩阵存储开销大和拉普拉斯矩阵特征分解计算复杂度高的问题。提出了一种加权PageRank改进地标表示的自编码谱聚类算法,首先选取数据亲和图中权重最高的节点作为地标点,以选定的地标点与其他数据点之间的相似关系来逼近相似度矩阵作为叠加自动编码器的输入。然后利用聚类损失同时更新自动编码器和聚类中心的参数,从而实现可扩展和精确的聚类。实验表明,在几种典型的数据集上,所提算法与地标点谱聚类算法和深度谱聚类算法相比具有更好的聚类性能。 展开更多
关键词 机器学习 数据挖掘 分析 地标点 加权PageRank 自动编码器 损失
下载PDF
图书馆信息库资源自动检索方法研究 被引量:1
13
作者 顾志芹 《自动化技术与应用》 2023年第11期77-81,共5页
为提升用户获取所需资源的速度与精度,研究一种图书馆信息库资源自动检索方法。利用谱聚类算法聚类资源词特征,得到特征簇,确定资源标签和特征簇的相关性,再完成资源聚类;对聚类资源进行预处理;再提取预处理后资源的特征;建立多属性灰... 为提升用户获取所需资源的速度与精度,研究一种图书馆信息库资源自动检索方法。利用谱聚类算法聚类资源词特征,得到特征簇,确定资源标签和特征簇的相关性,再完成资源聚类;对聚类资源进行预处理;再提取预处理后资源的特征;建立多属性灰色关联度决策模型,将提取的特征转换成二元特征函数输入决策模型,输出最佳检索方案,完成资源自动检索。实验证明:该方法可有效检索图书馆资源,具备较高的资源检索效率,检索精度高,可有效提升资源检索效果。 展开更多
关键词 图书馆信息库 自动 资源检索
下载PDF
基于稀疏自动编码器神经网络的负荷曲线分类方法 被引量:20
14
作者 林顺富 顾乡 +2 位作者 汤继开 李东东 符杨 《电网技术》 EI CSCD 北大核心 2020年第9期3508-3515,共8页
随着电力市场精细化发展以及电力大数据的广泛应用,深度探索电力用户用电行为特性具有重要意义,因此该文提出一种结合有监督和无监督算法的电力负荷曲线分类方法。首先,基于距离与曲线形态的双尺度相似性度量,采用无监督优化谱聚类算法... 随着电力市场精细化发展以及电力大数据的广泛应用,深度探索电力用户用电行为特性具有重要意义,因此该文提出一种结合有监督和无监督算法的电力负荷曲线分类方法。首先,基于距离与曲线形态的双尺度相似性度量,采用无监督优化谱聚类算法获得负荷曲线精准标签数据;其次,采用稀疏自动编码器神经网络学习大规模待分类负荷曲线的内在特征,得到隐藏层权值矩阵即神经网络的优化初始参数;最后,基于已获得的标签数据,训练支持向量机神经网络分类器,实现对大规模待分类负荷曲线的有监督分类。基于爱尔兰负荷数据,算例表明本文提出的分类方法在DBI指数、轮廓系数、分类有效性以及计算速度等方面具有更好的性能。 展开更多
关键词 负荷曲线分 稀疏自动编码器 双尺度 支持向量机
下载PDF
基于模糊理论的分布式协作谱感知技术研究 被引量:2
15
作者 董占奇 《计算机工程与设计》 CSCD 北大核心 2013年第6期1936-1940,共5页
针对认知无线网络中对于主用户检测感知存在的阴影衰落和如何有效提高频谱利用率等问题,提出了一种基于模糊理论的分布式协作处理方法。该方法通过采取各感知用户独立自主决策(双门限+模糊判决区)和综合接收分析一跳邻居感知处理信息等... 针对认知无线网络中对于主用户检测感知存在的阴影衰落和如何有效提高频谱利用率等问题,提出了一种基于模糊理论的分布式协作处理方法。该方法通过采取各感知用户独立自主决策(双门限+模糊判决区)和综合接收分析一跳邻居感知处理信息等措施,实现认知无线网中各局部区域的自动聚类和自适应聚类边界(/过渡带)识别,从而实现对主用户的全面感知和大幅度地提高频谱利用率。仿真结果表明,该方法在感知处理信息传输开销、认知系统吞吐率、检测概率等方面明显优于传统的合作感知方法。 展开更多
关键词 模糊处理 分布协作 感知 阴影 自动
下载PDF
基于多样性的一致谱嵌入学习 被引量:1
16
作者 耿莉 王长鹏 《吉林大学学报(理学版)》 CAS 北大核心 2022年第5期1133-1142,共10页
针对如何将多视图的丰富信息融合进一致图以及避免谱嵌入后续处理过程中导致的次优性能问题,提出一种基于多样性的一致谱嵌入学习的多视图聚类算法.该算法在考虑视图多样性的前提下自动学习权重以便更好地学习一致图,并学习一致的谱嵌... 针对如何将多视图的丰富信息融合进一致图以及避免谱嵌入后续处理过程中导致的次优性能问题,提出一种基于多样性的一致谱嵌入学习的多视图聚类算法.该算法在考虑视图多样性的前提下自动学习权重以便更好地学习一致图,并学习一致的谱嵌入矩阵和离散化聚类标签矩阵.通过在真实数据集上与其他算法进行对比实验,证明了该算法在提升聚类性能方面的优越性. 展开更多
关键词 一致图 自动加权 嵌入 多视图
下载PDF
一个基于谱图分割的简单聚类算法 被引量:3
17
作者 田娟 王崇骏 +1 位作者 李静 陈兆乾 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2004年第5期810-814,共5页
目前谱聚类在文本分类、图像分割和信息检索等领域的应用越来越引起研究者的重视,并取得了一定的成果.但是,大多数已有的谱聚类算法需要事先给定聚类数.在k means算法、EM等聚类方法中也存在相似的问题.在此介绍了一种简单的容易实现的... 目前谱聚类在文本分类、图像分割和信息检索等领域的应用越来越引起研究者的重视,并取得了一定的成果.但是,大多数已有的谱聚类算法需要事先给定聚类数.在k means算法、EM等聚类方法中也存在相似的问题.在此介绍了一种简单的容易实现的谱聚类算法,可以自动确定合适的聚类数.实验表明本算法结果很好. 展开更多
关键词 算法 K-MEANS算法 文本分 图像分割 方法 信息检索 自动 领域
原文传递
改进的合成孔径雷达图像谱聚类算法
18
作者 孟庆霞 温显斌 +1 位作者 徐海霞 刘丽丽 《光学学报》 EI CAS CSCD 北大核心 2012年第F12期305-310,共6页
合成孔径雷达(SAR)图像的分割是SAR图像理解的基础。结合NystrOm采样技术和图谱理论,提出了一种改进的SAR图像高效快速谱聚类新算法。该算法引入矩阵扰动分析理论,构造适用于SAR图像的自动确定类数准则;在分析比例参数对谱聚类算... 合成孔径雷达(SAR)图像的分割是SAR图像理解的基础。结合NystrOm采样技术和图谱理论,提出了一种改进的SAR图像高效快速谱聚类新算法。该算法引入矩阵扰动分析理论,构造适用于SAR图像的自动确定类数准则;在分析比例参数对谱聚类算法影响的基础上,依据SAR图像的整体结构特征,构造了比例参数的自适应邻域估计方法;根据SAR图像中每个像素的灰度值和空间位置,构造出更能描述SAR图像本质结构的相似函数,进而给出改进的谱聚类算法;将这种新的谱聚类算法应用于仿真实验和实际SAR图像分割中,并与传统谱聚类方法进行了比较。 展开更多
关键词 合成孔径雷达图像分割 自动 相似函数 比例参数
原文传递
基于夹角几何的I-niceMO增强算法
19
作者 何一帆 何玉林 +1 位作者 蔡湧达 黄哲学 《系统仿真学报》 CAS CSCD 北大核心 2023年第4期797-808,共12页
针对I-niceMO算法在候选聚类中心合并时中心数目难以确定和中心点识别不准确的问题,提出了基于夹角几何的I-niceMO增强(I-niceMOEn)算法。利用观测点与数据点之间的距离和角度分布情况找出数据中尽可能多的候选聚类中心,以避免多类别数... 针对I-niceMO算法在候选聚类中心合并时中心数目难以确定和中心点识别不准确的问题,提出了基于夹角几何的I-niceMO增强(I-niceMOEn)算法。利用观测点与数据点之间的距离和角度分布情况找出数据中尽可能多的候选聚类中心,以避免多类别数据聚类中出现的类别丢失的情况;利用谱聚类算法对候选聚类中心进行聚类,根据拉普拉斯矩阵特征值的大小自动地对候选聚类中心进行合并;根据合并后的聚类中心的数量确定最终的数据聚类类别数。I-niceMOEn算法实现了对数据类别数的自动确定,并且在聚类过程中不需要人为设置参数。实验结果表明:I-niceMOEn算法在收敛的同时能够获得优于传统自动聚类算法和I-niceMO算法的类中心确定表现。 展开更多
关键词 自动 I-nice 无监督学习 观测点机制
下载PDF
共通语义空间下的跨文献类型文本自动分类研究 被引量:3
20
作者 李湘东 高凡 李悠海 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第9期66-73,共8页
【目的】解决不同文献类型文本之间因写作风格和用词习惯不同而产生的语义差异问题。【方法】选取同时出现在两个不同文献类型文本集合中的领域无关特征和只在其中某一个集合中出现的领域相关特征,利用领域无关特征,对分属两个集合的领... 【目的】解决不同文献类型文本之间因写作风格和用词习惯不同而产生的语义差异问题。【方法】选取同时出现在两个不同文献类型文本集合中的领域无关特征和只在其中某一个集合中出现的领域相关特征,利用领域无关特征,对分属两个集合的领域相关特征构建双向图并进行谱聚类,关联表达类似语义的领域相关特征,产生由聚类特征定义的共通语义空间。【结果】实验结果表明,与传统的文本自动分类方法相比,本文方法的分类性能提高了3.0%-6.9%。【局限】构建共通语义空间时,需要大量与待分类文本属于同领域的语料。【结论】共通语义空间能够对不同文献类型的数字资源进行有效整合。 展开更多
关键词 共通语义空间 文本自动 跨领域分
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部