期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于累积Logistic回归分析的文本段落聚类策略研究 被引量:1
1
作者 徐永东 徐志明 王晓龙 《高技术通讯》 CAS CSCD 北大核心 2006年第8期789-794,共6页
提出一种新的文本段落聚类策略,该策略采用多特征融合思想尽可能多地挖掘段落内的特征,并采用累积Logistic回归分析方法来拟合这些特征与段落相似度之间的内在关联,使得段落相似度计算的结果更为理想。最后采用层次聚合聚类算法中的c... 提出一种新的文本段落聚类策略,该策略采用多特征融合思想尽可能多地挖掘段落内的特征,并采用累积Logistic回归分析方法来拟合这些特征与段落相似度之间的内在关联,使得段落相似度计算的结果更为理想。最后采用层次聚合聚类算法中的complete—link方法对段落集合进行聚类处理:通过网络真实文本进行了段落相似度度量实验和段落聚类实验,实验结果显示了方法的可行性。 展开更多
关键词 多特征融合 累积Logistic回归分析 段落相似度计算 段落
下载PDF
一种使用自动聚类思想的自动文摘方法 被引量:7
2
作者 杨建林 《情报学报》 CSSCI 北大核心 2001年第5期532-536,共5页
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选... 本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选出与文献主题相关的段落类作为候选的用来挑出文摘句的段落类 。 展开更多
关键词 自动文摘 信息处理 自动处理技术 词频统计 关键词向量 段落类
下载PDF
基于局部与全局信息的自动文摘算法
3
作者 王萌 王晓荣 +1 位作者 李春贵 唐培和 《广西科学院学报》 2007年第4期226-228,共3页
采用平均特征词频率策略计算特征词权重,用快速n-grims算法对各特征词所处的概念体进行加权,用一种改进的K-means聚类算法进行段落聚类,提出一种基于局部与全局信息的自动文摘算法并给出算法评估。该算法不仅能够自适应获得k值,而且有... 采用平均特征词频率策略计算特征词权重,用快速n-grims算法对各特征词所处的概念体进行加权,用一种改进的K-means聚类算法进行段落聚类,提出一种基于局部与全局信息的自动文摘算法并给出算法评估。该算法不仅能够自适应获得k值,而且有效防止了初始点的随机选择对聚类结果的影响。评测结果表明该算法对经济类和科技类文章的准确率和召回率都明显高于新闻类和文学类文章,利用机器文摘进行分类的准确率明显高于使用原文本进行分类。该算法所得到的文摘,在各项指标上都优于传统方法生成的文摘。 展开更多
关键词 K-MEANS n-grims 段落 自然语言理解
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部