期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于累积Logistic回归分析的文本段落聚类策略研究
被引量:
1
1
作者
徐永东
徐志明
王晓龙
《高技术通讯》
CAS
CSCD
北大核心
2006年第8期789-794,共6页
提出一种新的文本段落聚类策略,该策略采用多特征融合思想尽可能多地挖掘段落内的特征,并采用累积Logistic回归分析方法来拟合这些特征与段落相似度之间的内在关联,使得段落相似度计算的结果更为理想。最后采用层次聚合聚类算法中的c...
提出一种新的文本段落聚类策略,该策略采用多特征融合思想尽可能多地挖掘段落内的特征,并采用累积Logistic回归分析方法来拟合这些特征与段落相似度之间的内在关联,使得段落相似度计算的结果更为理想。最后采用层次聚合聚类算法中的complete—link方法对段落集合进行聚类处理:通过网络真实文本进行了段落相似度度量实验和段落聚类实验,实验结果显示了方法的可行性。
展开更多
关键词
多特征融合
累积Logistic回归分析
段落
相似度计算
段落
聚
类
下载PDF
职称材料
一种使用自动聚类思想的自动文摘方法
被引量:
7
2
作者
杨建林
《情报学报》
CSSCI
北大核心
2001年第5期532-536,共5页
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选...
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选出与文献主题相关的段落类作为候选的用来挑出文摘句的段落类 。
展开更多
关键词
自动文摘
信息处理
自动处理技术
词频统计
关键词向量
段落类
下载PDF
职称材料
基于局部与全局信息的自动文摘算法
3
作者
王萌
王晓荣
+1 位作者
李春贵
唐培和
《广西科学院学报》
2007年第4期226-228,共3页
采用平均特征词频率策略计算特征词权重,用快速n-grims算法对各特征词所处的概念体进行加权,用一种改进的K-means聚类算法进行段落聚类,提出一种基于局部与全局信息的自动文摘算法并给出算法评估。该算法不仅能够自适应获得k值,而且有...
采用平均特征词频率策略计算特征词权重,用快速n-grims算法对各特征词所处的概念体进行加权,用一种改进的K-means聚类算法进行段落聚类,提出一种基于局部与全局信息的自动文摘算法并给出算法评估。该算法不仅能够自适应获得k值,而且有效防止了初始点的随机选择对聚类结果的影响。评测结果表明该算法对经济类和科技类文章的准确率和召回率都明显高于新闻类和文学类文章,利用机器文摘进行分类的准确率明显高于使用原文本进行分类。该算法所得到的文摘,在各项指标上都优于传统方法生成的文摘。
展开更多
关键词
K-MEANS
n-grims
段落
聚
类
自然语言理解
下载PDF
职称材料
题名
基于累积Logistic回归分析的文本段落聚类策略研究
被引量:
1
1
作者
徐永东
徐志明
王晓龙
机构
哈尔滨工业大学计算机学院自然语言处理研究室
出处
《高技术通讯》
CAS
CSCD
北大核心
2006年第8期789-794,共6页
基金
863计划(2002AA117010-09)和国家自然科学基金(60435020)资助项目.
文摘
提出一种新的文本段落聚类策略,该策略采用多特征融合思想尽可能多地挖掘段落内的特征,并采用累积Logistic回归分析方法来拟合这些特征与段落相似度之间的内在关联,使得段落相似度计算的结果更为理想。最后采用层次聚合聚类算法中的complete—link方法对段落集合进行聚类处理:通过网络真实文本进行了段落相似度度量实验和段落聚类实验,实验结果显示了方法的可行性。
关键词
多特征融合
累积Logistic回归分析
段落
相似度计算
段落
聚
类
Keywords
multiple features fusion, cumulative Logistic regression analysis, paragraphs similarity computation,paragraphs clustering
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种使用自动聚类思想的自动文摘方法
被引量:
7
2
作者
杨建林
机构
南京大学信息管理系
出处
《情报学报》
CSSCI
北大核心
2001年第5期532-536,共5页
文摘
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选出与文献主题相关的段落类作为候选的用来挑出文摘句的段落类 。
关键词
自动文摘
信息处理
自动处理技术
词频统计
关键词向量
段落类
Keywords
automatic summarization,automatic clustering,word frequence statistic.
分类号
G354 [文化科学—情报学]
下载PDF
职称材料
题名
基于局部与全局信息的自动文摘算法
3
作者
王萌
王晓荣
李春贵
唐培和
机构
广西工学院计算机工程系
出处
《广西科学院学报》
2007年第4期226-228,共3页
基金
国家自然基金项目(60673034)
2006年广西教育厅基金项目(149)
+1 种基金
广西工学院博士
硕士基金项目资助
文摘
采用平均特征词频率策略计算特征词权重,用快速n-grims算法对各特征词所处的概念体进行加权,用一种改进的K-means聚类算法进行段落聚类,提出一种基于局部与全局信息的自动文摘算法并给出算法评估。该算法不仅能够自适应获得k值,而且有效防止了初始点的随机选择对聚类结果的影响。评测结果表明该算法对经济类和科技类文章的准确率和召回率都明显高于新闻类和文学类文章,利用机器文摘进行分类的准确率明显高于使用原文本进行分类。该算法所得到的文摘,在各项指标上都优于传统方法生成的文摘。
关键词
K-MEANS
n-grims
段落
聚
类
自然语言理解
Keywords
K-means,n-grims,paragraph clustering,natural language understanding
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于累积Logistic回归分析的文本段落聚类策略研究
徐永东
徐志明
王晓龙
《高技术通讯》
CAS
CSCD
北大核心
2006
1
下载PDF
职称材料
2
一种使用自动聚类思想的自动文摘方法
杨建林
《情报学报》
CSSCI
北大核心
2001
7
下载PDF
职称材料
3
基于局部与全局信息的自动文摘算法
王萌
王晓荣
李春贵
唐培和
《广西科学院学报》
2007
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部