-
题名基于局部与全局信息的自动文摘算法
- 1
-
-
作者
王萌
王晓荣
李春贵
唐培和
-
机构
广西工学院计算机工程系
-
出处
《广西科学院学报》
2007年第4期226-228,共3页
-
基金
国家自然基金项目(60673034)
2006年广西教育厅基金项目(149)
+1 种基金
广西工学院博士
硕士基金项目资助
-
文摘
采用平均特征词频率策略计算特征词权重,用快速n-grims算法对各特征词所处的概念体进行加权,用一种改进的K-means聚类算法进行段落聚类,提出一种基于局部与全局信息的自动文摘算法并给出算法评估。该算法不仅能够自适应获得k值,而且有效防止了初始点的随机选择对聚类结果的影响。评测结果表明该算法对经济类和科技类文章的准确率和召回率都明显高于新闻类和文学类文章,利用机器文摘进行分类的准确率明显高于使用原文本进行分类。该算法所得到的文摘,在各项指标上都优于传统方法生成的文摘。
-
关键词
k-means
n-grims
段落聚类
自然语言理解
-
Keywords
k-means,n-grims,paragraph clustering,natural language understanding
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-