期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于网站层次结构和主题模型LDA的网站自动摘要 被引量:1
1
作者 李舒嫒 杨静 顾君忠 《计算机工程》 CAS CSCD 北大核心 2017年第4期207-211,216,共6页
近年来自动摘要方面的研究大多是关于多文档和Web网页的,而对网站自动摘要的研究较少。为此,基于主题模型隐含狄利克雷分布(LDA)和网站层次结构提出一个可以自动生成网站摘要的算法。该算法可获取整个网站内的网页信息并进行整合,根据... 近年来自动摘要方面的研究大多是关于多文档和Web网页的,而对网站自动摘要的研究较少。为此,基于主题模型隐含狄利克雷分布(LDA)和网站层次结构提出一个可以自动生成网站摘要的算法。该算法可获取整个网站内的网页信息并进行整合,根据提出的句子权重公式计算句子权重,选取权重最高的句子作为网站摘要。以20个商业和学术网站作为实验对象,使用ROUGE评测标准,结果表明,与仅使用主题模型LDA获取的网站摘要相比,不带停用词的ROUGE-1和ROUGE-L提高0.32,带停用词的ROUGE-1提高0.39,ROUGE-L提高0.38。与网站首页摘要相比,不带停用词的ROUGE-1提高0.03,ROUGE-L提高0.06,带停用词的ROUGE-1提高0.08,ROUGE-L提高0.07。 展开更多
关键词 WEB网页 网站自动摘要 隐含狄利克雷分布 网站层次结构 宽度优先搜索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部