期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
新闻网页主题内容提取方法研究 被引量:5
1
作者 罗永莲 秦振吉 《微计算机应用》 2007年第5期556-560,共5页
网页的半结构化特点与新闻的自身特征为选择性抽取网页内容创造了条件。我们在前人的研究基础上,挖掘Web页面结构特征、充分利用Html标记与新闻特征,重点从Web页面编者对文本修饰角度出发,提出了基于网页内容分割的主题内容抽取方法。... 网页的半结构化特点与新闻的自身特征为选择性抽取网页内容创造了条件。我们在前人的研究基础上,挖掘Web页面结构特征、充分利用Html标记与新闻特征,重点从Web页面编者对文本修饰角度出发,提出了基于网页内容分割的主题内容抽取方法。实验结果表明该方法能有效地抽取新闻各要素,测试的抽取准确率在96%以上。 展开更多
关键词 新闻网页 主题内容抽取 网页分割
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部