期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于CRF模型的网络新闻主题线索发掘研究 被引量:6
1
作者 徐静 杨小平 《中文信息学报》 CSCD 北大核心 2017年第3期94-100,共7页
为了准确挖掘出同一主题的大量网络新闻的线索发展脉络,该文提出了一种基于条件随机场模型的网络新闻主题线索发掘方法。首先,根据新闻主题线索句的识别规则提取出相关特征,并应用到条件随机场模型中提取出主题线索句;然后,按照时间顺... 为了准确挖掘出同一主题的大量网络新闻的线索发展脉络,该文提出了一种基于条件随机场模型的网络新闻主题线索发掘方法。首先,根据新闻主题线索句的识别规则提取出相关特征,并应用到条件随机场模型中提取出主题线索句;然后,按照时间顺序构建原始线索链;最后,对语义相近的原始线索链进行合并处理,获得最终的新闻主题发展脉络。实验结果表明,该方法在主题线索句识别上有较好的效果,最终得到的主题线索脉络能够较清晰地展现新闻发展趋势。 展开更多
关键词 主题线索 条件随机场 线索链
下载PDF
网络舆情信息提取技术研究与实现 被引量:4
2
作者 刘华春 王星捷 《计算机技术与发展》 2016年第9期8-11,共4页
网络舆情信息提取是舆情分析系统中最为关键的部分,是实现舆情分析、舆情统计的数据基础。为此,设计和实现了一个基于话题线索的舆情信息提取方案。该方案将舆情页面以话题为线索进行逻辑划分;采用基于DOM树的广度优先搜索方法,设计了... 网络舆情信息提取是舆情分析系统中最为关键的部分,是实现舆情分析、舆情统计的数据基础。为此,设计和实现了一个基于话题线索的舆情信息提取方案。该方案将舆情页面以话题为线索进行逻辑划分;采用基于DOM树的广度优先搜索方法,设计了舆情信息提取算法;通过设置最低重复话题阈值θ,用户定制提取格式,信息去重去噪措施,实现了舆情信息的有效提取。通过对多个论坛舆情信息的提取实验,结果表明,所设计的方案有很好的提取性能,召回率、正确率、F指数都较高,能够很好地提取出论坛、评论等舆情信息。 展开更多
关键词 舆情信息 WEB信息提取 话题线索 DOC树
下载PDF
英文科技文献内核识别方法研究
3
作者 祝清松 冷伏海 +1 位作者 王林 韩涛 《情报理论与实践》 CSSCI 北大核心 2012年第9期112-116,共5页
针对英文科技文献的特征,提出一种规则和统计相结合的关键内容识别方法。该方法首先通过对源文档进行特征标识,将其转换成更易于处理的中间文档;然后利用特征还原、线索词匹配、主题识别和临近分析等,从中间文档抽取代表文本的主要信息... 针对英文科技文献的特征,提出一种规则和统计相结合的关键内容识别方法。该方法首先通过对源文档进行特征标识,将其转换成更易于处理的中间文档;然后利用特征还原、线索词匹配、主题识别和临近分析等,从中间文档抽取代表文本的主要信息,生成目标文档。该方法能够有效地辅助科研人员阅读大量的英文科技文献,提高阅读效率。 展开更多
关键词 特征标识 线索词匹配 主题识别 临近分析
下载PDF
基于线索特征的Web信息时效性评价方法 被引量:3
4
作者 徐静 杨小平 《计算机应用》 CSCD 北大核心 2018年第11期3100-3104,共5页
网络的快速发展使得在线新闻媒体成为人们获取信息的重要来源。Web站点发布的信息是否能够反映当前关注的热点,是否能够及时发布事件的最新进展情况,对Web站点的可用性有重大影响。在利用条件随机场(CRF)模型识别主题线索句的基础上,得... 网络的快速发展使得在线新闻媒体成为人们获取信息的重要来源。Web站点发布的信息是否能够反映当前关注的热点,是否能够及时发布事件的最新进展情况,对Web站点的可用性有重大影响。在利用条件随机场(CRF)模型识别主题线索句的基础上,得到与Web信息相关的同一主题的线索发展趋势。通过获得的线索发展趋势来推断主题线索的时间区间,进而估计出Web信息的有效区间,在此基础上结合时效性所包含的发布及时性和内容新鲜性两个方面来对Web信息时效性进行合理的评价。实验结果表明,所提方法在Web信息时效性评价上有较好的效果。 展开更多
关键词 主题线索 时效性 发布及时性 内容新鲜性 有效区间
下载PDF
“瓷文化”引导的文旅产业园设计落地研究——以景德镇陶瓷文化旅游城为例
5
作者 王昭 《城市建筑》 2021年第33期173-175,共3页
文旅产业园在当今城市中全面兴起,体验感和创意性的不足往往不能发挥其作用[1],亟须在城市大环境中设置有效的“发生器”,作为有效的激化体,通过场所和环境的引导来形成产业的集聚效应。本文以景德镇陶瓷文化旅游城为例,从主题型线索、... 文旅产业园在当今城市中全面兴起,体验感和创意性的不足往往不能发挥其作用[1],亟须在城市大环境中设置有效的“发生器”,作为有效的激化体,通过场所和环境的引导来形成产业的集聚效应。本文以景德镇陶瓷文化旅游城为例,从主题型线索、题材型分区、话题型场所三个层面,探讨了“瓷文化”引导下的文旅产业园在产业集群理论下的建筑设计应用。笔者希望以此为例,对中国的城市更新建设有所指引借鉴。 展开更多
关键词 瓷文化 主题线索 题材分区 话题场所
下载PDF
试探设计艺术专业毕业论文的写作
6
作者 王艳云 《艺术与设计(理论版)》 2008年第10期126-128,共3页
毕业论文的撰写是大学四年本科培养计划中重要的一个内容,也是对学生毕业前进行专业综合训练的一个重要实践环节。同时,它既是培养学生综合运用所学知识进行分析和解决实际问题的手段,也是发现和锻炼学生创造力的有效途径。为此,研究和... 毕业论文的撰写是大学四年本科培养计划中重要的一个内容,也是对学生毕业前进行专业综合训练的一个重要实践环节。同时,它既是培养学生综合运用所学知识进行分析和解决实际问题的手段,也是发现和锻炼学生创造力的有效途径。为此,研究和探讨学生毕业论文辅导的工作显得尤为重要。结合艺术设计专业学生实际特点,针对毕业论文辅导中经常出现的问题,本文从选题、结构与立意等方面进行实例分析和探讨,希望能给相关学生和老师一些启发和帮助。 展开更多
关键词 选题 立意 线索 结构 主题
原文传递
基于Biterm主题模型的新闻线索生成方法 被引量:4
7
作者 赵天资 段亮 +2 位作者 岳昆 乔少杰 马子娟 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第2期1-13,共13页
【目的】为解决生成新闻线索时抽取新闻主题及度量子事件相关性困难的问题,通过动态滑动窗口的方法改进主题模型,提高长文本和短文本新闻主题抽取的质量,并基于抽取出的新闻主题,提出面向新闻事件的新闻线索生成方法。【方法】在主题模... 【目的】为解决生成新闻线索时抽取新闻主题及度量子事件相关性困难的问题,通过动态滑动窗口的方法改进主题模型,提高长文本和短文本新闻主题抽取的质量,并基于抽取出的新闻主题,提出面向新闻事件的新闻线索生成方法。【方法】在主题模型IBTM(Incremental Biterm Topic Model)的基础上,通过动态滑动窗口减小二元词组的提取范围,提出既适合在长文本新闻也适合在短文本新闻上抽取主题的News-IBTM模型,进而基于该模型从新闻数据中抽取主题分布和主题-词分布、推断文档-主题分布,再利用JS散度来度量文档-主题分布的差异,从而生成新闻线索。【结果】在人民网新闻和微博新闻数据上的实验结果表明,无论是长文本新闻还是短文本新闻,News-IBTM在困惑度、准确率及效率上都优于现有的经典主题模型。【局限】News-IBTM以及其他新闻线索生成方法的准确率都不高,还可以进一步提升。【结论】本文方法适合应对长文本和短文本新闻主题抽取的质量问题,并能从新闻事件中获取新闻线索。 展开更多
关键词 新闻事件 新闻线索生成 主题模型 JS散度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部