-
题名事件信息采集中的事件监测项归约方法研究
- 1
-
-
作者
仲兆满
李恒
管燕
李慧
-
机构
江苏海洋大学计算机工程学院
-
出处
《中文信息学报》
2024年第7期73-83,共11页
-
基金
国家自然科学基金(72174079)
江苏省高校自然科学研究项目(19KJB520004)
江苏省高校科研实践创新计划项目(KYCX20_2931)。
-
文摘
随着互联网的飞速发展,从微博、贴吧、论坛、新闻网站等媒体获取关注的事件信息已经是互联网信息处理系统的基本功能。然而,面对大数据时代的媒体资源,如何全面、快速地获取关注的事件信息是值得深入研究的问题。该文针对事件信息采集效率低下的问题,揭示了事件之间的约束效应,为事件监测项、最简事件监测项的要素组成提供了指导;分析了最简事件监测项之间的相交关系,提出了事件监测项的归约方法,减少了用于搜采的监测项的数量。以一个市级地域SaaS平台和一个消防行业SaaS平台中的事件信息采集为实验对象,面向主流的内置搜索引擎,在事件监测项选取率和事件信息采集效率两方面进行了实验评测。结果表明,该文提出的事件监测项归约方法,减少了信息采集的次数,改善了事件信息采集的性能。
-
关键词
事件信息采集
内置搜索引擎
事件约束效应
事件监测项归约
-
Keywords
event crawling
built-in search engines
event constraint effect
event monitoring term reduction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-