期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
New event detection based on sorted subtopic matching algorithm
1
作者 翟东海 CUI Jing-jing +1 位作者 NIE Hong-yu DU Jia 《Journal of Chongqing University》 CAS 2013年第4期179-186,共8页
How to quickly and accurately detect new topics from massive data online becomes a main problem of public opinion monitoring in cyberspace. This paperpresents a new event detection method for the current new event det... How to quickly and accurately detect new topics from massive data online becomes a main problem of public opinion monitoring in cyberspace. This paperpresents a new event detection method for the current new event detection system, based on sorted subtopic matching algorithm and constructs the entire design framework. In this p^per, the subtopics contained in old topics (or news stories) are sorted in descending order according to their importance to the topic(or news stories), and form a sorted subtopic sequence. In the process of subtopic matching, subtopic scoring matrix is used to determine whether a new story is reporting a new event. Experimental results show that the sorted subtopic matching model improved the accuracy and effectiveness ofthenew event detection system in cyberspace. 展开更多
关键词 new event detection topic detection scoring matrix sorted subtopic matching model subtopic sequence
下载PDF
新闻事件分析系统IEventMiner的设计
2
作者 雷震 吴玲达 +1 位作者 王辰 贺玲 《计算机科学》 CSCD 北大核心 2006年第4期177-180,共4页
本文介绍了基于事件的新闻报道信息组织系统 IEventMiner 的设计思想和实现方法,该系统不但可以对新闻报道中的事件进行探测和追踪,还可以进行事件相关故事单元(RSU)的检索与分类。对 IEventMiner 系统的设计思路以及各功能模块进行了... 本文介绍了基于事件的新闻报道信息组织系统 IEventMiner 的设计思想和实现方法,该系统不但可以对新闻报道中的事件进行探测和追踪,还可以进行事件相关故事单元(RSU)的检索与分类。对 IEventMiner 系统的设计思路以及各功能模块进行了详细的说明,并给出了原型系统。与相关研究工作相比,该系统不但具有更好的可扩充性,而且更加稳定。 展开更多
关键词 新闻报道 事件探测 事件追踪 检索与分类
下载PDF
Online detection of bursty events and their evolution in news streams
3
作者 Wei CHEN Chun CHEN Li-jun ZHANC Can WANG Jia-jun BU 《Journal of Zhejiang University-Science C(Computers and Electronics)》 SCIE EI 2010年第5期340-355,共16页
Online monitoring of temporally-sequenced news streams for interesting patterns and trends has gained popularity in the last decade.In this paper,we study a particular news stream monitoring task:timely detection of b... Online monitoring of temporally-sequenced news streams for interesting patterns and trends has gained popularity in the last decade.In this paper,we study a particular news stream monitoring task:timely detection of bursty events which have happened recently and discovery of their evolutionary patterns along the timeline.Here,a news stream is represented as feature streams of tens of thousands of features(i.e.,keyword.Each news story consists of a set of keywords.).A bursty event therefore is composed of a group of bursty features,which show bursty rises in frequency as the related event emerges.In this paper,we give a formal definition to the above problem and present a solution with the following steps:(1) applying an online multi-resolution burst detection method to identify bursty features with different bursty durations within a recent time period;(2) clustering bursty features to form bursty events and associating each event with a power value which reflects its bursty level;(3) applying an information retrieval method based on cosine similarity to discover the event's evolution(i.e.,highly related bursty events in history) along the timeline.We extensively evaluate the proposed methods on the Reuters Corpus Volume 1.Experimental results show that our methods can detect bursty events in a timely way and effectively discover their evolution.The power values used in our model not only measure event's bursty level or relative importance well at a certain time point but also show relative strengths of events along the same evolution. 展开更多
关键词 Online event detection event’s evolution news stream Affinity propagation
原文传递
基于大语言模型隐含语义增强的细粒度虚假新闻检测方法
4
作者 柯婧 谢哲勇 +3 位作者 徐童 陈宇豪 廖祥文 陈恩红 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1250-1260,共11页
随着生成式人工智能技术的发展,许多领域都得到了帮助与发展,但与此同时虚假信息的构建与传播变得更加简单,虚假信息的检测也随之难度增加.先前的工作主要聚焦于语法问题、内容煽动性等方面的特点,利用深度学习模型对虚假新闻内容进行建... 随着生成式人工智能技术的发展,许多领域都得到了帮助与发展,但与此同时虚假信息的构建与传播变得更加简单,虚假信息的检测也随之难度增加.先前的工作主要聚焦于语法问题、内容煽动性等方面的特点,利用深度学习模型对虚假新闻内容进行建模.这样的方式不仅缺乏对内容本身的判断,还无法回溯模型的判别原因.针对上述问题提出一种基于大语言模型隐含语义增强的细粒度虚假新闻检测方法.该方法充分挖掘并利用了现有的生成式大语言模型所具有的总结与推理能力,按照主干事件、细粒度次要事件和隐含信息推理的顺序进行层级式推导,逐步判别新闻的真实性.通过分解任务的方式,该方法最大程度发挥了模型的能力,提高了对虚假新闻的捕获能力,同时该方法也具有一定的可解释性,能够为检测提供判别依据. 展开更多
关键词 社交媒体 虚假新闻检测 大语言模型 事件抽取 知识增强
下载PDF
基于跨层级多视角特征的多语言事件探测
5
作者 张志远 张维彦 +1 位作者 宋雨秋 阮彤 《计算机科学》 CSCD 北大核心 2024年第5期208-215,共8页
多语言事件探测任务的目标是将多种语言的新闻文档集合组织成不同的关键事件,其中每个事件可以包含不同语言的新闻文档。该任务有助于各种下游任务应用,如多语言知识图谱构建、事件推理、信息检索等。目前,多语言事件探测主要分为先翻... 多语言事件探测任务的目标是将多种语言的新闻文档集合组织成不同的关键事件,其中每个事件可以包含不同语言的新闻文档。该任务有助于各种下游任务应用,如多语言知识图谱构建、事件推理、信息检索等。目前,多语言事件探测主要分为先翻译再事件探测与先单语言检测再跨多种语言对齐两种方法,前者依赖翻译的效果,后者需要为每种语言单独训练模型。为此,提出了一种名为基于跨层级多视角特征融合的多语言事件探测方法,端到端地进行多语言事件探测任务。该方法从不同层级利用文档的多视角特征,获得了高可靠性的多语言事件探测结果并提升了低资源语言事件探测的泛化性能。在9种语言混合的新闻数据集上进行的实验表明,所提方法的BCubed F1值提升了4.63%。 展开更多
关键词 多语言预训练模型 多语言事件探测 新闻文档聚类 加权相似度 增量聚类
下载PDF
一种基于动态进化模型的事件探测和追踪算法 被引量:58
6
作者 贾自艳 何清 +2 位作者 张海俊 李嘉佑 史忠植 《计算机研究与发展》 EI CSCD 北大核心 2004年第7期1273-1280,共8页
在大量分析网络新闻特点的基础上 ,借鉴Single Pass聚类思想 ,并结合新闻要素给出了一种基于动态进化模型的事件探测和追踪算法 该动态模型是基于新闻事件的生存特点提出的 ,包括 :基于时间距离的相似度计算模型、事件模板进化策略以及... 在大量分析网络新闻特点的基础上 ,借鉴Single Pass聚类思想 ,并结合新闻要素给出了一种基于动态进化模型的事件探测和追踪算法 该动态模型是基于新闻事件的生存特点提出的 ,包括 :基于时间距离的相似度计算模型、事件模板进化策略以及动态阈值设置思想 该算法可以自动对新闻资料进行组织生成新闻专题 ,进而为用户提供个性化服务 展开更多
关键词 新闻事件 新闻专题 事件探测 事件追踪 聚类
下载PDF
基于子话题分治匹配的新事件检测 被引量:26
7
作者 洪宇 张宇 +2 位作者 范基礼 刘挺 李生 《计算机学报》 EI CSCD 北大核心 2008年第4期687-695,共9页
新事件检测是话题检测与跟踪领域的一项重要研究,其任务是实时监控新闻报道流并从中识别新话题.现有方法将话题和报道描述为单一结构的特征向量进行匹配,造成子话题间互为噪声并形成错误语义,从而误导新话题的识别.针对这一缺陷,文中提... 新事件检测是话题检测与跟踪领域的一项重要研究,其任务是实时监控新闻报道流并从中识别新话题.现有方法将话题和报道描述为单一结构的特征向量进行匹配,造成子话题间互为噪声并形成错误语义,从而误导新话题的识别.针对这一缺陷,文中提出基于子话题分治匹配的新事件检测方法,将话题和报道划分为不同子话题,根据相关子话题的比例关系和分布关系建立新话题识别模型.实验在TDT4和TDT5中获得显著改进,最小检测错误代价为0.4061,相应漏检率为0.1859. 展开更多
关键词 新事件检测 话题检测与跟踪 子话题
下载PDF
基于新闻要素的新事件检测方法研究 被引量:8
8
作者 薛晓飞 张永奎 任晓东 《计算机应用》 CSCD 北大核心 2008年第11期2975-2977,共3页
新事件检测(NED)的目标是检测出报道一个新闻话题种子事件的第一个新闻。考虑到新闻的基本要素在新闻中的作用,采用特征加权的方式对传统的词频和倒排文档频率(TF-IDF)模型进行改进,并在新闻报道中提取出时间信息和地点信息,分别对内容... 新事件检测(NED)的目标是检测出报道一个新闻话题种子事件的第一个新闻。考虑到新闻的基本要素在新闻中的作用,采用特征加权的方式对传统的词频和倒排文档频率(TF-IDF)模型进行改进,并在新闻报道中提取出时间信息和地点信息,分别对内容相似度、时间相似度和地点相似度进行计算,并将三者结合来检测新事件。实验证明这种方法有效。 展开更多
关键词 新事件检测 事件模型 相似度计算
下载PDF
基于关键词元的话题内事件检测 被引量:15
9
作者 张阔 李涓子 +1 位作者 吴刚 王克宏 《计算机研究与发展》 EI CSCD 北大核心 2009年第2期245-252,共8页
各种媒体每天有大量的新闻报道产生,需要一种自动化的分析方法将新闻以一种更加清晰的组织形式展示给用户.大多已有工作将新闻划分成平面的话题,然而一个话题并非仅仅是简单的新闻集合,而是由一系列相互关联的事件所组成的.由于话题内... 各种媒体每天有大量的新闻报道产生,需要一种自动化的分析方法将新闻以一种更加清晰的组织形式展示给用户.大多已有工作将新闻划分成平面的话题,然而一个话题并非仅仅是简单的新闻集合,而是由一系列相互关联的事件所组成的.由于话题内的事件之间往往非常相似,导致话题内的事件检测精确度较差.为了克服以上问题,提出了基于事件词元委员会的事件检测与关系发现方法.即首先挖掘每个事件的核心词元,随后利用事件的核心词元进行事件检测与关系发现.在Linguistic Data Consortium(LDC)的两个数据集上的实验结果显示,提出的事件检测与关系发现方法可以显著地改善已有方法的效果. 展开更多
关键词 事件检测 事件关系发现 关键词元 话题检测 新闻组织
下载PDF
基于词元再评估的新事件检测模型 被引量:17
10
作者 张阔 李涓子 +1 位作者 吴刚 王克宏 《软件学报》 EI CSCD 北大核心 2008年第4期817-828,共12页
新事件检测(new event detection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻.初步实验发现,在对不同类别的新闻报道进行新事件检测时,其不同类型的词元往往具有不同的敏感程度.而传统方法往往将所有的... 新事件检测(new event detection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻.初步实验发现,在对不同类别的新闻报道进行新事件检测时,其不同类型的词元往往具有不同的敏感程度.而传统方法往往将所有的词元等同看待.重点研究在新事件检测模型中,对于不同词元的权重设定问题.提出利用统计方法优化不同类别新闻对于不同词性词元的权重参数;提出利用已有新闻簇信息动态更新词元权重的方法,采用在新闻之间(而非新闻与新闻簇之间)计算相似度的形式,发挥两种比较形式的优点.在Linguistic Data Consortium(LDC)公共数据集TDT2与TDT3上进行实验,实验结果表明,这两种改进方法的效果明显,性能与同类系统相比有显著提升. 展开更多
关键词 新事件检测 信息检索 命名实体 词元再评估
下载PDF
话题检测与跟踪的评测及研究综述 被引量:153
11
作者 洪宇 张宇 +1 位作者 刘挺 李生 《中文信息学报》 CSCD 北大核心 2007年第6期71-87,共17页
话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从1996年前瞻性的探索以来,该领域进行的多次大规模评测为信息识别、采集和组织等相关技术提供了新的测试平台。由于话题检测与跟踪相对于信... 话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从1996年前瞻性的探索以来,该领域进行的多次大规模评测为信息识别、采集和组织等相关技术提供了新的测试平台。由于话题检测与跟踪相对于信息检索、信息挖掘和信息抽取等自然语言处理技术具备很多共性,并面向具备突发性和延续性规律的新闻语料,因此逐渐成为当前信息处理领域的研究热点。本文简要介绍了话题检测与跟踪的研究背景、任务定义、评测方法以及相关技术,并通过分析目前TDT领域的研究现状展望未来的发展趋势。 展开更多
关键词 计算机应用 中文信息处理 综述 话题检测与跟踪 自然语言处理 事件 新闻报道
下载PDF
一种基于TF·IEF模型的在线新闻事件探测方法 被引量:3
12
作者 张辉 李国辉 +1 位作者 贾立 孙博良 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第3期55-60,共6页
为了提升在线新闻事件探测的性能,提出一种基于TF.IEF模型的在线新闻事件探测方法。该方法受TF.IDF思想的启发,直接计算特征词表征事件的权重,建立新的增量事件模型,并将探测过程分为两个阶段:第一阶段利用Single-Pass将一定时段内收集... 为了提升在线新闻事件探测的性能,提出一种基于TF.IEF模型的在线新闻事件探测方法。该方法受TF.IDF思想的启发,直接计算特征词表征事件的权重,建立新的增量事件模型,并将探测过程分为两个阶段:第一阶段利用Single-Pass将一定时段内收集到的报道聚成微簇;第二阶段将微簇与已有事件进行相似性匹配,然后通过重新计算事件向量实现模型更新。实验结果表明,该方法运算速度快,特征信息丢失少,提高了探测的效率和准确率。 展开更多
关键词 在线新闻事件探测 TF·IEF模型 增量事件模型 Single-Pass聚类
下载PDF
在线新事件检测系统中的性能提升策略 被引量:3
13
作者 王颖颖 张赟 胡乃静 《计算机工程》 CAS CSCD 北大核心 2008年第15期72-74,共3页
现有的关于在线新事件检测(ONED)系统的研究更多地关注如何提高检测的准确率而很少考虑对资源的利用率,使ONED系统在实际应用中存在性能低下的问题。该文分析了传统的事件检测系统存在的性能上的缺点,并在此基础上进行了改进,在基本不... 现有的关于在线新事件检测(ONED)系统的研究更多地关注如何提高检测的准确率而很少考虑对资源的利用率,使ONED系统在实际应用中存在性能低下的问题。该文分析了传统的事件检测系统存在的性能上的缺点,并在此基础上进行了改进,在基本不降低识别正确率的基础上,通过合理设定技术参数以及对链表索引机制进行预筛选,降低了文档比较过程中的存储和计算开销。实验结果表明,改进的系统提升了检测性能。 展开更多
关键词 在线新事件检测 话题识别与跟踪 信息检索 预筛选
下载PDF
新闻数据流的在线事件检测 被引量:1
14
作者 陈伟 张成 +3 位作者 王灿 卜佳俊 陈纯 陈宏 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第6期1006-1012,共7页
针对新闻数据流事件检测算法在实时性、准确率等方面存在的问题,提出一种面向新闻数据流的在线事件检测方法.事件的发生往往伴随着构成该事件的特征(即关键词)在相应时间段内出现的频率明显上升,将这些特征称为突发特征.运用分布拟合检... 针对新闻数据流事件检测算法在实时性、准确率等方面存在的问题,提出一种面向新闻数据流的在线事件检测方法.事件的发生往往伴随着构成该事件的特征(即关键词)在相应时间段内出现的频率明显上升,将这些特征称为突发特征.运用分布拟合检验检测构成新闻数据流的特征在某一时间段内新闻报道中出现频率的分布是否发生明显变化,并进一步利用左边检验确认该时间段内的所有突发特征.分析突发特征的相关性,采用进化谱聚类算法将相关性较高的突发特征聚类在一起构成事件.在路透社新闻数据集第一卷上应用了本算法,验证了该方法能够有效地发现突发特征,并实时地检测出发生的事件,检测出的事件同实际事件有很高的符合度. 展开更多
关键词 在线事件检测 进化谱聚类 假设检验 新闻数据流
下载PDF
基于最大流最小割算法的事件检测方案 被引量:2
15
作者 张瑞华 程合友 梁宇 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第1期139-144,共6页
文中把最大流最小割算法应用于无线传感网络的事件检测中,针对边沿陡峭的事件,设计事件区域检测算法(G-Cut).该算法首先将相邻节点的传感数据转化为权值,形成流网络;利用最大流最小割算法切割流网络,获得事件边界;再根据上传信息隐含的... 文中把最大流最小割算法应用于无线传感网络的事件检测中,针对边沿陡峭的事件,设计事件区域检测算法(G-Cut).该算法首先将相邻节点的传感数据转化为权值,形成流网络;利用最大流最小割算法切割流网络,获得事件边界;再根据上传信息隐含的方向,确定事件区域.以野外火灾为例进行仿真实验,结果表明:文中算法事件检测准确度高,节点计算量低;针对多事件区域,在不增加节点计算量和通信量的情况下,仍可保证其检测准确度. 展开更多
关键词 无线传感网络 最大流最小割算法 事件检测 Boykov新算法 多事件区域
下载PDF
基于词对特征的事件新侧面探测 被引量:1
16
作者 冯礼 李芳 盛焕烨 《计算机工程》 CAS CSCD 北大核心 2009年第3期45-47,59,共4页
在基于事件框架的新闻信息抽取中,针对事件侧面被框架结构所限定的问题,提出一种事件新侧面探测方法,并定义事件新侧面的2种类型。通过去除已有的侧面内容,实现LSA聚类探测,同时在文本特征选取部分采用词对特征模型,以充分利用有限文本... 在基于事件框架的新闻信息抽取中,针对事件侧面被框架结构所限定的问题,提出一种事件新侧面探测方法,并定义事件新侧面的2种类型。通过去除已有的侧面内容,实现LSA聚类探测,同时在文本特征选取部分采用词对特征模型,以充分利用有限文本中的语法信息。在原型系统中对该方法进行测试,实验结果表明,该方法是有效的。 展开更多
关键词 新侧面探测 事件框架 词对特征 信息抽取
下载PDF
LDA及主题词相关性的新事件检测 被引量:4
17
作者 黄颖 《计算机与现代化》 2012年第1期6-9,13,共5页
目前,话题检测与跟踪已被广泛应用,新事件检测作为话题检测与跟踪领域中的研究任务之一,为跟踪后续话题发展的先验知识,在话题检测与跟踪领域具有重要的理论研究意义。LDA主题模型不能自动识别新事件,其主题数需通过人工或反复实验来确... 目前,话题检测与跟踪已被广泛应用,新事件检测作为话题检测与跟踪领域中的研究任务之一,为跟踪后续话题发展的先验知识,在话题检测与跟踪领域具有重要的理论研究意义。LDA主题模型不能自动识别新事件,其主题数需通过人工或反复实验来确定,识别效率低。本文提出基于LDA及主题词间的相关性新事件检测算法,同时结合报道发生的时间,确定合理的主题数目,从而探知新事件。实验证明,与传统LDA算法及Gibbs LDA算法相比,该方法具有一定优势,提高了对新事件检测的敏感度。 展开更多
关键词 LDA 话题检测 新事件检测 主题词相关性
下载PDF
基于时序话题模型的新事件检测 被引量:3
18
作者 仓玉 洪宇 +1 位作者 姚建民 朱巧明 《智能计算机与应用》 2011年第1X期74-78,共5页
新事件检测(NewEventDetection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻。初步实验发现,构成事件的一项重要属性是事件发生的特定时间,因此时间是区分不同事件的重要标志。为此,提出时序话题模... 新事件检测(NewEventDetection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻。初步实验发现,构成事件的一项重要属性是事件发生的特定时间,因此时间是区分不同事件的重要标志。为此,提出时序话题模型(TemporalTopicModel,简称TTM)。TYM将话题和报道切分为若干对应不同时间表达式的事件。其中,时间表达式描述事件发生的特定时间。TTM基于时间表达式在话题中出现的频率和增长率,估量对应时间表达式的事件作为种子事件或相关新颖事件的概率。此外,时间表达式的频率与增长率也用于衡量事件在相关性匹配中权重。在此基础上,NED依赖时间特性快速遏制不同时间发生的事件匹配,并借助种子事件和新颖事件调整相关性判定的权重分配。 展开更多
关键词 新事件检测 时间表达式 时序话题模型
下载PDF
新的基于综合特征的新闻事件分割方法
19
作者 刘文萍 蒋小森 《计算机工程与应用》 CSCD 北大核心 2009年第31期233-236,共4页
提出了一种基于新闻视频中的标题字幕信息和音视频特征对新闻事件进行分割的方法,并实现了一个新闻事件分割、浏览和检索的原型系统。提出的方法综合利用新闻视频中的标题检测、主持人画面检测以及静音片段和语者切换检测技术分割整段... 提出了一种基于新闻视频中的标题字幕信息和音视频特征对新闻事件进行分割的方法,并实现了一个新闻事件分割、浏览和检索的原型系统。提出的方法综合利用新闻视频中的标题检测、主持人画面检测以及静音片段和语者切换检测技术分割整段新闻中的新闻事件。实验结果表明,该方法较仅利用标题的新闻事件分割方法在分割准确性上有了显著提高。 展开更多
关键词 视频检索 新闻事件分割 文字提取 语者切换检测 静音片段检测
下载PDF
面向大规模数据的在线新事件检测 被引量:1
20
作者 蔡偃武 高大启 +1 位作者 阮彤 蒋锐权 《计算机工程》 CAS CSCD 2014年第10期37-42,共6页
通过分析基于新闻要素的在线新事件检测算法的时间消耗,提出一种面向大规模数据环境的在线新事件检测算法。该算法利用基于倒排索引的高效相似报道搜索机制,有效减少单路径聚类算法中的相似度比较次数。通过对报道预处理、报道与事件比... 通过分析基于新闻要素的在线新事件检测算法的时间消耗,提出一种面向大规模数据环境的在线新事件检测算法。该算法利用基于倒排索引的高效相似报道搜索机制,有效减少单路径聚类算法中的相似度比较次数。通过对报道预处理、报道与事件比较以及索引搜索这3个过程的并行化,提高算法在多机环境下的运行效率和可伸缩性。实验结果表明,该算法在不影响漏检率和误检率的基础上,提高了新事件检测的速度,并且在千万到亿级别的报道规模下,其吞吐量达到150条/s^200条/s。 展开更多
关键词 新事件检测 单路径聚类 大规模数据 并行计算 倒排索引 MapReduce架构
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部