为了解决传统事件相似度计算方法在TDT(topic detection and tracking)领域计算同一话题下事件相似度时存在不够精确的问题,根据模板知识提出了一种新的基于话题的事件相似度计算方法。该方法综合考虑了事件的内容相似度、事件和话题的...为了解决传统事件相似度计算方法在TDT(topic detection and tracking)领域计算同一话题下事件相似度时存在不够精确的问题,根据模板知识提出了一种新的基于话题的事件相似度计算方法。该方法综合考虑了事件的内容相似度、事件和话题的相似度、事件的时间相似度。实验结果表明,与传统方法相比,该方法能更准确地判断出同一话题下的事件相似性。展开更多
各种媒体每天有大量的新闻报道产生,需要一种自动化的分析方法将新闻以一种更加清晰的组织形式展示给用户.大多已有工作将新闻划分成平面的话题,然而一个话题并非仅仅是简单的新闻集合,而是由一系列相互关联的事件所组成的.由于话题内...各种媒体每天有大量的新闻报道产生,需要一种自动化的分析方法将新闻以一种更加清晰的组织形式展示给用户.大多已有工作将新闻划分成平面的话题,然而一个话题并非仅仅是简单的新闻集合,而是由一系列相互关联的事件所组成的.由于话题内的事件之间往往非常相似,导致话题内的事件检测精确度较差.为了克服以上问题,提出了基于事件词元委员会的事件检测与关系发现方法.即首先挖掘每个事件的核心词元,随后利用事件的核心词元进行事件检测与关系发现.在Linguistic Data Consortium(LDC)的两个数据集上的实验结果显示,提出的事件检测与关系发现方法可以显著地改善已有方法的效果.展开更多
文摘为了解决传统事件相似度计算方法在TDT(topic detection and tracking)领域计算同一话题下事件相似度时存在不够精确的问题,根据模板知识提出了一种新的基于话题的事件相似度计算方法。该方法综合考虑了事件的内容相似度、事件和话题的相似度、事件的时间相似度。实验结果表明,与传统方法相比,该方法能更准确地判断出同一话题下的事件相似性。
文摘各种媒体每天有大量的新闻报道产生,需要一种自动化的分析方法将新闻以一种更加清晰的组织形式展示给用户.大多已有工作将新闻划分成平面的话题,然而一个话题并非仅仅是简单的新闻集合,而是由一系列相互关联的事件所组成的.由于话题内的事件之间往往非常相似,导致话题内的事件检测精确度较差.为了克服以上问题,提出了基于事件词元委员会的事件检测与关系发现方法.即首先挖掘每个事件的核心词元,随后利用事件的核心词元进行事件检测与关系发现.在Linguistic Data Consortium(LDC)的两个数据集上的实验结果显示,提出的事件检测与关系发现方法可以显著地改善已有方法的效果.