期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
事件检测与描述中的时间信息提取 被引量:2
1
作者 张先飞 李弼程 +1 位作者 刘嵩 孙显著 《情报学报》 CSSCI 北大核心 2011年第4期395-401,共7页
时间信息在事件检测与描述中起着决定性作用,对自动内容抽取中的事件检测进行研究,就应该首先对时间信息进行详细、系统地研究。本文致力于事件检测中的时间信息研究,对文本中有明显标记和无明显标记的时间进行区分;在明确要提取时间具... 时间信息在事件检测与描述中起着决定性作用,对自动内容抽取中的事件检测进行研究,就应该首先对时间信息进行详细、系统地研究。本文致力于事件检测中的时间信息研究,对文本中有明显标记和无明显标记的时间进行区分;在明确要提取时间具体内容的基础上对时间进行详细分类并阐明其含义,其中包括精确时间、模糊时间、修饰类时间、时间集及其他不确定时间等;在此基础上对涉及时间信息的名词修饰语、时间间隔、嵌入式时间表达和时间定位词等时间范围信息进行研究;最后引入时间戳的概念,并对时间戳的类型及涉及时间戳与事件的关系进行详细研究,从而引出如何在时间戳研究的基础上,更好地进行事件检测与描述。本文的研究成果可以很好地应用于自动内容抽取、自动问答系统、话题追踪结果及自动文摘系统中。 展开更多
关键词 自动内容抽取 事件检测与描述 时间表达式 嵌入式时间 时间定位词
下载PDF
自动内容抽取中的中文事件标注 被引量:1
2
作者 张先飞 郭志刚 +1 位作者 李弼程 孙显著 《情报学报》 CSSCI 北大核心 2011年第1期61-68,共8页
事件检测与描述(Event Detection and Characterization,EDC)自2005年作为自动内容抽取(Automatic ContentExtraction,ACE)评测的一个重要子任务出现以来,中文事件的标注、检测与描述越来越成为研究热点。本文就自动内容抽取中的中... 事件检测与描述(Event Detection and Characterization,EDC)自2005年作为自动内容抽取(Automatic ContentExtraction,ACE)评测的一个重要子任务出现以来,中文事件的标注、检测与描述越来越成为研究热点。本文就自动内容抽取中的中文事件标注进行详细、系统地研究,主要包括:在ACE会议定义中文事件相关概念的基础上,给出事件标注中事件的可标注内容,包括事件范围及事件触发词等;根据生活中的事件分类在人工事件标注中对EDC的事件进行类别划分及其子类的详细区分,以降低事件检测的复杂度;对每个事件类别(包括子类别)中构成事件的元素进行研究,综合事件类别及其元素信息完成中文事件的标注。本文的研究成果在中文文本信息抽取、自动摘要及主题检测与追踪中得到了很好的应用。 展开更多
关键词 自动内容抽取 事件检测 触发词 事件类别 元素 事件描述
下载PDF
基于概念相似度的话题自动检测方法 被引量:3
3
作者 刘嵩 张先飞 +1 位作者 李弼程 孙显著 《信息工程大学学报》 2010年第3期303-307,共5页
传统话题自动检测一般采用向量空间模型进行文本相似度计算,这种方法单纯依靠特征词进行话题检测,忽略了词之间的概念及由此而引发的概念相似度。针对此问题,文章首先对网络新闻文本进行事件元素提取,并将事件元素特征词分解为概念集合... 传统话题自动检测一般采用向量空间模型进行文本相似度计算,这种方法单纯依靠特征词进行话题检测,忽略了词之间的概念及由此而引发的概念相似度。针对此问题,文章首先对网络新闻文本进行事件元素提取,并将事件元素特征词分解为概念集合,通过计算概念集合的内积空间得到词之间的相似度,进而根据词相似度计算文本相似度,最后根据概念相似度计算实现话题的自动检测。实验结果表明,本方法能够有效提高话题检测的准确率和召回率。 展开更多
关键词 话题检测 概念 相似度 向量空间模型 命名实体
下载PDF
一种有效的多文档文摘语义空间降维方法
4
作者 张先飞 刘嵩 +1 位作者 韩永峰 孙显著 《情报学报》 CSSCI 北大核心 2011年第3期286-291,共6页
基于多文档集合特征的多文档文摘生成方法在选取最优词时利用人工进行特征降维,方法过于机械,同时在回溯词.文档矩阵进行文本相似度计算时,存在对稀疏矩阵无法计算的问题。本文对话题追踪结果进行多文档文摘研究,提出一种有效的多... 基于多文档集合特征的多文档文摘生成方法在选取最优词时利用人工进行特征降维,方法过于机械,同时在回溯词.文档矩阵进行文本相似度计算时,存在对稀疏矩阵无法计算的问题。本文对话题追踪结果进行多文档文摘研究,提出一种有效的多文档文摘语义空间降维方法。新方法在整个话题范围内构造语义空间词-文档矩阵,采用奇异值分解对原始词.文档矩阵进行特征降维,同时构造能充分包含原始文档词汇信息且维数低的转换矩阵F,利用它来回溯词-文档矩阵,完成低维空间下的词相似度计算,进而完成文本单元相似度计算以及文本单元聚类,最终生成多文档自动文摘。实验结果表明,该方法能够对语义空间词.文档矩阵进行完美降维,同时避免稀疏矩阵无法计算的问题,对最终生成的多文档文摘有着很好的效果。 展开更多
关键词 语义空间 多文档文摘 特征降维 奇异值分解 聚类
下载PDF
基于单实体语言模型的实体关系发现和描述 被引量:1
5
作者 刘路 李弼程 +1 位作者 张先飞 孙显著 《信息工程大学学报》 2008年第3期352-355,共4页
传统中文实体关系抽取方法大都采用基于共现实体对的上下文模型,这种模型会遗失很多潜在的实体关系,并且无法对相似的实体关系给出合理的描述信息。针对这一局限性,文章提出一种基于单实体的上下文语言模型。通过对文本集中的所有实体... 传统中文实体关系抽取方法大都采用基于共现实体对的上下文模型,这种模型会遗失很多潜在的实体关系,并且无法对相似的实体关系给出合理的描述信息。针对这一局限性,文章提出一种基于单实体的上下文语言模型。通过对文本集中的所有实体建立上下文语言模型,来计算实体之间的相似度以及上下文词汇的贡献度得分,从而发现相似度较高的实体对,并获得实体关系的描述信息。实验证明,与传统方法相比,本文方法能够发现更丰富的实体关系,描述信息也更加准确。 展开更多
关键词 实体关系发现 上下文词汇 实体关系描述 语言模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部