期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中文新闻关键事件的主题句识别
被引量:
18
1
作者
王伟
赵东岩
赵伟
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第5期789-796,共8页
提出在单文档中通过提取主题句以获取关键事件信息的思想。根据新闻的体裁特点,分析了新闻报道与事件的关系,以及新闻标题在内容、形式和语言方面的特征。提出利用标题的提示性信息提取主题句来描述新闻关键事件的方法。该方法首先对新...
提出在单文档中通过提取主题句以获取关键事件信息的思想。根据新闻的体裁特点,分析了新闻报道与事件的关系,以及新闻标题在内容、形式和语言方面的特征。提出利用标题的提示性信息提取主题句来描述新闻关键事件的方法。该方法首先对新闻标题按信息含量进行分类,然后结合新闻句子的词频、长度、位置、与标题的相似度等特征计算句子的重要性。实验表明,该方法能够准确提取新闻主题句,为进一步抽取事件信息打好了基础。
展开更多
关键词
计算机应用
中文信息处理
自然语言处理
自动文摘
事件抽取
新闻标题
下载PDF
职称材料
C-TERN:一种基于CFSA的军事新闻文本时间信息处理算法
被引量:
4
2
作者
王伟
赵东岩
苏婷婷
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014年第1期9-16,共8页
提出一种基于层叠有限状态自动机(CFSA)的中文军事文本时间表达式识别与规范化算法C-TERN。C-TERN首先利用成熟的分词工具识别出文本中的时间词,然后将从通用语言和军事语言中提取的时间表达式规则分成多层,逐层进行时间信息的精细识别...
提出一种基于层叠有限状态自动机(CFSA)的中文军事文本时间表达式识别与规范化算法C-TERN。C-TERN首先利用成熟的分词工具识别出文本中的时间词,然后将从通用语言和军事语言中提取的时间表达式规则分成多层,逐层进行时间信息的精细识别。在规范化过程中,通过4个步骤分别对特殊时间表达式、简单时间表达式、时间段表达式和绝对/相对时间表达式进行推理计算和规范化。算法考虑了规则集提取的正确性、规则之间冲突的消解以及匹配方式的合理性。在多个数据集上的实验结果显示,C-TERN不但能有效地识别标准时间、偏移时间和不确定性时间表达式,而且能完成对简单、特殊以及隐含的时间点、时间段和偏移时间的推理与规范化,能够满足军事文本时间信息处理的需要。
展开更多
关键词
自然语言理解
有限状态自动机
时间表达式
识别与规范化
下载PDF
职称材料
题名
中文新闻关键事件的主题句识别
被引量:
18
1
作者
王伟
赵东岩
赵伟
机构
北京大学计算科学与技术研究所
武警工程学院电子
技术
系
计算
语言学教育部重点实验室
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第5期789-796,共8页
基金
国家自然科学基金(61003009)
北京市科委基金(Z101101005010003)
高等学校博士学科点专项科研基金(20100001120029)资助
文摘
提出在单文档中通过提取主题句以获取关键事件信息的思想。根据新闻的体裁特点,分析了新闻报道与事件的关系,以及新闻标题在内容、形式和语言方面的特征。提出利用标题的提示性信息提取主题句来描述新闻关键事件的方法。该方法首先对新闻标题按信息含量进行分类,然后结合新闻句子的词频、长度、位置、与标题的相似度等特征计算句子的重要性。实验表明,该方法能够准确提取新闻主题句,为进一步抽取事件信息打好了基础。
关键词
计算机应用
中文信息处理
自然语言处理
自动文摘
事件抽取
新闻标题
Keywords
computer application
Chinese information processing
natural language processing
automatic text abstract
event extraction
news headline
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
C-TERN:一种基于CFSA的军事新闻文本时间信息处理算法
被引量:
4
2
作者
王伟
赵东岩
苏婷婷
机构
武警工程
大学
信息安全重点实验室
北京大学计算科学与技术研究所
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014年第1期9-16,共8页
基金
陕西省自然科学基金(2013JQ8031)
国家自然科学基金(2012AA011101)
武警工程大学军事基础研究基金(WJY201314)资助
文摘
提出一种基于层叠有限状态自动机(CFSA)的中文军事文本时间表达式识别与规范化算法C-TERN。C-TERN首先利用成熟的分词工具识别出文本中的时间词,然后将从通用语言和军事语言中提取的时间表达式规则分成多层,逐层进行时间信息的精细识别。在规范化过程中,通过4个步骤分别对特殊时间表达式、简单时间表达式、时间段表达式和绝对/相对时间表达式进行推理计算和规范化。算法考虑了规则集提取的正确性、规则之间冲突的消解以及匹配方式的合理性。在多个数据集上的实验结果显示,C-TERN不但能有效地识别标准时间、偏移时间和不确定性时间表达式,而且能完成对简单、特殊以及隐含的时间点、时间段和偏移时间的推理与规范化,能够满足军事文本时间信息处理的需要。
关键词
自然语言理解
有限状态自动机
时间表达式
识别与规范化
Keywords
natrual language processing
finite state automata
temporal expression
recognition and normalization
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
中文新闻关键事件的主题句识别
王伟
赵东岩
赵伟
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011
18
下载PDF
职称材料
2
C-TERN:一种基于CFSA的军事新闻文本时间信息处理算法
王伟
赵东岩
苏婷婷
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部