-
题名基于事件多要素模型的新闻主题句抽取
被引量:1
- 1
-
-
作者
李中伟
赖华
周超
-
机构
昆明理工大学信息科学与自动化学院
昆明理工大学智能信息处理重点实验室
不详
-
出处
《计算机与数字工程》
2017年第6期1156-1160,共5页
-
文摘
新闻主题句抽取是对新闻文本进行语义分析的一种技术,其核心是将新闻文本中的句子作为语义分析的基本单元,识别出与新闻主题语义最相关的句子。针对Web新闻特征,提出了一种基于事件多要素模型的新闻主题句抽取方法。首先提取出了新闻报道的标题T、关键字K、描述D、首段F和子事件句S,然后用标题、关键字、描述和首段去表征一篇新闻文档,接着将子事件句和新闻文档以事件多要素模型的方式映射到向量空间中,最后利用向量之间的余弦相似度计算子事件句和新闻文档的相似度,并取相似度最高的为新闻主题句。实验结果表明,在社会政治和自然灾害两类的主题句抽取上,提出的方法优于基于LDA模型的主题句抽取方法和基于TFIDF的抽取方法,F值得到了明显的提升。
-
关键词
新闻事件
信息抽取
多要素模型
新闻主题句
-
Keywords
news event,information extraction,multi factor model,news topic sentence
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名融合多特征的汉泰双语新闻主题句相似度计算
- 2
-
-
作者
孙帅强
郜洪奎
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学智能信息处理重点实验室
-
出处
《软件》
2017年第9期18-22,共5页
-
基金
国家自然科学基金:面向互联网的泰语-汉语双语语料获取及对齐方法研究(61363044)
国家自然科学基金:面向汉语-泰语跨语言新闻事件检索方法研究(61462054)
云南省教育厅重点项目:汉语-泰语跨语言新闻事件检索中的相似度计算研究(20142021)
-
文摘
句子相似度的计算是自然语言处理领域中的重要研究课题,它在信息检索、文本挖掘、机器翻译等领域占有重要的作用。为提高汉泰双语新闻主题句相似度计算的准确率,本文根据汉泰双语新闻主题句的句式特点,提出了一种融合多特征的汉泰双语新闻主题句相似度计算方法。在选取词性、句法成分作为有效特征外,引入句子依存关系特征,并通过对不同的特征加不同的权重来调节各个特征对相似度计算的贡献,从而使计算结果达到最优。与基于词典的方法进行比较,实验结果表明,该方法使得准确率提高了5.9%。
-
关键词
汉泰双语
新闻主题句
相似度计算
多特征融合
权重
-
Keywords
Chinese-Thai
News topic sentence
Similarity calculation
Multi-features fusion
Weight
-
分类号
TP91
[自动化与计算机技术]
-
-
题名总结型英语新闻主题句分析及其汉译策略
- 3
-
-
作者
陈谊
-
机构
北京邮电大学语言学院
-
出处
《前沿》
北大核心
2010年第8期160-162,共3页
-
文摘
本文对总结型英语新闻主题句的特点及其在新闻中的重要性进行了分析,并阐述了该类主题句的英译汉原则。因为总结型英语新闻主题句是新闻报道中最为重要的内容,并构成整个新闻的灵魂,所以对该类主题句的成功翻译就成为新闻翻译的关键。本文通过对该类主题句的特点进行研究,认为对总结型英语新闻主题句汉译的关键是理清句子的逻辑关系和发生顺序,用目标语特有的表达方式和因果、逻辑关系对原文进行处理,使其在充分传达原文信息的基础上符合汉语语言的特征,并提出三种相应的翻译策略来应对该类英语新闻主题句的翻译。
-
关键词
总结型英语新闻主题句
翻译
策略
-
分类号
H315.9
[语言文字—英语]
-