期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于Transformer和重要词识别的句子融合方法
1
作者 谭红叶 李飞艳 《计算机应用与软件》 北大核心 2023年第7期145-150,共6页
句子融合是为多个句子生成言简意赅、符合语法的句子,可应用到自动摘要、复述生成等自然语言处理任务。目前句子融合方法已取得一定成效,但还存在重要信息缺失、语义偏离原句等问题。该文提出基于Transformer和重要词识别的方法来缓解... 句子融合是为多个句子生成言简意赅、符合语法的句子,可应用到自动摘要、复述生成等自然语言处理任务。目前句子融合方法已取得一定成效,但还存在重要信息缺失、语义偏离原句等问题。该文提出基于Transformer和重要词识别的方法来缓解上述问题。该方法包括两个模块,(1)重要词识别模块:利用序列标注模型识别原句重要词;(2)句子融合模块:将重要词与原句输入到Transformer框架并利用BERT进行语义表示,然后在全连接层引入基于原句和词表获得的向量作为先验知识进行句子融合。基于NLPCC2017摘要任务集构建句子融合数据集,并进行相关实验,结果表明所提方法的性能明显优于基线系统。 展开更多
关键词 句子融合 重要词 TRANSFORMER 文本生成
下载PDF
《宋词赏析》中提出的几个重要词学问题 被引量:1
2
作者 张悦 《才智》 2016年第25期222-223,共2页
至今鲜有人注意到,沈祖棻在《宋词赏析》的批评鉴赏中提出了创作与鉴赏的几大重要问题,并对这些问题做了自己的深入思考,本文为学界首次关注到这个问题,并力图全面总结与梳爬沈氏零散在书中的十二大方面重要词学问题。
关键词 《宋赏析》 重要词学问题 知人论世 画面感
原文传递
基于词重要性的信息检索图模型 被引量:11
3
作者 王明文 洪欢 +1 位作者 江爱文 左家莉 《中文信息学报》 CSCD 北大核心 2016年第4期134-141,共8页
在信息检索建模中,确定索引词项在文档中的重要性是一项重要内容。以词袋(bag-of-word)的形式表示文档来建立检索模型的方法中大多是基于词项独立性假设,用TF和IDF的函数来计算词项的重要性,并未考虑词项之间的关系。该文采用基于词项图... 在信息检索建模中,确定索引词项在文档中的重要性是一项重要内容。以词袋(bag-of-word)的形式表示文档来建立检索模型的方法中大多是基于词项独立性假设,用TF和IDF的函数来计算词项的重要性,并未考虑词项之间的关系。该文采用基于词项图(graph-of-word)的文档表示形式来捕获词项间的依赖关系,提出了一种新的基于词重要性的信息检索图模型TI-IDF。根据词项图得到文档中词项的共现矩阵和词项间的概率转移矩阵,通过马尔科夫链计算方法来确定词项在文档中的重要性(Term Importance,TI),并以此替代索引过程中传统的词项频率TF。该模型具有更好的鲁棒性,我们在国际公开数据集上与传统的检索模型进行了比较。实验结果表明,该文提出的模型都要优于BM25,且在大多数情况下优于BM25的扩展模型、TW-IDF等模型。 展开更多
关键词 重要 项图 检索模型 TI-IDF
下载PDF
信息检索中的带权邻近度度量研究 被引量:1
4
作者 薛源海 俞晓明 +2 位作者 刘悦 关峰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2014年第10期2216-2224,共9页
信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没... 信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升. 展开更多
关键词 带权邻近度 度量方法 BM25 查询重要 信息检索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部