期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Transformer和重要词识别的句子融合方法
1
作者
谭红叶
李飞艳
《计算机应用与软件》
北大核心
2023年第7期145-150,共6页
句子融合是为多个句子生成言简意赅、符合语法的句子,可应用到自动摘要、复述生成等自然语言处理任务。目前句子融合方法已取得一定成效,但还存在重要信息缺失、语义偏离原句等问题。该文提出基于Transformer和重要词识别的方法来缓解...
句子融合是为多个句子生成言简意赅、符合语法的句子,可应用到自动摘要、复述生成等自然语言处理任务。目前句子融合方法已取得一定成效,但还存在重要信息缺失、语义偏离原句等问题。该文提出基于Transformer和重要词识别的方法来缓解上述问题。该方法包括两个模块,(1)重要词识别模块:利用序列标注模型识别原句重要词;(2)句子融合模块:将重要词与原句输入到Transformer框架并利用BERT进行语义表示,然后在全连接层引入基于原句和词表获得的向量作为先验知识进行句子融合。基于NLPCC2017摘要任务集构建句子融合数据集,并进行相关实验,结果表明所提方法的性能明显优于基线系统。
展开更多
关键词
句子融合
重要词
TRANSFORMER
文本生成
下载PDF
职称材料
《宋词赏析》中提出的几个重要词学问题
被引量:
1
2
作者
张悦
《才智》
2016年第25期222-223,共2页
至今鲜有人注意到,沈祖棻在《宋词赏析》的批评鉴赏中提出了创作与鉴赏的几大重要问题,并对这些问题做了自己的深入思考,本文为学界首次关注到这个问题,并力图全面总结与梳爬沈氏零散在书中的十二大方面重要词学问题。
关键词
《宋
词
赏析》
重要词
学问题
知人论世
画面感
原文传递
基于词重要性的信息检索图模型
被引量:
11
3
作者
王明文
洪欢
+1 位作者
江爱文
左家莉
《中文信息学报》
CSCD
北大核心
2016年第4期134-141,共8页
在信息检索建模中,确定索引词项在文档中的重要性是一项重要内容。以词袋(bag-of-word)的形式表示文档来建立检索模型的方法中大多是基于词项独立性假设,用TF和IDF的函数来计算词项的重要性,并未考虑词项之间的关系。该文采用基于词项图...
在信息检索建模中,确定索引词项在文档中的重要性是一项重要内容。以词袋(bag-of-word)的形式表示文档来建立检索模型的方法中大多是基于词项独立性假设,用TF和IDF的函数来计算词项的重要性,并未考虑词项之间的关系。该文采用基于词项图(graph-of-word)的文档表示形式来捕获词项间的依赖关系,提出了一种新的基于词重要性的信息检索图模型TI-IDF。根据词项图得到文档中词项的共现矩阵和词项间的概率转移矩阵,通过马尔科夫链计算方法来确定词项在文档中的重要性(Term Importance,TI),并以此替代索引过程中传统的词项频率TF。该模型具有更好的鲁棒性,我们在国际公开数据集上与传统的检索模型进行了比较。实验结果表明,该文提出的模型都要优于BM25,且在大多数情况下优于BM25的扩展模型、TW-IDF等模型。
展开更多
关键词
词
项
重要
性
词
项图
检索模型
TI-IDF
下载PDF
职称材料
信息检索中的带权邻近度度量研究
被引量:
1
4
作者
薛源海
俞晓明
+2 位作者
刘悦
关峰
程学旗
《计算机研究与发展》
EI
CSCD
北大核心
2014年第10期2216-2224,共9页
信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没...
信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升.
展开更多
关键词
带权邻近度
度量方法
BM25
查询
词
重要
性
信息检索
下载PDF
职称材料
题名
基于Transformer和重要词识别的句子融合方法
1
作者
谭红叶
李飞艳
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
出处
《计算机应用与软件》
北大核心
2023年第7期145-150,共6页
基金
国家重点研发计划重点专项项目课题(2018YFB1005103)
国家自然科学基金项目(61673248)
山西省研究生联合培养基地人才培养项目(2018JD02)。
文摘
句子融合是为多个句子生成言简意赅、符合语法的句子,可应用到自动摘要、复述生成等自然语言处理任务。目前句子融合方法已取得一定成效,但还存在重要信息缺失、语义偏离原句等问题。该文提出基于Transformer和重要词识别的方法来缓解上述问题。该方法包括两个模块,(1)重要词识别模块:利用序列标注模型识别原句重要词;(2)句子融合模块:将重要词与原句输入到Transformer框架并利用BERT进行语义表示,然后在全连接层引入基于原句和词表获得的向量作为先验知识进行句子融合。基于NLPCC2017摘要任务集构建句子融合数据集,并进行相关实验,结果表明所提方法的性能明显优于基线系统。
关键词
句子融合
重要词
TRANSFORMER
文本生成
Keywords
Sentence fusion
Transformer
Text generation
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
《宋词赏析》中提出的几个重要词学问题
被引量:
1
2
作者
张悦
机构
北京工业职业技术学院文法学院
出处
《才智》
2016年第25期222-223,共2页
基金
沈祖棻<宋词赏析>研究
基金号:bgzyky201651
校级科研项目
文摘
至今鲜有人注意到,沈祖棻在《宋词赏析》的批评鉴赏中提出了创作与鉴赏的几大重要问题,并对这些问题做了自己的深入思考,本文为学界首次关注到这个问题,并力图全面总结与梳爬沈氏零散在书中的十二大方面重要词学问题。
关键词
《宋
词
赏析》
重要词
学问题
知人论世
画面感
分类号
I207.23 [文学—中国文学]
原文传递
题名
基于词重要性的信息检索图模型
被引量:
11
3
作者
王明文
洪欢
江爱文
左家莉
机构
江西师范大学计算机信息工程学院
出处
《中文信息学报》
CSCD
北大核心
2016年第4期134-141,共8页
基金
国家自然科学基金(61272212
61462043
+2 种基金
61462045)
江西省自然科学基金(20122BAB211032
2015BAB217014)
文摘
在信息检索建模中,确定索引词项在文档中的重要性是一项重要内容。以词袋(bag-of-word)的形式表示文档来建立检索模型的方法中大多是基于词项独立性假设,用TF和IDF的函数来计算词项的重要性,并未考虑词项之间的关系。该文采用基于词项图(graph-of-word)的文档表示形式来捕获词项间的依赖关系,提出了一种新的基于词重要性的信息检索图模型TI-IDF。根据词项图得到文档中词项的共现矩阵和词项间的概率转移矩阵,通过马尔科夫链计算方法来确定词项在文档中的重要性(Term Importance,TI),并以此替代索引过程中传统的词项频率TF。该模型具有更好的鲁棒性,我们在国际公开数据集上与传统的检索模型进行了比较。实验结果表明,该文提出的模型都要优于BM25,且在大多数情况下优于BM25的扩展模型、TW-IDF等模型。
关键词
词
项
重要
性
词
项图
检索模型
TI-IDF
Keywords
term importance
graph-of-word
retrieval model
TI-IDF
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
信息检索中的带权邻近度度量研究
被引量:
1
4
作者
薛源海
俞晓明
刘悦
关峰
程学旗
机构
中国科学院网络数据科学与技术重点实验室
中国科学院计算技术研究所
中国科学院大学
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第10期2216-2224,共9页
基金
国家自然科学基金项目(61100083)
国家"八六三"高技术研究发展计划基金项目(2012AA011003)
文摘
信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升.
关键词
带权邻近度
度量方法
BM25
查询
词
重要
性
信息检索
Keywords
weighted proximity
measure method
BM25
term significance
information retrieval
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Transformer和重要词识别的句子融合方法
谭红叶
李飞艳
《计算机应用与软件》
北大核心
2023
0
下载PDF
职称材料
2
《宋词赏析》中提出的几个重要词学问题
张悦
《才智》
2016
1
原文传递
3
基于词重要性的信息检索图模型
王明文
洪欢
江爱文
左家莉
《中文信息学报》
CSCD
北大核心
2016
11
下载PDF
职称材料
4
信息检索中的带权邻近度度量研究
薛源海
俞晓明
刘悦
关峰
程学旗
《计算机研究与发展》
EI
CSCD
北大核心
2014
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部