期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
融合多粒度抽取式特征的关键词生成
1
作者 甄田歌 宋明阳 景丽萍 《计算机科学》 CSCD 北大核心 2023年第4期181-187,共7页
关键词是概括给定文本核心主题及关键内容的一组短语。在信息过载日益严重的今天,从给定的大量文本信息中预测出具有其中心思想的关键词至关重要。因此,关键词预测作为自然语言处理的基本任务之一,受到越来越多研究者的关注。其对应方... 关键词是概括给定文本核心主题及关键内容的一组短语。在信息过载日益严重的今天,从给定的大量文本信息中预测出具有其中心思想的关键词至关重要。因此,关键词预测作为自然语言处理的基本任务之一,受到越来越多研究者的关注。其对应方法主要包括两类:关键词抽取和关键词生成。关键词抽取是从给定文本中快速、准确地抽取文中出现过的显著性短语作为关键词。与关键词抽取不同,关键词生成既能预测出现在给定文本中的关键词,也能预测未出现在给定文本中的关键词。总而言之,这两类方法各有优劣。然而,现有的关键词生成工作大多忽视了抽取式特征可能为关键词生成模型带来的潜在收益。抽取式特征能指明原文本的重要片段,对于模型学习原文本的深层语义表示起到重要作用。因此,结合抽取式和生成式方法的优势,提出了一种新的融合多粒度抽取式特征的关键词生成模型(incorporating Multi-Granularity Extractive features for keyphrase generation,MGE-Net)。在一系列公开数据集上的实验结果表明,和近年来的关键词生成模型相比,所提模型在大多数评价指标上取得了显著的性能提升。 展开更多
关键词 自然语言处理 序列到序列 关键词生成 抽取式特征 多任务学习
下载PDF
自适应短文本关键词生成模型 被引量:1
2
作者 王永剑 孙亚茹 杨莹 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第2期199-208,共10页
关键词抽取对文本处理影响较大,其识别的准确度及流畅程度是任务的关键。为有效缓解短文本关键词提取过程中词划分不准确、关键词与文本主题不匹配、多语言混合等难题,提出了一种基于图到序列学习模型的自适应短文本关键词生成模型ADGC... 关键词抽取对文本处理影响较大,其识别的准确度及流畅程度是任务的关键。为有效缓解短文本关键词提取过程中词划分不准确、关键词与文本主题不匹配、多语言混合等难题,提出了一种基于图到序列学习模型的自适应短文本关键词生成模型ADGCN。模型采用图神经网络与注意力机制相结合的方式作为对文本信息特征提取的编码框架,针对词的位置特征和语境特征编码,解决了短文本结构不规律和词之间存在关联复杂信息的问题。同时采用了一种线性解码方案,生成了可解释的关键词。在解决问题的过程中,从某社交平台收集并公布了一个标签数据集,其包括社交平台发文文本和话题标签。实验中,从用户需求角度出发对模型结果的相关性、信息量、连贯性进行评估和分析,所提模型不仅可以生成符合短文本主题的关键词,还可以有效缓解数据扰动对模型的影响。所提模型在公开数据集KP20k上仍表现良好,具有较好的可移植性. 展开更多
关键词 关键词提取 关键词生成 图神经网络 注意力机制 主题模型
下载PDF
多特征融合的越南语关键词生成方法
3
作者 陈瑞清 高盛祥 +3 位作者 余正涛 张迎晨 张磊 杨舰 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第1期23-33,共11页
越南语属于低资源语种,高质量关键词新闻数据稀缺,为了解决样本不足条件下生成越南语新闻关键词准确性不高的问题,提出了一种多特征融合的越南语关键词生成模型,拟提升生成的越南语关键词与越南语新闻文档的相关性.首先,将越南语新闻实... 越南语属于低资源语种,高质量关键词新闻数据稀缺,为了解决样本不足条件下生成越南语新闻关键词准确性不高的问题,提出了一种多特征融合的越南语关键词生成模型,拟提升生成的越南语关键词与越南语新闻文档的相关性.首先,将越南语新闻实体、词性、词汇位置特征与词向量拼接,使输入模型的词向量包含更多维度的语义信息;其次,利用双向注意力机制捕获上下文与新闻标题的依赖关系,增强标题在关键词生成中的指导作用;最后,结合复制机制生成越南语关键词,从而提高关键词的语义相关性.在构建的越南语新闻关键词数据集上进行实验,结果表明融合多特征的关键词生成模型能在越南语训练样本有限的条件下生成高质量关键词,F1@10、R@50分数比TG-Net分别提升了13.2%和17.1%. 展开更多
关键词 多特征 越南语 关键词生成 双向注意力机制 词向量
下载PDF
基于深度学习的关键词生成研究综述 被引量:6
4
作者 于强 林民 李艳玲 《计算机工程与应用》 CSCD 北大核心 2022年第14期27-39,共13页
关键词生成是自然语言处理中一项经典但具有挑战性的任务,需要从文档中自动生成一组具有代表性和特征性的词语。基于深度学习的序列到序列模型在这项任务中取得了显著的效果,弥补了以往关键词抽取存在的一个严重缺陷:无法产生不存在于... 关键词生成是自然语言处理中一项经典但具有挑战性的任务,需要从文档中自动生成一组具有代表性和特征性的词语。基于深度学习的序列到序列模型在这项任务中取得了显著的效果,弥补了以往关键词抽取存在的一个严重缺陷:无法产生不存在于原文中的关键词。由于其产生的结果更切合实际,关键词生成方法逐渐超越了以往的抽取方法,成为了关键词提取任务的主流方法。介绍了关键词提取的发展历程以及关键词生成任务的主要数据集,对基础设计采用序列到序列模型的关键词生成方法进行了分类梳理,分析其原理和优缺点。概述了关键词生成任务的评价方法,并对其未来研究重点进行了展望。 展开更多
关键词 关键词生成 深度神经网络 Seq2Seq 注意力机制
下载PDF
特征驱动的关键词提取算法综述 被引量:36
5
作者 常耀成 张宇翔 +2 位作者 王红 万怀宇 肖春景 《软件学报》 EI CSCD 北大核心 2018年第7期2046-2070,共25页
面向文本的关键词自动提取一直以来是自然语言处理领域的一个关键基础问题和研究热点.特别是,随着当前对文本数据应用需求的不断增加,使得关键词提取技术进一步得到研究者的广泛关注.尽管近年来关键词提取技术得到长足的发展,但提取结... 面向文本的关键词自动提取一直以来是自然语言处理领域的一个关键基础问题和研究热点.特别是,随着当前对文本数据应用需求的不断增加,使得关键词提取技术进一步得到研究者的广泛关注.尽管近年来关键词提取技术得到长足的发展,但提取结果目前还远未取得令人满意的效果.为了促进关键词提取问题的解决,对近年来国内、外学者在该研究领域取得的成果进行了系统总结,具体包括候选关键词生成、特征工程和关键词提取3个主要步骤,并对未来可能的研究方向进行了探讨和展望.不同于围绕提取方法进行总结的综述文献,主要围绕着各种方法使用的特征信息归纳总结现有成果,这种从特征驱动的视角考察现有研究成果的方式有助于综合利用现有特征或提出新特征,进而提出更有效的关键词提取方法. 展开更多
关键词 关键词提取 候选关键词生成 特征 有监督方法 图方法
下载PDF
关键词提取研究综述 被引量:37
6
作者 胡少虎 张颖怡 章成志 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第3期45-59,共15页
【目的】对关键词提取研究的主要方法、相关特征以及评价方法进行总结梳理,为后续的关键词提取研究提供借鉴。【文献范围】以"Keyword Extraction"、"Keyword Generation"、"Keyphrase Extraction"、&quo... 【目的】对关键词提取研究的主要方法、相关特征以及评价方法进行总结梳理,为后续的关键词提取研究提供借鉴。【文献范围】以"Keyword Extraction"、"Keyword Generation"、"Keyphrase Extraction"、"Keyphrase Generation"、"关键词抽取"、"关键词生成"等检索式在Web of Science、DBLP、Engineering Index、Google Scholar、CNKI和万方等数据库进行检索,结合个人积累与文献溯源得到代表性文献89篇。【方法】梳理关键词提取的发展脉络,从研究方法、相关特征与评价方法三个主要方面对关键词提取的相关研究进行深入分析与总结。【结果】关键词提取方法随着机器学习技术的发展,逐步从特征驱动的模型转向数据驱动的模型,并面临数据标注、评价规范等问题。【局限】更为关注关键词提取研究中主流的方法。【结论】本文通过对关键词提取方法,尤其是关键词生成方法进行总结,阐明了关键词提取方法的研究重心从特征转向数据的趋势与原因,并指出现有关键词提取评价体系所存在的缺陷。 展开更多
关键词 提取 关键词抽取 关键词生成
原文传递
人工智能在电视新闻节目监管中的应用 被引量:1
7
作者 蒋晓宋 《电视技术》 2022年第12期219-221,共3页
以湖南省广播电视监管系统为例,介绍大数据、人工智能等技术在电视新闻节目监管方面的一些应用,实现在海量节目数据中进行检索、分类统计、报表,自动生成监管简报要素等,有效地提高广播电视的监管效能,节省人力物力资源,具有积极的现实... 以湖南省广播电视监管系统为例,介绍大数据、人工智能等技术在电视新闻节目监管方面的一些应用,实现在海量节目数据中进行检索、分类统计、报表,自动生成监管简报要素等,有效地提高广播电视的监管效能,节省人力物力资源,具有积极的现实意义。 展开更多
关键词 人工智能 新闻节目 监管 视频拆条 关键词生成
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部