期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
Information Extraction Based on Multi-turn Question Answering for Analyzing Korean Research Trends
1
作者 Seongung Jo Heung-Seon Oh +2 位作者 Sanghun Im Gibaeg Kim Seonho Kim 《Computers, Materials & Continua》 SCIE EI 2023年第2期2967-2980,共14页
Analyzing Research and Development(R&D)trends is important because it can influence future decisions regarding R&D direction.In typical trend analysis,topic or technology taxonomies are employed to compute the... Analyzing Research and Development(R&D)trends is important because it can influence future decisions regarding R&D direction.In typical trend analysis,topic or technology taxonomies are employed to compute the popularities of the topics or codes over time.Although it is simple and effective,the taxonomies are difficult to manage because new technologies are introduced rapidly.Therefore,recent studies exploit deep learning to extract pre-defined targets such as problems and solutions.Based on the recent advances in question answering(QA)using deep learning,we adopt a multi-turn QA model to extract problems and solutions from Korean R&D reports.With the previous research,we use the reports directly and analyze the difficulties in handling them using QA style on Information Extraction(IE)for sentence-level benchmark dataset.After investigating the characteristics of Korean R&D,we propose a model to deal with multiple and repeated appearances of targets in the reports.Accordingly,we propose a model that includes an algorithm with two novel modules and a prompt.A newly proposed methodology focuses on reformulating a question without a static template or pre-defined knowledge.We show the effectiveness of the proposed model using a Korean R&D report dataset that we constructed and presented an in-depth analysis of the benefits of the multi-turn QA model. 展开更多
关键词 Natural language processing information extraction question answering multi-turn Korean research trends
下载PDF
Extracting exact answers from large-scale corpus based on hybrid strategy
2
作者 LI Peng WANG Xiao-long WANG Bao-xun 《通讯和计算机(中英文版)》 2007年第8期44-52,共9页
关键词 问题解答 解答抽取 大规模集合 系统相似性模型 分层取样 回归模型 混合策略
下载PDF
信息茧房视域下在线问答社区用户健康信息需求对比研究
3
作者 邹筱 刘垣春 周欢 《衡阳师范学院学报》 2024年第3期59-67,共9页
信息获取途径的固化是促使信息茧房形成的重要原因之一,本研究旨在让社区了解用户的健康信息需求热点,并为社区信息治理和社区间信息整合提供参考,减少信息茧房对网络信息空间治理带来的负面影响。借助主题词提取和文本共现网络构建等... 信息获取途径的固化是促使信息茧房形成的重要原因之一,本研究旨在让社区了解用户的健康信息需求热点,并为社区信息治理和社区间信息整合提供参考,减少信息茧房对网络信息空间治理带来的负面影响。借助主题词提取和文本共现网络构建等自然语言处理技术,利用不同类型在线问答社区中真实的用户提问数据,分析用户健康信息需求热点,并对其需求特征的异同进行对比分析。实验结果表明:一方面,综合型与垂直型在线问答社区对于疾病的基础病理知识、药物信息以及饮食方面的关注度较高,且均具有适老化需求。另一方面,综合型在线问答社区对于疾病的预防关注度较高,而垂直型在线问答社区更加关注于疾病治疗,综合型在线问答社区用户存在情感支持需求,但总体上国内在线问答社区的情感支持需求均不高。 展开更多
关键词 信息茧房 在线健康问答社区 健康信息需求 主题提取 文本共现网络
下载PDF
基于大语言模型的体检总检结论自动生成研究
4
作者 郑路程 李旭涛 徐敏 《小型微型计算机系统》 CSCD 北大核心 2024年第11期2569-2575,共7页
本文研究了基于大语言模型自动生成体检总检结论的方法.与常规文本摘要生成任务不同,体检总检结论的生成特别关注体检异常检查结果,要求生成结论不仅准确,还需遵循医学领域的专业知识和标准.为此,本文基于经医疗知识问答数据微调的大型... 本文研究了基于大语言模型自动生成体检总检结论的方法.与常规文本摘要生成任务不同,体检总检结论的生成特别关注体检异常检查结果,要求生成结论不仅准确,还需遵循医学领域的专业知识和标准.为此,本文基于经医疗知识问答数据微调的大型预训练语言模型,提出了一个体检总检结论自动生成方法.该方法包括两个关键模块:1)异常信息抽取模块,利用少量标注数据增强模型在抽取科室小结中异常检查结果识别能力;2)结论项排序模块,使得生成内容符合体检总检结论的顺序规范.在真实体检数据集上的实验表明,这两个核心模块有效提升了总检结论生成质量.本文为医疗文档自动生成技术提供了新思路,展现了大语言模型在医疗人工智能应用中的前瞻性. 展开更多
关键词 体检科室小结 体检总检结论 大语言模型 异常文本抽取 结论项重排 医疗问答
下载PDF
问答模式下结合属性语义的实体属性抽取研究
5
作者 常露予 张晓滨 《计算机技术与发展》 2024年第4期174-179,共6页
实体属性抽取任务中常面临属性标签过多时模型存在爆炸风险的问题,且目前大多数属性抽取模型对文本均分配一致的注意力因子,未将上下文的变化考虑在内。为解决上述问题,提出一种基于问答模式的结合属性语义的实体属性抽取方法。该方法... 实体属性抽取任务中常面临属性标签过多时模型存在爆炸风险的问题,且目前大多数属性抽取模型对文本均分配一致的注意力因子,未将上下文的变化考虑在内。为解决上述问题,提出一种基于问答模式的结合属性语义的实体属性抽取方法。该方法的要点在于,将文本看作上下文,把属性视为查询,从上下文中提取到的答案等同于期望的属性值。文中对文本和属性的语义表示进行建模,并提出一个动态注意力机制用于捕捉二者间的语义交互、实现信息融合,同时自适应地控制属性信息融入文本向量的程度。为了验证该方法的有效性,将模型与目前广泛应用的BiLSTM模型、BiLSTM-CRF模型、OpenTag模型和Open Tagging模型在包含大量属性标签的数据集AE-110K、AE-650K上进行对比实验,结果表明,模型在结合属性语义信息且采用动态Attention的条件下,其预测准确度、召回率和F1值更高。 展开更多
关键词 问答模式 实体属性抽取 动态注意力 语义交互 信息融合
下载PDF
自动问答综述 被引量:165
6
作者 郑实福 刘挺 +1 位作者 秦兵 李生 《中文信息学报》 CSCD 北大核心 2002年第6期46-52,共7页
自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取... 自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取。本文分别介绍了这三个主要组成部分的主要功能和常用的方法。最后还介绍了自动问答系统的评价问题。 展开更多
关键词 自动问答 问题分类 信息检索 答案抽取 自然语言处理 问题分析
下载PDF
基于潜在语义分析的汉语问答系统答案提取 被引量:44
7
作者 余正涛 樊孝忠 +1 位作者 郭剑毅 耿增民 《计算机学报》 EI CSCD 北大核心 2006年第10期1889-1893,共5页
为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,... 为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词-句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值达到了0.47,明显优于空间向量模型.结果说明该方法具有很好的效果. 展开更多
关键词 问答系统 答案提取 相似度 向量空间模型 潜在语义分析
下载PDF
基于句法结构分析的中文问题分类 被引量:82
8
作者 文勖 张宇 +1 位作者 刘挺 马金山 《中文信息学报》 CSCD 北大核心 2006年第2期33-39,共7页
问题分类是问答系统中重要的组成部分,问题分类结果的好坏直接影响问答系统的质量。本文提出了一种用于问题分类的特征提取的新方法,该方法主要使用句法分析的结果,提取问题的主干和疑问词及其附属成分作为分类的特征,此方法大幅度地减... 问题分类是问答系统中重要的组成部分,问题分类结果的好坏直接影响问答系统的质量。本文提出了一种用于问题分类的特征提取的新方法,该方法主要使用句法分析的结果,提取问题的主干和疑问词及其附属成分作为分类的特征,此方法大幅度地减少了噪音,突出了问题分类的主要特征,利用贝叶斯分类器分类,有效地提高了问题分类的精度。实验结果证明了该方法的有效性,大类和小类的分类精度分别达到了86.62%和71.92%,取得了较好的效果。 展开更多
关键词 计算机应用 中文信息处理 问答系统 问题分类 特征提取 句法分析
下载PDF
问答式检索技术及评测研究综述 被引量:48
9
作者 吴友政 赵军 +1 位作者 段湘煜 徐波 《中文信息学报》 CSCD 北大核心 2005年第3期1-13,共13页
问答式检索系统(简称问答系统)是集自然语言处理技术和信息检索技术于一身的新一代搜索引擎。它的出现旨在提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。经过这几年的发展,问答系统已经成为自然语言处理领域和信息检索领域... 问答式检索系统(简称问答系统)是集自然语言处理技术和信息检索技术于一身的新一代搜索引擎。它的出现旨在提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。经过这几年的发展,问答系统已经成为自然语言处理领域和信息检索领域的一个重要分支和新兴的研究热点,其“通过系统化、大规模地定量评测推动研究向前发展”的发展轨迹,以及某些成功的启示,如基于字符表层的文本分析技术(模板技术)的有效性,快速、浅层自然语言处理技术的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾问答系统研究的历史,总结问答技术的研究现状,将有助于这方面工作向前发展。 展开更多
关键词 人工智能 自然语言处理 综述 问答系统 问答评测 信息抽取 信息检索
下载PDF
基于网络的中文问答系统及信息抽取算法研究 被引量:46
10
作者 崔桓 蔡东风 苗雪雷 《中文信息学报》 CSCD 北大核心 2004年第3期24-31,共8页
问答系统 (QuestionAnsweringSystem)能用准确、简洁的答案回答用户用自然语言提出的问题。目前多数问答系统利用大规模文本作为抽取答案的知识库 ,而网络上丰富的资源为问答系统提供了另外一种良好的知识来源 ,对于回答简短、基于事实... 问答系统 (QuestionAnsweringSystem)能用准确、简洁的答案回答用户用自然语言提出的问题。目前多数问答系统利用大规模文本作为抽取答案的知识库 ,而网络上丰富的资源为问答系统提供了另外一种良好的知识来源 ,对于回答简短、基于事实的问题非常有效。本文对基于网络的问答系统研究现状作了简要的介绍 ,分析了网络信息的特点。我们提出了一种基于语句相似度计算的答案抽取方法 ,在此基础上实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源 ,从而节省了下载、分析网络源文本的时间。实验结果表明该系统对人名、数量及时间类型的问题效果显著 ,对测试问题集的MRR值达到 0 5 1。 展开更多
关键词 计算机应用 中文信息处理 问答系统 句子相似度 信息抽取
下载PDF
汉语问答系统答案提取方法研究 被引量:8
11
作者 余正涛 樊孝忠 +1 位作者 宋丽哲 高盛祥 《计算机工程》 EI CAS CSCD 北大核心 2006年第3期183-185,共3页
答案提取是问答系统的关键部分,文章介绍了汉语问答系统的基本结构及其实现过程,以问题和答案中关键词的词频统计特性为基础,进一步考虑问题和句子中关键词位置分布信息,提出了一种结合向量空间模型(VSM)和关键词最小匹配距离的问题和... 答案提取是问答系统的关键部分,文章介绍了汉语问答系统的基本结构及其实现过程,以问题和答案中关键词的词频统计特性为基础,进一步考虑问题和句子中关键词位置分布信息,提出了一种结合向量空间模型(VSM)和关键词最小匹配距离的问题和句子相似度的计算方法。并以相似度为基础,结合问题类别,对汉语基于事实的简单陈述问题进行了答案句子提取实验,结果表明该方法有较好的效果。 展开更多
关键词 问答系统 答案提取 相似度 向量空间模型 最小匹配距离
下载PDF
问答系统研究综述 被引量:59
12
作者 毛先领 李晓明 《计算机科学与探索》 CSCD 2012年第3期193-207,共15页
近年来,问答系统被大量广泛地研究。问答系统的目标是给定一个问题,能够得到简短、精确的答案。根据处理数据的不同,将问答系统分为三类:基于结构化数据的问答系统、基于自由文本的问答系统、基于问题答案对的问答系统。对这三大类系统... 近年来,问答系统被大量广泛地研究。问答系统的目标是给定一个问题,能够得到简短、精确的答案。根据处理数据的不同,将问答系统分为三类:基于结构化数据的问答系统、基于自由文本的问答系统、基于问题答案对的问答系统。对这三大类系统的特点、面临的问题和相关的研究分别进行了叙述和总结。最后,讨论了问答系统未来可能的研究方向。 展开更多
关键词 问答系统(QA) 传统问答系统(TQA) 基于社区的问答系统(CQA) 信息检索 答案抽取
下载PDF
基于浅层语义树核的阅读理解答案句抽取 被引量:14
13
作者 张志昌 张宇 +1 位作者 刘挺 李生 《中文信息学报》 CSCD 北大核心 2008年第1期80-86,共7页
阅读理解系统是通过对一篇自然语言文本的分析理解,对用户根据该文本所提的问题,自动抽取或者生成答案。本文提出一种利用浅层语义信息的英文阅读理解抽取方法,首先将问题和所有候选句的语义角色标注结果表示成树状结构,用树核(tree ker... 阅读理解系统是通过对一篇自然语言文本的分析理解,对用户根据该文本所提的问题,自动抽取或者生成答案。本文提出一种利用浅层语义信息的英文阅读理解抽取方法,首先将问题和所有候选句的语义角色标注结果表示成树状结构,用树核(tree kernel)的方法计算问题和每个候选句之间的语义结构相似度,将该相似度值和词袋方法获得的词匹配数融合在一起,选择具有最高分值的候选句作为最终的答案句。在Remedia测试语料上,本文方法取得43.3%的HumSent准确率。 展开更多
关键词 计算机应用 中文信息处理 阅读理解 答案句抽取 浅层语义 树核
下载PDF
基于Web的问答系统综述 被引量:19
14
作者 李舟军 李水华 《计算机科学》 CSCD 北大核心 2017年第6期1-7,42,共8页
微软小冰引发了问答系统的新一轮研究热潮。作为一种新型的信息检索方式,问答系统能直接以自然语言与用户进行人性化的交互。而基于Web的问答系统能通过搜索引擎获取开放的互联网上的各种相关信息,并将以自然语言形式表述的准确答案返... 微软小冰引发了问答系统的新一轮研究热潮。作为一种新型的信息检索方式,问答系统能直接以自然语言与用户进行人性化的交互。而基于Web的问答系统能通过搜索引擎获取开放的互联网上的各种相关信息,并将以自然语言形式表述的准确答案返回给用户,因此此类系统同时具有搜索引擎和问答系统的优点。首先,对基于Web的问答系统的研究背景与发展历史进行了概述;然后,详细介绍了基于Web的问答系统的架构及其问题分析、信息检索、答案抽取这三大关键技术的研究进展;在此基础上,分析了基于Web的问答系统所面临的问题;最后,对基于Web的问答系统的未来发展趋势进行了展望。 展开更多
关键词 问答系统 基于Web的问答系统 问题分析 信息检索 答案抽取
下载PDF
基于网络的中文问答系统的研究 被引量:6
15
作者 王宇 战学刚 蔡建山 《计算机工程与应用》 CSCD 北大核心 2006年第7期162-165,共4页
文章设计并实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源,从而节省了下载、分析网络源文本的时间,提出了一种针对该系统的信息抽取算法,并采用一种基于语句相似度计算的答案抽... 文章设计并实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源,从而节省了下载、分析网络源文本的时间,提出了一种针对该系统的信息抽取算法,并采用一种基于语句相似度计算的答案抽取算法并且进行了改进。实验结果表明该系统对人名及时间类型的问题效果显著。对测试问题集的MRR值达到0.47。 展开更多
关键词 问答系统 句子相似度 信息抽取 答案抽取
下载PDF
自动问答系统研究综述 被引量:21
16
作者 刘里 曾庆田 《山东科技大学学报(自然科学版)》 CAS 2007年第4期73-76,共4页
自动问答系统是自然语言处理领域中一个非常热门的研究方向,它综合运用了多种自然语言处理技术。本文综述了国内外自动问答技术的发展现状,对系统三个主要组成部分:问题分析、信息检索和答案抽取进行了深入的分析,通过比较,得出了自动... 自动问答系统是自然语言处理领域中一个非常热门的研究方向,它综合运用了多种自然语言处理技术。本文综述了国内外自动问答技术的发展现状,对系统三个主要组成部分:问题分析、信息检索和答案抽取进行了深入的分析,通过比较,得出了自动问答系统运用各类技术之间的优势与不足。在此基础上,提出了自动问答系统的发展方向。 展开更多
关键词 自动问答系统 问题处理 信息检索 答案抽取
下载PDF
面向问答的数值信息抽取 被引量:3
17
作者 张桂平 张宁 白宇 《郑州大学学报(理学版)》 CAS 北大核心 2018年第4期21-25,30,共6页
数值信息作为数据的一种直观表达方式,能够真实、有效地表达数据的量化含义.完整的数值信息要素包含有数字,数字的量化对象,如:主体及其属性,以及时空约束条件.对文本中蕴含的数值信息进行有效识别和抽取,并以问答的形式反馈给用户是大... 数值信息作为数据的一种直观表达方式,能够真实、有效地表达数据的量化含义.完整的数值信息要素包含有数字,数字的量化对象,如:主体及其属性,以及时空约束条件.对文本中蕴含的数值信息进行有效识别和抽取,并以问答的形式反馈给用户是大数据挖掘的重要意义,越来越受到学术界和产业界的关注.提出了一种基于数值模板结合条件随机场的数值信息抽取方法,该方法利用数值相关知识来制定数值信息抽取模板,对文本模式匹配,并使用条件随机场修补模板的局限性.实验结果的准确率、召回率和F值分别为0.847、0.665和0.745. 展开更多
关键词 数值信息抽取 数值模板 问答
下载PDF
基于答案模式和语义特征融合的答案抽取方法 被引量:3
18
作者 田卫东 祖永亮 《计算机工程与应用》 CSCD 北大核心 2011年第13期127-130,共4页
答案抽取是问答系统的关键技术。根据对问题-答案的分析可知,它们之间不仅存在语义上的相似性,而且还有句法上的关联性。提出了一种基于问题-答案之间句法模式和句子语义二元特征融合的答案抽取方法。通过对不同的特征赋予不同的权值来... 答案抽取是问答系统的关键技术。根据对问题-答案的分析可知,它们之间不仅存在语义上的相似性,而且还有句法上的关联性。提出了一种基于问题-答案之间句法模式和句子语义二元特征融合的答案抽取方法。通过对不同的特征赋予不同的权值来调节各特征对答案抽取准确率计算的贡献。与其他方法相比,描述答案的信息更加全面,答案抽取更加准确。 展开更多
关键词 答案抽取 问答系统 特征融合 句义相似 模式匹配
下载PDF
综合句法结构及语义相似度的问题推荐技术 被引量:7
19
作者 段利国 陈俊杰 《计算机科学》 CSCD 北大核心 2012年第1期203-206,共4页
针对因特网上的大规模问答对资源提出一种新的应用,即在问答系统中加入基于百度知道平台构建的大规模问答对库,通过相似度计算,把库中最相似的问题推荐给用户。实验下载网页10500个,成功提取问答对4687个,运用关键词的TF/IDF、树核函数... 针对因特网上的大规模问答对资源提出一种新的应用,即在问答系统中加入基于百度知道平台构建的大规模问答对库,通过相似度计算,把库中最相似的问题推荐给用户。实验下载网页10500个,成功提取问答对4687个,运用关键词的TF/IDF、树核函数的句法匹配及问句的语义距离3种方法中的一种、两种和三种进行实验,分别获得79.44%,81.67%和88.33%的准确率。结果表明,综合运用多种方法查找相似问题,效果更好。 展开更多
关键词 问答系统 信息抽取 问题推荐 语义距离 树核函数
下载PDF
农业知识问答系统句子相似度算法研究 被引量:2
20
作者 卜伟琼 方逵 陈益能 《农业网络信息》 2012年第10期17-20,共4页
在农业领域中,农业知识问答系统以其能接受自然语言检索和直接返回精确答案而成为一种新的信息检索技术。针对农业领域,提出了一种多重信息融合的句子相似度算法。该算法结合了句子的结构信息、词法信息和语义信息,同时考虑农业知识问... 在农业领域中,农业知识问答系统以其能接受自然语言检索和直接返回精确答案而成为一种新的信息检索技术。针对农业领域,提出了一种多重信息融合的句子相似度算法。该算法结合了句子的结构信息、词法信息和语义信息,同时考虑农业知识问答系统中问句的特征,使其更适合应用在农业特定领域中,并通过实验验证了算法的可行性和准确性。 展开更多
关键词 农业知识 问答系统 句子相似度 多重信息
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部