期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于特定问题类别的汉语问答系统查询扩展 被引量:3
1
作者 余正涛 樊孝忠 宋丽荣 《北京理工大学学报》 EI CAS CSCD 北大核心 2005年第10期880-884,共5页
针对汉语问答系统的特点,提出一种通过统计问答对方式获得各种问题类别的关联词,并根据类别关联词进行查询扩展的方法.在计算问题和答案文本相似度时,实现了一种基于最小匹配距离的计算方法,该方法充分考虑了查询词及查询扩展词在文本... 针对汉语问答系统的特点,提出一种通过统计问答对方式获得各种问题类别的关联词,并根据类别关联词进行查询扩展的方法.在计算问题和答案文本相似度时,实现了一种基于最小匹配距离的计算方法,该方法充分考虑了查询词及查询扩展词在文本中的词频及位置分布信息.实验结果说明在汉语问答系统答案文本检索中,按照问题类别关联词进行查询扩展比未进行查询扩展在性能上有很大的改进. 展开更多
关键词 汉语问答系统 查询扩展 问题类别 类别关联词 答案文本检索 最小匹配距离
下载PDF
受限域汉语问答系统普适性理论与方法研究
2
《中国科技奖励》 2016年第7期60-60,共1页
主要完成人:余正涛、郭剑毅、毛存礼、线岩团、邹俊杰、吴则建、张宜浩 主要完成单位:昆明理工大学 该项目主要技术内容及发现点:1.提出了融合长距离依赖特征的Markov逻辑网中文命名实体识别方法和基于最大熵的领域实体关系的抽取... 主要完成人:余正涛、郭剑毅、毛存礼、线岩团、邹俊杰、吴则建、张宜浩 主要完成单位:昆明理工大学 该项目主要技术内容及发现点:1.提出了融合长距离依赖特征的Markov逻辑网中文命名实体识别方法和基于最大熵的领域实体关系的抽取方法,自动获取领域的实体及实体关系,为实现从非结构化领域文本中获取与组织领域知识提供理论与技术保障。 展开更多
关键词 汉语问答系统 普适性 MARKOV逻辑网 昆明理工大学 实体关系 抽取方法 识别方法 命名实体
下载PDF
基于无监督学习的问答模式抽取技术 被引量:9
3
作者 吴友政 赵军 徐波 《中文信息学报》 CSCD 北大核心 2007年第2期69-76,共8页
本文提出了一种基于无监督学习算法的问答模式抽取技术从互联网上抽取应用于汉语问答系统的答案模式。该算法可以避免有监督学习算法的不足,它无需用户提供<提问,答案>对作为训练集,只需用户提供每种提问类型两个或以上的提问实例... 本文提出了一种基于无监督学习算法的问答模式抽取技术从互联网上抽取应用于汉语问答系统的答案模式。该算法可以避免有监督学习算法的不足,它无需用户提供<提问,答案>对作为训练集,只需用户提供每种提问类型两个或以上的提问实例,算法即可通过Web检索、主题划分、模式提取、垂直聚类和水平聚类等步骤完成该类型提问的答案模式的学习。实验结果表明,论文提出的无监督问答模式学习方法是有效的,基于模式匹配的答案抽取技术能够较大幅度地提高汉语问答系统的性能。 展开更多
关键词 人工智能 自然语言处理 汉语问答系统 问答模式 机器学习
下载PDF
基于主题语言模型的句子检索算法 被引量:8
4
作者 吴友政 赵军 徐波 《计算机研究与发展》 EI CSCD 北大核心 2007年第2期288-295,共8页
提出了基于主题语言模型的汉语问答系统句子检索算法,该算法利用问答系统中特有的提问分类信息(即提问的答案语义信息)对句子初检结果进行主题聚类,通过AspectModel将句子所属的主题信息引入到语言模型中,从而获得对句子语言模型更精确... 提出了基于主题语言模型的汉语问答系统句子检索算法,该算法利用问答系统中特有的提问分类信息(即提问的答案语义信息)对句子初检结果进行主题聚类,通过AspectModel将句子所属的主题信息引入到语言模型中,从而获得对句子语言模型更精确的描述.对于初检结果的聚类,提出了“一个句子多个主题”和“一个句子一个主题”两种算法.相对于PLSI算法的主题空间维度,提出的主题空间具有更加明确的物理意义;由于不需要迭代运算,运行速度更具优势.对比实验的结果表明,与标准语言模型方法相比,基于主题语言模型的方法可以明显地提高汉语问答系统句子检索模块的性能. 展开更多
关键词 汉语问答系统 语言模型 句子检索
下载PDF
限定语义距离的关键词同义扩展及精简 被引量:2
5
作者 段利国 陈俊杰 《计算机工程与应用》 CSCD 北大核心 2011年第23期13-16,24,共5页
针对现存的单纯借助同义词词林或知识词典扩展关键词方法中存在噪音数据和计算量大的问题,提出了先扩展后精简的方法,即先利用同义词词林进行同义扩展,再利用知网义原树计算扩展词之间的语义距离,依据语义距离剔除相似度较小的噪音数据... 针对现存的单纯借助同义词词林或知识词典扩展关键词方法中存在噪音数据和计算量大的问题,提出了先扩展后精简的方法,即先利用同义词词林进行同义扩展,再利用知网义原树计算扩展词之间的语义距离,依据语义距离剔除相似度较小的噪音数据,实现关键词集合的精简。实验表明,当词语相似度阈值取0.8时,精简比例高达46.9%,精简后的关键词集合有效剔除了噪音数据,兼顾了信息检索的召回率和准确率,表现出良好的综合性能。 展开更多
关键词 汉语问答系统 关键词扩展 义原树 关键词集合精简
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部