-
题名中文自动问答中句子相似度计算研究
被引量:5
- 1
-
-
作者
杨思春
陈家骏
-
机构
安徽工业大学计算机学院
南京大学计算机科学与技术系
-
出处
《情报学报》
CSSCI
北大核心
2008年第1期35-41,共7页
-
基金
安徽省高校省级自然科学研究项目(KJ20078245).
-
文摘
句子相似度计算是自动问答系统的重要理论基础和关键实现技术。目前,用于中文自动问答系统的句子相似度计算方法很多,由于缺乏系统的分析,给研究人员带来了较大的不便。依据所利用的特征信息,可以将这些方法分为四类,即基于关键词信息、基于语义信息、基于句法结构信息以及基于多重信息。通过对各类方法实验结果的比较,指出各自的优势和不足。同时指出,基于多重信息的方法是当前的主流方法,实现不同特征信息的最佳权重分配是该类方法今后的研究重点。另外,还提出一个有关相似度概念认识上的看法,即对于中文自动问答系统,实质上依据的是句子的相关度,而不是句子的相似度。通过本文的研究,旨在为中文自动问答领域的句子相似度计算研究提供一定的参考。
-
关键词
自然语言处理
中文自动问答
句子相似度
-
Keywords
natural language processing, Chinese automatic answering, sentence similarity
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
H146.3
[语言文字—汉语]
-
-
题名中文口语开放域问答系统中问句分析处理方法的研讨
被引量:1
- 2
-
-
作者
何晓彦
黄家琳
-
机构
北京工商大学信息工程学院
北京工商大学计算机学院
-
出处
《北京工商大学学报(自然科学版)》
CAS
2007年第6期57-61,共5页
-
文摘
就汉语语言的特点,对中文口语自动问答系统中用户问句的处理方法作了系统的分析.提出了口语问句规范化处理的方法,使得系统能够对口语表达形式多样(甚至病句),但语义相同的问句可以采用相同的分析算法.同时此法所得出的规范化问句将反馈给用户,用于用户确认,实现了人机交互.规范化问句通过主题词的方法,确定搜索的知识源,明确和缩小了搜索范围,减少了对无用信息的搜索.
-
关键词
中文口语自动问答系统
词分析问句分析
问题理解
问句的规范化
-
Keywords
Chinese question answer system
query analysis
question understanding
question pre-process
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
-