-
题名旅游自动问答系统中多任务问句分类研究
被引量:1
- 1
-
-
作者
陈千
冯子珍
王素格
郭鑫
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《计算机应用与软件》
北大核心
2024年第1期336-342,共7页
-
基金
山西省重点研发计划项目(201803D421024)
山西省应用基础研究计划项目(201901D111032,201701D221101)
国家自然科学基金项目(61502288,61403238)。
-
文摘
目前旅游产业信息化建设需要构建旅游自动问答系统,其中问句分类是问答系统的重要组成部分,传统问句类别体系角度单一,且传统分类模型对不平衡的问句数据集表现欠佳。针对这一问题,该文从问题主题和问句答案类型两个角度构建了旅游领域的问句类别体系架构,并提出多任务问句分类模型MT-Bert,在BERT上进行多任务训练,并加入自注意力机制,使用Softmax分类器,并设计了多任务融合损失函数。在山西旅游数据集的结果表明,MT-Bert在两种类别体系的微平均F1值分别为97.6%、91.7%,且避免了非平衡数据的预测失败问题,可以有效处理非平衡数据。
-
关键词
旅游问答
问句分类
分类体系
BERT
自注意力
多任务
-
Keywords
tourism question and answer(qa)
Question classification
Classification system
BRET
Self-attention
Multi-task
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名旅游自动应答语义模型分析与实践
被引量:2
- 2
-
-
作者
王彦
左春
曾炼
-
机构
中国科学院软件研究所软件工程技术研究开发中心
中国科学院大学
中科软科技股份有限公司
金童软件科技有限公司
-
出处
《计算机系统应用》
2017年第2期18-24,共7页
-
文摘
针对常见问答系统采用的以词法分析为基础的浅层语义模型难以有效挖掘用户问句深层语义的问题,本文立足于旅游问答应用领域,采用组合范畴语法对旅游问句进行句法分析,使用Lambda演算式表示问句语义,以此构建旅游领域问句的语义模型,以便于通过精确的问句语义快速查找应答结果.研究首先进行旅游领域数据采集与语料标注的准备性工作,并针对语料对旅游问句的句式句法进行分析;然后采用基于概率的组合范畴语法的监督学习过程,通过训练获得较为可靠的旅游问句语义词典;最后根据语义词典及其他相关知识,学习用户问句语义,构建旅游自动应答语义分析系统,着重于问句解析和相应的语义模型的构建.通过在评测集上的验证,这种语义解析方法在解析效果上有比较明确的提升.
-
关键词
旅游问答系统
组合范畴语法
lambda演算
语义模型
监督学习
-
Keywords
tourism qa system
combinatory categorial grammars
lambda calculus
semantic model
supervised learning
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-