-
题名一种基于弱监督学习的论坛帖子对话行为分类方法
- 1
-
-
作者
孙承杰
林磊
刘秉权
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2014年第6期156-161,168,共7页
-
基金
国家自然科学基金(61100094
61300114)
-
文摘
论坛帖子对话行为分类可以明确每个帖子在当前线索中的角色,有助于重构论坛线索中的对话关系,提高论坛信息检索的效果。该文提出了一种基于弱监督学习的论坛帖子对话行为分类方法,把帖子的对话行为分类作为线索的序列标注问题来解决。该方法的特点是只要指定合理的特征约束,就可以训练对话行为分类模型。方法在CNET和edX数据集上的分类精确率分别达到75.6%和60.7%,优于有监督的条件随机域方法。
-
关键词
弱监督学习
特征约束
对话行为分类
论坛线索结构分析
-
Keywords
weakly supervised learning
feature constrains
dialogue act classification
forum thread structure analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名对话行为信息在口语翻译中的应用
被引量:3
- 2
-
-
作者
周可艳
宗成庆
-
机构
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2010年第6期57-63,共7页
-
基金
国家自然科学基金资助项目(60975053)
国家支撑计划资助项目(2006BAH03B02)
-
文摘
在口语翻译中,如何融入语义及语用信息一直是目前研究的难点之一。对话行为作为浅层话语结构描述的特征,近年来陆续应用于不同类型的翻译系统中。该文在介绍对话行为理论和口语标注语料的基础上,以基于短语的统计翻译系统为应用对象,提出了对话行为应用于翻译过程的三种方式。该方法通过对对话行为的自动分类,使训练语料—测试语料、开发集—测试集、源语言—目标语言的一致性得到提高,提高了翻译系统的性能,使最终的翻译结果可以更准确地反映源语言所要表达的对话意图。在汉英口语翻译评测数据上的实验证明,对话行为信息的加入使翻译系统的性能得到了有效的提高。
-
关键词
对话行为
口语翻译
对话行为分类
-
Keywords
dialog act
spoken language translation
dialog act classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-