-
题名汉语日常会话的对话行为分析标注研究
被引量:4
- 1
-
-
作者
周强
-
机构
清华大学信息技术研究院语音语言技术中心清华信息科学与技术国家实验室
-
出处
《中文信息学报》
CSCD
北大核心
2017年第6期75-82,共8页
-
基金
国家自然科学基金(61433018
61373075)
-
文摘
对话行为分析是进行更深入的对话理解模型探索的合适切入点。该文综合前人研究成果,设计了一套针对汉语日常会话的对话行为标注体系。引入主客观阐述和正反向反应子类,加强对话行为依存对和连贯修辞对的结构描述,同时引入话题线索分析机制,有效组织会话中的话题变化趋势。基于500个日常会话片段进行的对话行为标注实验中显示出了90%左右的双人独立标注宏一致率,表明目前的对话行为标记集设计具有良好的可操作性,可以适应汉语日常会话的行为功能模式描述需求。
-
关键词
会话分析
对话行为标注
话题线索
-
Keywords
conversation analysis
dialog act annotation
topic thread
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语语篇的连贯性标注困难度分析研究
被引量:3
- 2
-
-
作者
魏天珂
吕学强
周强
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
清华大学信息技术研究院语音与语言技术中心清华信息科学与技术国家实验室(筹)
-
出处
《计算机应用研究》
CSCD
北大核心
2018年第10期2969-2974,共6页
-
基金
国家"973"计划资助项目(2013CB329304)
国家自然科学基金资助项目(61433018
+7 种基金
61373075
61411130162
61271304
61671070)
北京成像技术高精尖创新中心资助项目(BAICIT-2016003)
国家社会科学基金重大资助项目(14@ZH036
15ZDB017)
国家语委重大课题资助项目(ZDA125-26)
-
文摘
在人工标注语篇句子连贯性时,句群的划分成为最大的难点,句群内部句间关系的复杂性也增加了篇章标注的困难度。为了识别语篇标注的困难度,从多角度总结了句群边界以及类别的分布特点,分析了句群内部句间的各种连接关系,提出了一种基于人工标注的语篇困难度识别模型,并利用双人标注信息的差异性来验证语篇困难度识别方法的有效性与准确性。数据表明,该模型可以较好地区分不同体裁新闻类语篇的标注难度,为相关语篇内容的分析理解打下了良好的基础。
-
关键词
句群识别
语篇连贯性
语篇标注困难度
-
Keywords
sentence group recognition
text coherence
text annotation difficulty
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-