-
题名基于语言模型的中文话头自足句识别方法
- 1
-
-
作者
张禹尧
蒋玉茹
毛腾
张仰森
-
机构
北京信息科技大学智能信息处理研究所
-
出处
《计算机应用研究》
CSCD
北大核心
2021年第2期386-390,共5页
-
基金
国家自然科学基金资助项目(61602044,61772081)
促进高校内涵发展—研究生科技创新项目(5121911044)。
-
文摘
根据话头自足句理论进行标点句的话头自足句识别任务,探究语言模型在该任务中的应用效果,进一步将该任务划分为单个标点句的话头自足句识别和标点句序列的话头自足句识别。在单个标点句的话头自足句识别任务中,对该任务在形式上进行了完整的定义,将其形式化为机器阅读理解任务。从结果来看,在《围城》语料上取得了83.46%的准确率,在"鱼类百科"语料上的准确率达到91.21%。在标点句序列的话头自足句识别任务中,利用单个标点句的话头自足句识别任务中训练好的模型,以流水线的方式进行标点句序列的话头自足句识别,在"鱼类百科"语料上的准确率达到82.03%。实验结果表明,提出的方法能够有效地提高中文话头自足句识别的准确率。
-
关键词
话头自足句
语言模型
标点句
机器阅读理解
-
Keywords
NT(naming-telling)clause
language model
punctuation sentences
machine reading comprehension
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-