期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于统计抽词和格律的全宋词切分语料库建立 被引量:11
1
作者 苏劲松 周昌乐 李翼鸿 《中文信息学报》 CSCD 北大核心 2007年第2期52-57,共6页
全宋词切分语料库的建立是计算机研究宋词的基础。本文对宋词中“词”的界定提出了自己的看法,并在综合考虑统计抽词方法和基于诗词格律切分方法各自优点的基础上,提出建立全宋词切分语料库的新方法。我们首先通过统计抽词来抽取结合程... 全宋词切分语料库的建立是计算机研究宋词的基础。本文对宋词中“词”的界定提出了自己的看法,并在综合考虑统计抽词方法和基于诗词格律切分方法各自优点的基础上,提出建立全宋词切分语料库的新方法。我们首先通过统计抽词来抽取结合程度较强的二字词,并结合相关资源建立词表;在此基础上,结合宋词的格律特点按照一定的规则来对全宋词进行了切分。实验证明,本文中的方法具有较好的效果。 展开更多
关键词 计算机应用 中文信息处理 语料库 统计抽词 格律
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部