期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
PowerGREP与语料库加工 被引量:7
1
作者 严华 王立非 《外语电化教学》 CSSCI 2010年第3期57-62,共6页
语料库标注处理是语料库语言学研究中的一个重点和难题。除了词性标注,其他各类标注(包括语义、句法、话语、语用等标注)均较难实现批量或自动化生成。本文简述PowerGREP的检索、编辑与替换、采集三大功能以及与语料库加工密切相关... 语料库标注处理是语料库语言学研究中的一个重点和难题。除了词性标注,其他各类标注(包括语义、句法、话语、语用等标注)均较难实现批量或自动化生成。本文简述PowerGREP的检索、编辑与替换、采集三大功能以及与语料库加工密切相关的正则表达式知识,并以批量删除、添加和修改英国国家语料库(BNC)中语料赋码为例,说明如何运用PowerGREP对语料库进行自动化或半自动化加工和处理。 展开更多
关键词 PowerGREP 正则表达式 语料库加工
原文传递
英汉学习型词典的设计特征与语料库的深加工 被引量:3
2
作者 魏向清 《外语研究》 CSSCI 北大核心 2009年第5期86-90,共5页
本文首先回顾了国外英语学习型词典编纂与相关语料库建设的发展历史,并分析阐述了以词典设计特征为核心的编纂理念创新与相关语料库建设之间的互动关系。其次,本文具体探讨了我国未来英汉学习型词典编纂的设计特征研究与相关语料库的深... 本文首先回顾了国外英语学习型词典编纂与相关语料库建设的发展历史,并分析阐述了以词典设计特征为核心的编纂理念创新与相关语料库建设之间的互动关系。其次,本文具体探讨了我国未来英汉学习型词典编纂的设计特征研究与相关语料库的深加工问题,旨在对今后基于语料库的双语词典编纂实践提供帮助,同时进一步丰富语料库词典学的理论研究内涵。 展开更多
关键词 英汉学习型词典 设计特征 语料库加工
下载PDF
齐梁诗歌中的“风”与“月”——利用精加工语料库统计诗歌意象示例
3
作者 吴松 《南京师范大学文学院学报》 CSSCI 2014年第1期173-178,共6页
统计意象的组合,较之统计单个意象更有利于揭示诗歌艺术的内在机制。通过统计考察齐梁诗歌中"风"、"月"意象前后的组合以及"风"、"月"二字参与构成的复合意象,我们发现了齐梁诗歌中的"风&... 统计意象的组合,较之统计单个意象更有利于揭示诗歌艺术的内在机制。通过统计考察齐梁诗歌中"风"、"月"意象前后的组合以及"风"、"月"二字参与构成的复合意象,我们发现了齐梁诗歌中的"风"、"月"多用于悲伤情境等线索。意象统计做得越多,它能发挥的功用就越大。利用精加工语料库统计意象,有范围大、精准便捷、功能多样等优点,我们认为这种技术手段能够为中国诗歌研究起到一定的推动作用。 展开更多
关键词 齐梁诗歌 意象 加工语料库
下载PDF
汉语短语的自动划分和标注 被引量:21
4
作者 周强 《中文信息学报》 CSCD 北大核心 1997年第1期1-10,共10页
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个... 考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个处理阶段,其间利用了从人工标注的树库中统计得到的各种数据进行自动句法排歧,最终得到一棵最佳句法分析树,从而可以自顶向下地完成对一句句子的短语自动划分和标注,对一千多句句子的封闭测试结果表明,短语划分的正确率约为86%,短语标注的正确率约为92%,处理效果还是比较令人满意的。 展开更多
关键词 自动划分 标注 语料库加工 汉语分析器 汉语短语
下载PDF
规则与统计相结合的分词一致性检验 被引量:7
5
作者 刘博 郑家恒 张虎 《计算机工程与设计》 CSCD 北大核心 2008年第7期1814-1816,1827,共4页
建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处... 建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处理方法相比,该方法更具针对性的对语料库中存在的各种不同的分词不一致现象分别进行处理,能够更加有效的解决分词不一致问题,进一步保证语料库的质量。 展开更多
关键词 中文信息处理 大规模语料库 分词一致性检验 分词 语料库加工
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部