期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
PowerGREP与语料库加工
被引量:
7
1
作者
严华
王立非
《外语电化教学》
CSSCI
2010年第3期57-62,共6页
语料库标注处理是语料库语言学研究中的一个重点和难题。除了词性标注,其他各类标注(包括语义、句法、话语、语用等标注)均较难实现批量或自动化生成。本文简述PowerGREP的检索、编辑与替换、采集三大功能以及与语料库加工密切相关...
语料库标注处理是语料库语言学研究中的一个重点和难题。除了词性标注,其他各类标注(包括语义、句法、话语、语用等标注)均较难实现批量或自动化生成。本文简述PowerGREP的检索、编辑与替换、采集三大功能以及与语料库加工密切相关的正则表达式知识,并以批量删除、添加和修改英国国家语料库(BNC)中语料赋码为例,说明如何运用PowerGREP对语料库进行自动化或半自动化加工和处理。
展开更多
关键词
PowerGREP
正则表达式
语料库加工
原文传递
英汉学习型词典的设计特征与语料库的深加工
被引量:
3
2
作者
魏向清
《外语研究》
CSSCI
北大核心
2009年第5期86-90,共5页
本文首先回顾了国外英语学习型词典编纂与相关语料库建设的发展历史,并分析阐述了以词典设计特征为核心的编纂理念创新与相关语料库建设之间的互动关系。其次,本文具体探讨了我国未来英汉学习型词典编纂的设计特征研究与相关语料库的深...
本文首先回顾了国外英语学习型词典编纂与相关语料库建设的发展历史,并分析阐述了以词典设计特征为核心的编纂理念创新与相关语料库建设之间的互动关系。其次,本文具体探讨了我国未来英汉学习型词典编纂的设计特征研究与相关语料库的深加工问题,旨在对今后基于语料库的双语词典编纂实践提供帮助,同时进一步丰富语料库词典学的理论研究内涵。
展开更多
关键词
英汉学习型词典
设计特征
语料库
深
加工
下载PDF
职称材料
齐梁诗歌中的“风”与“月”——利用精加工语料库统计诗歌意象示例
3
作者
吴松
《南京师范大学文学院学报》
CSSCI
2014年第1期173-178,共6页
统计意象的组合,较之统计单个意象更有利于揭示诗歌艺术的内在机制。通过统计考察齐梁诗歌中"风"、"月"意象前后的组合以及"风"、"月"二字参与构成的复合意象,我们发现了齐梁诗歌中的"风&...
统计意象的组合,较之统计单个意象更有利于揭示诗歌艺术的内在机制。通过统计考察齐梁诗歌中"风"、"月"意象前后的组合以及"风"、"月"二字参与构成的复合意象,我们发现了齐梁诗歌中的"风"、"月"多用于悲伤情境等线索。意象统计做得越多,它能发挥的功用就越大。利用精加工语料库统计意象,有范围大、精准便捷、功能多样等优点,我们认为这种技术手段能够为中国诗歌研究起到一定的推动作用。
展开更多
关键词
齐梁诗歌
意象
精
加工
语料库
下载PDF
职称材料
汉语短语的自动划分和标注
被引量:
21
4
作者
周强
《中文信息学报》
CSCD
北大核心
1997年第1期1-10,共10页
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个...
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个处理阶段,其间利用了从人工标注的树库中统计得到的各种数据进行自动句法排歧,最终得到一棵最佳句法分析树,从而可以自顶向下地完成对一句句子的短语自动划分和标注,对一千多句句子的封闭测试结果表明,短语划分的正确率约为86%,短语标注的正确率约为92%,处理效果还是比较令人满意的。
展开更多
关键词
自动划分
标注
语料库加工
汉语分析器
汉语短语
下载PDF
职称材料
规则与统计相结合的分词一致性检验
被引量:
7
5
作者
刘博
郑家恒
张虎
《计算机工程与设计》
CSCD
北大核心
2008年第7期1814-1816,1827,共4页
建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处...
建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处理方法相比,该方法更具针对性的对语料库中存在的各种不同的分词不一致现象分别进行处理,能够更加有效的解决分词不一致问题,进一步保证语料库的质量。
展开更多
关键词
中文信息处理
大规模
语料库
分词一致性检验
分词
语料库加工
下载PDF
职称材料
题名
PowerGREP与语料库加工
被引量:
7
1
作者
严华
王立非
机构
扬州大学外国语学院
对外经济贸易大学英语学院
出处
《外语电化教学》
CSSCI
2010年第3期57-62,共6页
文摘
语料库标注处理是语料库语言学研究中的一个重点和难题。除了词性标注,其他各类标注(包括语义、句法、话语、语用等标注)均较难实现批量或自动化生成。本文简述PowerGREP的检索、编辑与替换、采集三大功能以及与语料库加工密切相关的正则表达式知识,并以批量删除、添加和修改英国国家语料库(BNC)中语料赋码为例,说明如何运用PowerGREP对语料库进行自动化或半自动化加工和处理。
关键词
PowerGREP
正则表达式
语料库加工
Keywords
PowerGREP
Regular Expression
Corpus Processing
分类号
H319.3 [语言文字—英语]
原文传递
题名
英汉学习型词典的设计特征与语料库的深加工
被引量:
3
2
作者
魏向清
机构
南京大学双语词典中心
出处
《外语研究》
CSSCI
北大核心
2009年第5期86-90,共5页
文摘
本文首先回顾了国外英语学习型词典编纂与相关语料库建设的发展历史,并分析阐述了以词典设计特征为核心的编纂理念创新与相关语料库建设之间的互动关系。其次,本文具体探讨了我国未来英汉学习型词典编纂的设计特征研究与相关语料库的深加工问题,旨在对今后基于语料库的双语词典编纂实践提供帮助,同时进一步丰富语料库词典学的理论研究内涵。
关键词
英汉学习型词典
设计特征
语料库
深
加工
分类号
H06 [语言文字—语言学]
下载PDF
职称材料
题名
齐梁诗歌中的“风”与“月”——利用精加工语料库统计诗歌意象示例
3
作者
吴松
机构
南京师范大学文学院
出处
《南京师范大学文学院学报》
CSSCI
2014年第1期173-178,共6页
基金
国家社科基金重大招标项目<汉语史语料库建设研究>(编号:10&ZD117)
文摘
统计意象的组合,较之统计单个意象更有利于揭示诗歌艺术的内在机制。通过统计考察齐梁诗歌中"风"、"月"意象前后的组合以及"风"、"月"二字参与构成的复合意象,我们发现了齐梁诗歌中的"风"、"月"多用于悲伤情境等线索。意象统计做得越多,它能发挥的功用就越大。利用精加工语料库统计意象,有范围大、精准便捷、功能多样等优点,我们认为这种技术手段能够为中国诗歌研究起到一定的推动作用。
关键词
齐梁诗歌
意象
精
加工
语料库
Keywords
poems of the Qi and Liang Dynasty
image
precisely processed corpus
分类号
H131 [语言文字—汉语]
下载PDF
职称材料
题名
汉语短语的自动划分和标注
被引量:
21
4
作者
周强
机构
北京大学计算语言学研究所
出处
《中文信息学报》
CSCD
北大核心
1997年第1期1-10,共10页
基金
国家自然科学基金
文摘
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个处理阶段,其间利用了从人工标注的树库中统计得到的各种数据进行自动句法排歧,最终得到一棵最佳句法分析树,从而可以自顶向下地完成对一句句子的短语自动划分和标注,对一千多句句子的封闭测试结果表明,短语划分的正确率约为86%,短语标注的正确率约为92%,处理效果还是比较令人满意的。
关键词
自动划分
标注
语料库加工
汉语分析器
汉语短语
Keywords
:phrase bracketing and tagging tagging,corpus annotion.
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
规则与统计相结合的分词一致性检验
被引量:
7
5
作者
刘博
郑家恒
张虎
机构
山西大学计算机与信息技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第7期1814-1816,1827,共4页
基金
国家自然科学基金项目(60473139)
山西省自然科学基金项目(20051034)
文摘
建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处理方法相比,该方法更具针对性的对语料库中存在的各种不同的分词不一致现象分别进行处理,能够更加有效的解决分词不一致问题,进一步保证语料库的质量。
关键词
中文信息处理
大规模
语料库
分词一致性检验
分词
语料库加工
Keywords
Chinese information processing
large-scale corpus
consistency check of segment
segment
corpus processing
分类号
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
PowerGREP与语料库加工
严华
王立非
《外语电化教学》
CSSCI
2010
7
原文传递
2
英汉学习型词典的设计特征与语料库的深加工
魏向清
《外语研究》
CSSCI
北大核心
2009
3
下载PDF
职称材料
3
齐梁诗歌中的“风”与“月”——利用精加工语料库统计诗歌意象示例
吴松
《南京师范大学文学院学报》
CSSCI
2014
0
下载PDF
职称材料
4
汉语短语的自动划分和标注
周强
《中文信息学报》
CSCD
北大核心
1997
21
下载PDF
职称材料
5
规则与统计相结合的分词一致性检验
刘博
郑家恒
张虎
《计算机工程与设计》
CSCD
北大核心
2008
7
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部