期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
现当代文学作品的作者身份识别研究 被引量:21
1
作者 年洪东 陈小荷 王东波 《计算机工程与应用》 CSCD 北大核心 2010年第4期226-229,共4页
主要利用了SVM统计机器学习模型对中国现当代文学八位代表人物的作品进行了作者身份识别研究,在识别过程中选取了以词汇为基础的多种统计量作为识别特征,并且采取了基于低密度多特征的训练方法,在跨文体的作品的作者身份识别中取得了非... 主要利用了SVM统计机器学习模型对中国现当代文学八位代表人物的作品进行了作者身份识别研究,在识别过程中选取了以词汇为基础的多种统计量作为识别特征,并且采取了基于低密度多特征的训练方法,在跨文体的作品的作者身份识别中取得了非常优异的识别性能。 展开更多
关键词 作者身份识别 机器学习 计算风格学 现当代文学
下载PDF
利用现有资源快速实现汉语专用分词系统
2
作者 年洪东 《文教资料》 2007年第29期43-45,共3页
汉语的自动分词是进行汉语语言处理的基础,也是广大语言工作者建立自己专用语料库的基础工作。本文利用网上一些开源的软件工具和语料资源实现了针对新闻语料的专用分词系统,经测试分词准确率和召回率均达到了令人满意的效果。
关键词 自动分词 条件随机场 由字构词 特征 模板
下载PDF
基于条件随机场的有标记联合结构自动识别 被引量:9
3
作者 王东波 陈小荷 年洪东 《中文信息学报》 CSCD 北大核心 2008年第6期3-7,19,共6页
文章介绍了条件随机场的基本原理,基于识别有标记联合结构的需要,根据有标记联合结构的语言学特征结合条件随机场的特性确定了条件随机场的7词位标注集、具有18个复杂特征的模板、增加4个语言学特征的模板。使用北京大学《人民日报》语... 文章介绍了条件随机场的基本原理,基于识别有标记联合结构的需要,根据有标记联合结构的语言学特征结合条件随机场的特性确定了条件随机场的7词位标注集、具有18个复杂特征的模板、增加4个语言学特征的模板。使用北京大学《人民日报》语料和清华大学973树库语料,基于复杂特征的特征模板和增加语言学特征的特征模板在含有嵌套的联合结构、无嵌套联合结构和最长联合结构语料上进行了实验,开放测试的调和平均值最高分别达到了88.21%,87.85%和84.42%。 展开更多
关键词 计算机应用 中文信息处理 有标记联合结构 条件随机场 特征模板
下载PDF
基于支持向量机的医学期刊文章自动分类研究 被引量:11
4
作者 王东波 苏新宁 +1 位作者 朱丹浩 年洪东 《情报理论与实践》 CSSCI 北大核心 2011年第4期115-118,共4页
基于支持向量机学习模型,使用万方期刊数据库中医学、卫生的有关标题和摘要数据,对医学、卫生大类下的R7中的9个小类进行了自动分类研究。在中文信息处理知识和技术的基础上选取分类特征,在分类过程中主要采取了基于低密度多特征的训练... 基于支持向量机学习模型,使用万方期刊数据库中医学、卫生的有关标题和摘要数据,对医学、卫生大类下的R7中的9个小类进行了自动分类研究。在中文信息处理知识和技术的基础上选取分类特征,在分类过程中主要采取了基于低密度多特征的训练方法。在互信息、卡方统计、交叉熵和证据权值4个不同的统计特征量的开放测试中,自动分类的查全率和准确率都取得了相对令人满意的结果。 展开更多
关键词 支持向量机 期刊 自动分类
下载PDF
基于语料库的容器类隐喻名词短语研究——以“海洋”为例 被引量:2
5
作者 年洪东 张霄军 《心智与计算》 2009年第1期9-14,共6页
在超大规模的语料库基础上,对由"海洋"构成"形/名+(的)+海洋"结构的隐喻名词短语进行统计分析,并利用同义词词林作为辅助分类体系对"海洋"的搭配词语进行了基本的语义分类。我们的目的是通过对容器隐喻... 在超大规模的语料库基础上,对由"海洋"构成"形/名+(的)+海洋"结构的隐喻名词短语进行统计分析,并利用同义词词林作为辅助分类体系对"海洋"的搭配词语进行了基本的语义分类。我们的目的是通过对容器隐喻类代表词语"海洋"所构成的隐喻名词短语的多角度分析,发现其在短语层面的隐喻工作机制和隐喻理解方式。 展开更多
关键词 隐喻名词短语 容器隐喻 搭配 特征映射
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部