期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
采用改进重采样和BRF方法的定义抽取研究 被引量:7
1
作者 潘湑 顾宏斌 《中文信息学报》 CSCD 北大核心 2011年第3期30-37,共8页
为了从专业领域语料中发现并获取所有的专业术语定义,该文提出了使用分类方法进行专业术语定义抽取的方法。该文采用一种基于实例距离分布信息的过采样方法,将其与随机欠采样方法结合用以建立平衡训练语料,并使用BRF(Balanced Random Fo... 为了从专业领域语料中发现并获取所有的专业术语定义,该文提出了使用分类方法进行专业术语定义抽取的方法。该文采用一种基于实例距离分布信息的过采样方法,将其与随机欠采样方法结合用以建立平衡训练语料,并使用BRF(Balanced Random Forest)方法来获得C4.5决策树的聚合分类结果。该方法获得了最好65%的F1-measure成绩和78%的F2-measure成绩,超过了仅使用BRF方法取得的成绩。 展开更多
关键词 自然语言处理 术语定义 定义抽取 文本分类 重采样
下载PDF
术语定义抽取的特征选择框架 被引量:1
2
作者 潘湑 顾宏斌 赵芷晴 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2012年第3期399-404,共6页
为了进一步提升航空领域术语定义抽取的精度和效率,提出了一种不依赖已有特征选择方法的特征选择框架。该框架结合了分类特征的类间分布差异和类内分布差异,更好地表达了术语定义内部各子概念间特征分布的差异对划分类别的贡献。在分析... 为了进一步提升航空领域术语定义抽取的精度和效率,提出了一种不依赖已有特征选择方法的特征选择框架。该框架结合了分类特征的类间分布差异和类内分布差异,更好地表达了术语定义内部各子概念间特征分布的差异对划分类别的贡献。在分析该框架和传统过滤器特征选择方法对特征分布的影响的基础上,在航空领域术语定义语料库中对实验结果进行了对比。结果表明,本文提出的方法在使用平衡随机森林方法时,取得的最好成绩为F1-measure=0.652,F2-measure=0.761,所需特征比例从30%~40%降低到20%~30%;在使用直接分类方法时,F1-measure成绩提高了2.57倍,F2-measure成绩提高了3.11倍,均优于过滤器方法和Fisher Score方法。 展开更多
关键词 特征选择 不平衡语料 定义抽取 文本分类 小析取项
下载PDF
CBT开发系统素材存储管理结构实现
3
作者 潘湑 顾宏斌 《计算机技术与发展》 2006年第3期142-145,共4页
文中介绍了在CBT课件开发系统中,采用经过改进的树型控件开发课程素材录入和管理系统素材存储结构方法,达到既符合人们的浏览习惯,也便于素材在数据库中存储、管理和进一步操作的目的。实现了使用数据库记录创建树型控件,通过使用自行... 文中介绍了在CBT课件开发系统中,采用经过改进的树型控件开发课程素材录入和管理系统素材存储结构方法,达到既符合人们的浏览习惯,也便于素材在数据库中存储、管理和进一步操作的目的。实现了使用数据库记录创建树型控件,通过使用自行设计的派生于CTreeCtrl的子类实现支持拖拽的树型控件,并利用树型控件的附加属性保存了便于检索和操作相应记录的关键信息。 展开更多
关键词 树型控件 开放数据库互联 计算机辅助训练
下载PDF
航空发动机适航知识库构建方法研究 被引量:3
4
作者 赵芷晴 顾宏斌 潘湑 《航空计算技术》 2012年第1期100-103,共4页
针对航空发动机适航领域知识重用、共享性差的问题,分析该领域知识特点;采用改进重采样和BRF方法进行知识获取;提出产生式规则、框架网络和面向对象的混合知识表示模型。与数据库软件的有效集成,创建智能知识库系统,实现了知识的查询和... 针对航空发动机适航领域知识重用、共享性差的问题,分析该领域知识特点;采用改进重采样和BRF方法进行知识获取;提出产生式规则、框架网络和面向对象的混合知识表示模型。与数据库软件的有效集成,创建智能知识库系统,实现了知识的查询和维护。 展开更多
关键词 知识库 产生式规则 框架网络 面向对象表示法 重采样 平衡随机森林
下载PDF
C4.5算法在民航CBT中的应用
5
作者 李晋 顾宏斌 潘湑 《科技信息》 2010年第28期270-271,共2页
决策树学习策略广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树剪枝的作用是简化决策树,提高决策树的泛化能力,避免对训练集的过适应,是决策树学习中的重要研究内容。本文详细介绍了数据挖掘算法中的C4.5算法的... 决策树学习策略广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树剪枝的作用是简化决策树,提高决策树的泛化能力,避免对训练集的过适应,是决策树学习中的重要研究内容。本文详细介绍了数据挖掘算法中的C4.5算法的基本思想,并且对REP剪枝技术进行分析,以此对C4.5算法进行剪枝。实验表明改进的C4.5算法与原C4.5算法相比能很好地处理训练集的非平衡性,并降低决策树的规模,效率得到提高。 展开更多
关键词 决策树 C4.5 过拟合 后剪枝 民航CBT
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部