期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于线索词识别和训练集扩展的中文问题分类
被引量:
6
1
作者
张志昌
张宇
+1 位作者
刘挺
李生
《高技术通讯》
EI
CAS
CSCD
北大核心
2009年第2期111-118,共8页
针对问题分类的数据稀疏问题,提出了一种以疑问词和焦点词为关键线索的中文事实型问题分类方法。该方法首先自动识别用户提出的问题中的疑问词和焦点词,若疑问词和焦点词存在,则用最近邻模型进行分类,而对没有用最近邻方法分类的其他问...
针对问题分类的数据稀疏问题,提出了一种以疑问词和焦点词为关键线索的中文事实型问题分类方法。该方法首先自动识别用户提出的问题中的疑问词和焦点词,若疑问词和焦点词存在,则用最近邻模型进行分类,而对没有用最近邻方法分类的其他问题,则用支持向量机(SVM)模型进行分类。训练SVM模型时,从Web上自动获取新问题来对训练集进行扩展,最近邻方法只利用线索词词义距离进行类别判断。实验表明,这种按照问题结构的不同而选择不同分类器的方法,在性能上要优于单一分类方法;词义距离的应用和训练集自动扩展改善了训练数据的稀疏,提高了分类性能。
展开更多
关键词
问题分类
焦点词
词义距离
训练集扩展
下载PDF
职称材料
基于训练样本集扩展的隐式篇章关系分类
被引量:
3
2
作者
朱珊珊
洪宇
+3 位作者
丁思远
严为绒
姚建民
朱巧明
《中文信息学报》
CSCD
北大核心
2016年第5期111-120,共10页
隐式篇章关系分类主要任务是在显式关联线索缺失的情况下,自动检测特定论元之间的语义关系类别。前人研究显示,语言学特征能够有效辅助隐式篇章关系的分类。目前,主流检测方法由于缺少足够的已标注隐式训练样本,导致分类器无法准确学习...
隐式篇章关系分类主要任务是在显式关联线索缺失的情况下,自动检测特定论元之间的语义关系类别。前人研究显示,语言学特征能够有效辅助隐式篇章关系的分类。目前,主流检测方法由于缺少足够的已标注隐式训练样本,导致分类器无法准确学习各种分类特征,分类精确率仅约为40%。针对这一问题,该文提出一种基于训练样本集扩展的隐式篇章关系分类方法。该方法首先借助论元向量,以原始训练样本集为种子实例,从外部数据资源中挖掘与其在语义以及关系上一致的"平行训练样本集";然后将"平行训练样本集"加入原始训练样本集中,形成扩展的训练样本集;最后基于扩展的训练样本集,实现隐式篇章关系的分类。该文在宾州篇章树库(Penn Discourse Treebank,PDTB)上对扩展的训练样本集进行评测,结果显示,相较于原始训练样本集,使用扩展的训练样本集的实验系统整体性能提升8.41%,在四种篇章关系类别上的平均性能提升5.42%。与现有主流分类方法性能对比,识别精确率提升6.36%。
展开更多
关键词
隐式篇章关系
语义向量
训练
样本
集
扩展
篇章分析
下载PDF
职称材料
网络泛化能力与随机扩展训练集
被引量:
6
3
作者
杨慧中
卢鹏飞
+1 位作者
张素贞
陶振麟
《控制理论与应用》
EI
CAS
CSCD
北大核心
2002年第6期963-966,共4页
针对神经网络的过拟合和泛化能力差的问题 ,研究了样本数据的输入输出混合概率密度函数的局部最大熵密度估计 ,提出了运用Chebyshev不等式的样本参数按类分批自校正方法 ,以此估计拉伸样本集 ,得到新的随机扩充训练集 .使估计质量更高 ...
针对神经网络的过拟合和泛化能力差的问题 ,研究了样本数据的输入输出混合概率密度函数的局部最大熵密度估计 ,提出了运用Chebyshev不等式的样本参数按类分批自校正方法 ,以此估计拉伸样本集 ,得到新的随机扩充训练集 .使估计质量更高 ,效果更好 .仿真结果证明用这种方法训练的前馈神经网络具有较好的泛化性能 .
展开更多
关键词
随机
扩展
训练
集
前馈神经网络
泛化能力
最大局部熵密度函数
CHEBYSHEV不等式
概率密度估计
下载PDF
职称材料
题名
基于线索词识别和训练集扩展的中文问题分类
被引量:
6
1
作者
张志昌
张宇
刘挺
李生
机构
哈尔滨工业大学计算机学院信息检索研究室哈尔滨
出处
《高技术通讯》
EI
CAS
CSCD
北大核心
2009年第2期111-118,共8页
基金
863计划(2006AA012145)
国家自然科学基金(60435020,60503072)资助项目
文摘
针对问题分类的数据稀疏问题,提出了一种以疑问词和焦点词为关键线索的中文事实型问题分类方法。该方法首先自动识别用户提出的问题中的疑问词和焦点词,若疑问词和焦点词存在,则用最近邻模型进行分类,而对没有用最近邻方法分类的其他问题,则用支持向量机(SVM)模型进行分类。训练SVM模型时,从Web上自动获取新问题来对训练集进行扩展,最近邻方法只利用线索词词义距离进行类别判断。实验表明,这种按照问题结构的不同而选择不同分类器的方法,在性能上要优于单一分类方法;词义距离的应用和训练集自动扩展改善了训练数据的稀疏,提高了分类性能。
关键词
问题分类
焦点词
词义距离
训练集扩展
Keywords
question classification, focus word, word sense distance, extension of training set
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于训练样本集扩展的隐式篇章关系分类
被引量:
3
2
作者
朱珊珊
洪宇
丁思远
严为绒
姚建民
朱巧明
机构
苏州大学江苏省计算机信息处理技术重点实验室
出处
《中文信息学报》
CSCD
北大核心
2016年第5期111-120,共10页
基金
国家自然科学基金(61373097
61272259
+6 种基金
61272260
90920004)
教育部博士学科点专项基金(2009321110006
20103201110021)
江苏省自然科学基金(BK2011282)
江苏省高校自然科学基金(11KJA520003)
苏州市自然科学基金(SH201212)
文摘
隐式篇章关系分类主要任务是在显式关联线索缺失的情况下,自动检测特定论元之间的语义关系类别。前人研究显示,语言学特征能够有效辅助隐式篇章关系的分类。目前,主流检测方法由于缺少足够的已标注隐式训练样本,导致分类器无法准确学习各种分类特征,分类精确率仅约为40%。针对这一问题,该文提出一种基于训练样本集扩展的隐式篇章关系分类方法。该方法首先借助论元向量,以原始训练样本集为种子实例,从外部数据资源中挖掘与其在语义以及关系上一致的"平行训练样本集";然后将"平行训练样本集"加入原始训练样本集中,形成扩展的训练样本集;最后基于扩展的训练样本集,实现隐式篇章关系的分类。该文在宾州篇章树库(Penn Discourse Treebank,PDTB)上对扩展的训练样本集进行评测,结果显示,相较于原始训练样本集,使用扩展的训练样本集的实验系统整体性能提升8.41%,在四种篇章关系类别上的平均性能提升5.42%。与现有主流分类方法性能对比,识别精确率提升6.36%。
关键词
隐式篇章关系
语义向量
训练
样本
集
扩展
篇章分析
Keywords
implicit discourse relation
semantic vector
training data expansion
discourse analysis
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
网络泛化能力与随机扩展训练集
被引量:
6
3
作者
杨慧中
卢鹏飞
张素贞
陶振麟
机构
江南大学通信与控制工程学院
华东理工大学自动化研究所
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2002年第6期963-966,共4页
文摘
针对神经网络的过拟合和泛化能力差的问题 ,研究了样本数据的输入输出混合概率密度函数的局部最大熵密度估计 ,提出了运用Chebyshev不等式的样本参数按类分批自校正方法 ,以此估计拉伸样本集 ,得到新的随机扩充训练集 .使估计质量更高 ,效果更好 .仿真结果证明用这种方法训练的前馈神经网络具有较好的泛化性能 .
关键词
随机
扩展
训练
集
前馈神经网络
泛化能力
最大局部熵密度函数
CHEBYSHEV不等式
概率密度估计
Keywords
feed forward neural networks
generalization
locally most entropic probability density function
Chebyshev inequality
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
O211.6 [理学—概率论与数理统计]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于线索词识别和训练集扩展的中文问题分类
张志昌
张宇
刘挺
李生
《高技术通讯》
EI
CAS
CSCD
北大核心
2009
6
下载PDF
职称材料
2
基于训练样本集扩展的隐式篇章关系分类
朱珊珊
洪宇
丁思远
严为绒
姚建民
朱巧明
《中文信息学报》
CSCD
北大核心
2016
3
下载PDF
职称材料
3
网络泛化能力与随机扩展训练集
杨慧中
卢鹏飞
张素贞
陶振麟
《控制理论与应用》
EI
CAS
CSCD
北大核心
2002
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部