期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于分层策略的弱指导语义关系抽取
被引量:
1
1
作者
奚斌
周国栋
+1 位作者
钱龙华
潘珅
《广西师范大学学报(自然科学版)》
CAS
北大核心
2008年第1期178-181,共4页
提出一种基于Bootstrapping的弱指导语义关系抽取方法。在初始训练集的选取中使用了分层选取策略。实验表明,初始训练数据集的选择对于弱指导语义关系抽取的性能影响较大,利用分层次选取策略选择的数据具有较高的代表性和均衡性,与使用...
提出一种基于Bootstrapping的弱指导语义关系抽取方法。在初始训练集的选取中使用了分层选取策略。实验表明,初始训练数据集的选择对于弱指导语义关系抽取的性能影响较大,利用分层次选取策略选择的数据具有较高的代表性和均衡性,与使用随机选取的弱指导语义关系抽取相比,基于分层策略的弱指导语义关系抽取取得了更好的性能。
展开更多
关键词
弱指导
语义关系抽取
分层策略
下载PDF
职称材料
基于弱指导SVM的汉语动词次范畴化自动获取
被引量:
2
2
作者
韩习武
赵铁军
《计算机工程与应用》
CSCD
北大核心
2006年第28期9-11,27,共4页
动词次范畴化自动获取过程主要涉及到两个典型步骤一、依据启发性规则生成次范畴化假设;二、应用统计方法对假设集合进行过滤,选择可靠的次范畴化类型。此前改进获取性能的研究都集中在统计过滤阶段,并且相关实验的假设生成阶段都没有...
动词次范畴化自动获取过程主要涉及到两个典型步骤一、依据启发性规则生成次范畴化假设;二、应用统计方法对假设集合进行过滤,选择可靠的次范畴化类型。此前改进获取性能的研究都集中在统计过滤阶段,并且相关实验的假设生成阶段都没有涉及到有指导的训练过程,因此所有这些方法都是无指导的。文章提出一种弱指导的汉语动词次范畴化自动获取方案,并应用SVM分类器取代原系统中的无指导假设生成模块。实验结果表明,最终获取性能有了统计意义上的改善。
展开更多
关键词
汉语动词
次范畴化
弱指导
SVM
下载PDF
职称材料
基于Web弱指导的本体概念实例及属性的同步提取
被引量:
4
3
作者
康为
穗志方
《中文信息学报》
CSCD
北大核心
2010年第1期54-59,共6页
该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实...
该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实例和属性后,该文提出两种方法来评价提取的候选实例和属性。第一,利用概念实例和属性的关联性来互相评价对方的准确度;第二,利用候选实例或候选属性与种子实例或属性在上下文模式分布上的相似度来评价准确度。在疾病类实验结果表明,人工确认候选实例的准确率在前500个结果达到94%,前1 000个结果的准确率也高达93%。
展开更多
关键词
计算机应用
中文信息处理
WEB
概念实例提取
属性提取
弱指导
上下文模式
下载PDF
职称材料
基于非参数贝叶斯模型和深度学习的古文分词研究
被引量:
15
4
作者
俞敬松
魏一
+1 位作者
张永伟
杨浩
《中文信息学报》
CSCD
北大核心
2020年第6期1-8,共8页
古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言处理技术的基础任务之一。主流的自动分词方法需要大量人工分词语料训练,费时费力,古文分词语料获取尤其困...
古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言处理技术的基础任务之一。主流的自动分词方法需要大量人工分词语料训练,费时费力,古文分词语料获取尤其困难,限制了主流自动分词方法的应用。该文将非参数贝叶斯模型与BERT(Bidirectional Encoder Representations from Transformers)深度学习语言建模方法相结合,进行古文分词研究。在《左传》数据集上,该文提出的无监督多阶段迭代训练分词方法获得的F1值为93.28%;仅使用500句分词语料进行弱监督训练时,F1值可达95.55%,高于前人使用6/7语料(约36 000句)进行有监督训练的结果;使用相同规模训练语料时,该文方法获得的F1值为97.40%,为当前最优结果。此外,该文方法还具有较好的泛化能力,模型代码已开源发布。
展开更多
关键词
古文分词
非参数贝叶斯模型
深度学习
无
指导
学习
弱指导
学习
下载PDF
职称材料
层级标签语义引导的极限多标签文本分类策略
被引量:
1
5
作者
王嫄
徐涛
+2 位作者
王世龙
周宇博
史艳翠
《中文信息学报》
CSCD
北大核心
2021年第10期110-118,共9页
极限多标签文本分类任务具有标签集大、类间关系复杂、数据分布不平衡等特点,是具有挑战性的研究热点。现有模型对标签语义信息利用不足,性能有限。对此,该文提出一种利用层级标签语义信息引导的极限多标签文本分类模型提升策略,在训练...
极限多标签文本分类任务具有标签集大、类间关系复杂、数据分布不平衡等特点,是具有挑战性的研究热点。现有模型对标签语义信息利用不足,性能有限。对此,该文提出一种利用层级标签语义信息引导的极限多标签文本分类模型提升策略,在训练和预测过程中给予模型层级标签引导的弱监督语义指导信息,利用这种弱监督信息规约多标签文本分类任务中要对应的多标签语义边界。在标准数据集上的实验结果表明,该文所提策略能够有效提升现有模型性能,尤其在短文本数据集中增效显著,宏精准率最高提升21.23%。
展开更多
关键词
极限多标签文本分类
层级标签
弱
监督语义
指导
下载PDF
职称材料
题名
基于分层策略的弱指导语义关系抽取
被引量:
1
1
作者
奚斌
周国栋
钱龙华
潘珅
机构
苏州大学计算机科学与技术学院江苏省计算机信息处理技术重点实验室
出处
《广西师范大学学报(自然科学版)》
CAS
北大核心
2008年第1期178-181,共4页
基金
国家"863"计划资助项目(2006AA01Z147)
国家自然科学基金资助项目(60673041)
文摘
提出一种基于Bootstrapping的弱指导语义关系抽取方法。在初始训练集的选取中使用了分层选取策略。实验表明,初始训练数据集的选择对于弱指导语义关系抽取的性能影响较大,利用分层次选取策略选择的数据具有较高的代表性和均衡性,与使用随机选取的弱指导语义关系抽取相比,基于分层策略的弱指导语义关系抽取取得了更好的性能。
关键词
弱指导
语义关系抽取
分层策略
Keywords
weakly-supervised learning
semantic relation extraction
stratified strategy
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于弱指导SVM的汉语动词次范畴化自动获取
被引量:
2
2
作者
韩习武
赵铁军
机构
黑龙江大学计算机学院
哈尔滨工业大学计算机学院
出处
《计算机工程与应用》
CSCD
北大核心
2006年第28期9-11,27,共4页
基金
国家自然科学基金项目资助(编号:60373101)
文摘
动词次范畴化自动获取过程主要涉及到两个典型步骤一、依据启发性规则生成次范畴化假设;二、应用统计方法对假设集合进行过滤,选择可靠的次范畴化类型。此前改进获取性能的研究都集中在统计过滤阶段,并且相关实验的假设生成阶段都没有涉及到有指导的训练过程,因此所有这些方法都是无指导的。文章提出一种弱指导的汉语动词次范畴化自动获取方案,并应用SVM分类器取代原系统中的无指导假设生成模块。实验结果表明,最终获取性能有了统计意义上的改善。
关键词
汉语动词
次范畴化
弱指导
SVM
Keywords
Chinese verbs, subcategorization,weakly supervised, SVM
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于Web弱指导的本体概念实例及属性的同步提取
被引量:
4
3
作者
康为
穗志方
机构
北京大学计算语言学研究所
北京大学计算语言学教育部重点实验室
出处
《中文信息学报》
CSCD
北大核心
2010年第1期54-59,共6页
基金
国家自然科学基金资助项目(60873156)
国家社科基金资助项目(09BYY032)
文摘
该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实例和属性后,该文提出两种方法来评价提取的候选实例和属性。第一,利用概念实例和属性的关联性来互相评价对方的准确度;第二,利用候选实例或候选属性与种子实例或属性在上下文模式分布上的相似度来评价准确度。在疾病类实验结果表明,人工确认候选实例的准确率在前500个结果达到94%,前1 000个结果的准确率也高达93%。
关键词
计算机应用
中文信息处理
WEB
概念实例提取
属性提取
弱指导
上下文模式
Keywords
computer application
Chinese information processing
web
domain concept instance extraction
attributes extraction
weakly-supervised
contextual pattern
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于非参数贝叶斯模型和深度学习的古文分词研究
被引量:
15
4
作者
俞敬松
魏一
张永伟
杨浩
机构
北京大学软件与微电子学院
中国社会科学院语言研究所
北京大学儒藏编纂与研究中心
出处
《中文信息学报》
CSCD
北大核心
2020年第6期1-8,共8页
基金
国家自然科学基金(61876004)
文摘
古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言处理技术的基础任务之一。主流的自动分词方法需要大量人工分词语料训练,费时费力,古文分词语料获取尤其困难,限制了主流自动分词方法的应用。该文将非参数贝叶斯模型与BERT(Bidirectional Encoder Representations from Transformers)深度学习语言建模方法相结合,进行古文分词研究。在《左传》数据集上,该文提出的无监督多阶段迭代训练分词方法获得的F1值为93.28%;仅使用500句分词语料进行弱监督训练时,F1值可达95.55%,高于前人使用6/7语料(约36 000句)进行有监督训练的结果;使用相同规模训练语料时,该文方法获得的F1值为97.40%,为当前最优结果。此外,该文方法还具有较好的泛化能力,模型代码已开源发布。
关键词
古文分词
非参数贝叶斯模型
深度学习
无
指导
学习
弱指导
学习
Keywords
word segmentation for ancient Chinese texts
nonparametric Bayesian models
deep learning
unsupervised learning
weakly supervised learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
层级标签语义引导的极限多标签文本分类策略
被引量:
1
5
作者
王嫄
徐涛
王世龙
周宇博
史艳翠
机构
天津科技大学人工智能学院
普迈康(天津)精准医疗科技有限公司
出处
《中文信息学报》
CSCD
北大核心
2021年第10期110-118,共9页
基金
国家自然科学基金(61702367,61976156,11803022,61807024)
天津市企业科技特派员项目(20YDTPJC00560)
+1 种基金
天津市教委科研计划(2017KJ033,2017KJ034,2017KJ035,2018KJ105,2018KJ106)
天津市自然科学基金(19JCYBJC15300)
文摘
极限多标签文本分类任务具有标签集大、类间关系复杂、数据分布不平衡等特点,是具有挑战性的研究热点。现有模型对标签语义信息利用不足,性能有限。对此,该文提出一种利用层级标签语义信息引导的极限多标签文本分类模型提升策略,在训练和预测过程中给予模型层级标签引导的弱监督语义指导信息,利用这种弱监督信息规约多标签文本分类任务中要对应的多标签语义边界。在标准数据集上的实验结果表明,该文所提策略能够有效提升现有模型性能,尤其在短文本数据集中增效显著,宏精准率最高提升21.23%。
关键词
极限多标签文本分类
层级标签
弱
监督语义
指导
Keywords
extreme multi-label text classification
hierarchical labels
weakly supervised semantic guidance
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于分层策略的弱指导语义关系抽取
奚斌
周国栋
钱龙华
潘珅
《广西师范大学学报(自然科学版)》
CAS
北大核心
2008
1
下载PDF
职称材料
2
基于弱指导SVM的汉语动词次范畴化自动获取
韩习武
赵铁军
《计算机工程与应用》
CSCD
北大核心
2006
2
下载PDF
职称材料
3
基于Web弱指导的本体概念实例及属性的同步提取
康为
穗志方
《中文信息学报》
CSCD
北大核心
2010
4
下载PDF
职称材料
4
基于非参数贝叶斯模型和深度学习的古文分词研究
俞敬松
魏一
张永伟
杨浩
《中文信息学报》
CSCD
北大核心
2020
15
下载PDF
职称材料
5
层级标签语义引导的极限多标签文本分类策略
王嫄
徐涛
王世龙
周宇博
史艳翠
《中文信息学报》
CSCD
北大核心
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部