期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于分层策略的弱指导语义关系抽取 被引量:1
1
作者 奚斌 周国栋 +1 位作者 钱龙华 潘珅 《广西师范大学学报(自然科学版)》 CAS 北大核心 2008年第1期178-181,共4页
提出一种基于Bootstrapping的弱指导语义关系抽取方法。在初始训练集的选取中使用了分层选取策略。实验表明,初始训练数据集的选择对于弱指导语义关系抽取的性能影响较大,利用分层次选取策略选择的数据具有较高的代表性和均衡性,与使用... 提出一种基于Bootstrapping的弱指导语义关系抽取方法。在初始训练集的选取中使用了分层选取策略。实验表明,初始训练数据集的选择对于弱指导语义关系抽取的性能影响较大,利用分层次选取策略选择的数据具有较高的代表性和均衡性,与使用随机选取的弱指导语义关系抽取相比,基于分层策略的弱指导语义关系抽取取得了更好的性能。 展开更多
关键词 弱指导 语义关系抽取 分层策略
下载PDF
基于弱指导SVM的汉语动词次范畴化自动获取 被引量:2
2
作者 韩习武 赵铁军 《计算机工程与应用》 CSCD 北大核心 2006年第28期9-11,27,共4页
动词次范畴化自动获取过程主要涉及到两个典型步骤一、依据启发性规则生成次范畴化假设;二、应用统计方法对假设集合进行过滤,选择可靠的次范畴化类型。此前改进获取性能的研究都集中在统计过滤阶段,并且相关实验的假设生成阶段都没有... 动词次范畴化自动获取过程主要涉及到两个典型步骤一、依据启发性规则生成次范畴化假设;二、应用统计方法对假设集合进行过滤,选择可靠的次范畴化类型。此前改进获取性能的研究都集中在统计过滤阶段,并且相关实验的假设生成阶段都没有涉及到有指导的训练过程,因此所有这些方法都是无指导的。文章提出一种弱指导的汉语动词次范畴化自动获取方案,并应用SVM分类器取代原系统中的无指导假设生成模块。实验结果表明,最终获取性能有了统计意义上的改善。 展开更多
关键词 汉语动词 次范畴化 弱指导 SVM
下载PDF
基于Web弱指导的本体概念实例及属性的同步提取 被引量:4
3
作者 康为 穗志方 《中文信息学报》 CSCD 北大核心 2010年第1期54-59,共6页
该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实... 该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实例和属性后,该文提出两种方法来评价提取的候选实例和属性。第一,利用概念实例和属性的关联性来互相评价对方的准确度;第二,利用候选实例或候选属性与种子实例或属性在上下文模式分布上的相似度来评价准确度。在疾病类实验结果表明,人工确认候选实例的准确率在前500个结果达到94%,前1 000个结果的准确率也高达93%。 展开更多
关键词 计算机应用 中文信息处理 WEB 概念实例提取 属性提取 弱指导 上下文模式
下载PDF
基于非参数贝叶斯模型和深度学习的古文分词研究 被引量:15
4
作者 俞敬松 魏一 +1 位作者 张永伟 杨浩 《中文信息学报》 CSCD 北大核心 2020年第6期1-8,共8页
古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言处理技术的基础任务之一。主流的自动分词方法需要大量人工分词语料训练,费时费力,古文分词语料获取尤其困... 古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言处理技术的基础任务之一。主流的自动分词方法需要大量人工分词语料训练,费时费力,古文分词语料获取尤其困难,限制了主流自动分词方法的应用。该文将非参数贝叶斯模型与BERT(Bidirectional Encoder Representations from Transformers)深度学习语言建模方法相结合,进行古文分词研究。在《左传》数据集上,该文提出的无监督多阶段迭代训练分词方法获得的F1值为93.28%;仅使用500句分词语料进行弱监督训练时,F1值可达95.55%,高于前人使用6/7语料(约36 000句)进行有监督训练的结果;使用相同规模训练语料时,该文方法获得的F1值为97.40%,为当前最优结果。此外,该文方法还具有较好的泛化能力,模型代码已开源发布。 展开更多
关键词 古文分词 非参数贝叶斯模型 深度学习 指导学习 弱指导学习
下载PDF
层级标签语义引导的极限多标签文本分类策略 被引量:1
5
作者 王嫄 徐涛 +2 位作者 王世龙 周宇博 史艳翠 《中文信息学报》 CSCD 北大核心 2021年第10期110-118,共9页
极限多标签文本分类任务具有标签集大、类间关系复杂、数据分布不平衡等特点,是具有挑战性的研究热点。现有模型对标签语义信息利用不足,性能有限。对此,该文提出一种利用层级标签语义信息引导的极限多标签文本分类模型提升策略,在训练... 极限多标签文本分类任务具有标签集大、类间关系复杂、数据分布不平衡等特点,是具有挑战性的研究热点。现有模型对标签语义信息利用不足,性能有限。对此,该文提出一种利用层级标签语义信息引导的极限多标签文本分类模型提升策略,在训练和预测过程中给予模型层级标签引导的弱监督语义指导信息,利用这种弱监督信息规约多标签文本分类任务中要对应的多标签语义边界。在标准数据集上的实验结果表明,该文所提策略能够有效提升现有模型性能,尤其在短文本数据集中增效显著,宏精准率最高提升21.23%。 展开更多
关键词 极限多标签文本分类 层级标签 监督语义指导
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部