期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
图书馆开展公众科学分类标注项目设计系统综述与循证实践建议 被引量:1
1
作者 王钰婷 王翩然 《图书馆工作与研究》 CSSCI 北大核心 2024年第5期17-31,共15页
文章关注公众科学分类标注项目,运用系统综述方法,在Web of Science核心合集中筛选出45篇文献作为证据来源,并根据EBLIP证据等级模型为证据进行评级,进而提出公众科学分类标注项目设计建议,即合理设置任务粒度,平衡数据质量与参与难度;... 文章关注公众科学分类标注项目,运用系统综述方法,在Web of Science核心合集中筛选出45篇文献作为证据来源,并根据EBLIP证据等级模型为证据进行评级,进而提出公众科学分类标注项目设计建议,即合理设置任务粒度,平衡数据质量与参与难度;适当设置“不知道”选项,平衡数据质量与分类效率;加入游戏化元素,提升参与过程的趣味性;广泛招募公众,重视但不能依赖“超级参与者”;设置物质和精神激励,吸引公众加入并持续参与;采用通俗语言而非专业术语,关注非正式沟通渠道;提供教程指导,发挥科普作用;设置分类标注次数阈值,平衡数据质量和项目进度;以算法汇总参与者共识,获得最终分类结果。 展开更多
关键词 循证图书馆信息实践 EBLIP 公众科学 证据评级 GLAM 开放科研活动 分类标注项目
下载PDF
结合受控词汇表的生物基因本体标注与分类 被引量:3
2
作者 崔舒宁 朱丹军 +1 位作者 冯博琴 昂正全 《西安交通大学学报》 EI CAS CSCD 北大核心 2008年第2期171-174,共4页
通过研究有关基因的生物学文献特征,提出了一种能对生物基因文献进行自动标注与分类的方法.在K最邻近算法的基础上,采用了Chi-Square特征选择方案,并且在加权算法中突出了Chi-Square的选择特点.另外,采用文档逻辑分块法,将额外的生物受... 通过研究有关基因的生物学文献特征,提出了一种能对生物基因文献进行自动标注与分类的方法.在K最邻近算法的基础上,采用了Chi-Square特征选择方案,并且在加权算法中突出了Chi-Square的选择特点.另外,采用文档逻辑分块法,将额外的生物受控词汇表中的信息所形成的向量直接引入到了分类算法中,以提高分类和标注的效果.实验表明,所提算法优于常用的单词频率/逆文档频率加权方法,其在文本检索大会(TREC)数据集上的分类、标注效果分别比TREC公布的最好结果提高了3.14%和4.12%. 展开更多
关键词 基因本体 分类标注 最邻近算法
下载PDF
卷积神经网络在短文本情感多分类标注应用 被引量:10
3
作者 周锦峰 叶施仁 王晖 《计算机工程与应用》 CSCD 北大核心 2018年第22期133-138,149,共7页
情感多分类标注对文本信息的敏感性远高于二分类问题。为了有效利用语义依赖距离和语义多层次进行情感多分类,提出一种多窗口多池化层的卷积神经网络模型。首先使用多窗口的卷积层提取上下文局部语义,然后通过多池化层降低特征维度,同... 情感多分类标注对文本信息的敏感性远高于二分类问题。为了有效利用语义依赖距离和语义多层次进行情感多分类,提出一种多窗口多池化层的卷积神经网络模型。首先使用多窗口的卷积层提取上下文局部语义,然后通过多池化层降低特征维度,同时保留不同层次的语义,由多层次语义构成文本特征向量,最后送入全连接层完成多分类标注。采用斯坦福情感树库数据集验证所提模型的多分类标注效果。实验结果表明,在训练集含短语和未包含短语两种设定下,模型的短文本情感多分类正确率分别达到54.6%和43.5%。 展开更多
关键词 情感分析 分类标注 卷积神经网络 深度学习
下载PDF
基于fcmpCNN模型的网络文本情感多分类标注 被引量:2
4
作者 周锦峰 叶施仁 王晖 《计算机应用研究》 CSCD 北大核心 2018年第12期3551-3555,共5页
针对网络文本情感分析,提出了一种基于全卷积—多池化单元的卷积神经网络模型,实现情感多分类标注。无须手动指定多种上下文窗口大小和尽量保留文本的多层次语义,模型通过堆叠多级全卷积—多池化单元,提取出文本特征向量。该文本特征向... 针对网络文本情感分析,提出了一种基于全卷积—多池化单元的卷积神经网络模型,实现情感多分类标注。无须手动指定多种上下文窗口大小和尽量保留文本的多层次语义,模型通过堆叠多级全卷积—多池化单元,提取出文本特征向量。该文本特征向量包含多个抽象级别、多种上下文窗口大小和不同层次语义的文本特征。模型最后基于此向量计算情感多分类标注。实验表明,模型的网络文本情感多分类标注正确率达到56. 3%,与同类模型比较,提高了情感多分类标注的正确率。 展开更多
关键词 情感分析 情感多分类标注 卷积神经网络
下载PDF
非完美多分类标签体系下的领域短文本分类方法研究 被引量:1
5
作者 梁浩玮 王石 曹存根 《计算机科学》 CSCD 北大核心 2023年第1期185-193,共9页
近年来,短文本分类技术获得了广泛的研究。但在实际应用中,随着文本数据的积累,人们经常会遇到分类体系问题及其引起的数据分类标注问题,原因在于分类标签体系通常具有动态性,以及体系中的分类标签具有不易区分性。为此,文中结合分类标... 近年来,短文本分类技术获得了广泛的研究。但在实际应用中,随着文本数据的积累,人们经常会遇到分类体系问题及其引起的数据分类标注问题,原因在于分类标签体系通常具有动态性,以及体系中的分类标签具有不易区分性。为此,文中结合分类标签数量众多的某省电信投诉工单分析业务进行了具体分析,并提出了一种非完美多分类标签体系的概念模型。在此基础上,针对数据集中的分类标注冲突与遗漏,提出了一种基于高质量种子训练集的检测和半自动修复方法,用于修复分类体系动态性和人工标注错误导致的标注冲突和遗漏,经过6个月的线上运行,在过滤掉10%的分类置信度过低的投诉工单后,基于BERT的分类模型的F1值可达0.9。 展开更多
关键词 非完美多分类标签体系 细粒度短文本分类 分类标注 数据清洗
下载PDF
基于颜色特征和SVM的自然图像分类标注算法 被引量:2
6
作者 仲会娟 《绵阳师范学院学报》 2018年第5期12-16,共5页
针对传统的基于颜色特征图像分类算法运算复杂度高和图像误匹配等问题,提出了一种基于支持向量机的自然图像分类标注算法.该算法通过Matlab编程实践,在彩色空间量化中引入图像分块理论以解决全局直方图中空间位置信息缺失和色彩数量庞... 针对传统的基于颜色特征图像分类算法运算复杂度高和图像误匹配等问题,提出了一种基于支持向量机的自然图像分类标注算法.该算法通过Matlab编程实践,在彩色空间量化中引入图像分块理论以解决全局直方图中空间位置信息缺失和色彩数量庞大等问题,再通过支持向量机筛选出与待处理图像颜色特征相似的样本子库,以提高图像重建质量,保证图像分类精度.实验结果表明,该算法由于加大了中心位置图像子块的权重,能够更好地提取关键特征信息,保证了图像匹配精度,能比较准确地对图像进行分类标注. 展开更多
关键词 MATLAB HSV 颜色特征 支持向量机(SVM) 图像分类标注
下载PDF
基于改进的Mca-sLDA模型的图像分类和标注模型研究
7
作者 罗菊香 《荆楚理工学院学报》 2020年第5期73-81,共9页
从增强类标签和标注关联性出发进行验证研究,提出了一个类标签生成直接来自图像主题同时做图像分类和标注的概率主题模型,即改进的Mca-sLDA模型。给出了基于变分EM算法的模型参数推导过程以及使用该模型分类和标注图像的方法,并在两个... 从增强类标签和标注关联性出发进行验证研究,提出了一个类标签生成直接来自图像主题同时做图像分类和标注的概率主题模型,即改进的Mca-sLDA模型。给出了基于变分EM算法的模型参数推导过程以及使用该模型分类和标注图像的方法,并在两个真实数据集上对模型的分类和标注性能进行了验证。 展开更多
关键词 图像分类标注 变分EM Mca-sLDA模型
下载PDF
基于Corr-LDA-ITD模型同时做图像分类和标注
8
作者 罗菊香 《无线互联科技》 2020年第16期63-64,共2页
Corr-LDA-ITD模型是对Corr-LDA模型改进之后的图像标注概率主题模型,图像标注和分类之间可以相互促进,文章在Corr-LDA-ITD模型的基础上提出了同时做图像分类和标注的概率主题模型。基于变分EM算法推导了模型参数以及给出了该模型分类和... Corr-LDA-ITD模型是对Corr-LDA模型改进之后的图像标注概率主题模型,图像标注和分类之间可以相互促进,文章在Corr-LDA-ITD模型的基础上提出了同时做图像分类和标注的概率主题模型。基于变分EM算法推导了模型参数以及给出了该模型分类和标注图像的方法,并在真实数据集上对模型的分类和标注性能进行了验证。 展开更多
关键词 图像分类标注 变分EM Mca-sLDA模型
下载PDF
基于条件随机场的音乐共同语义标注 被引量:3
9
作者 何晓梅 《电子测量技术》 2016年第8期70-74,共5页
音乐的语义标注旨在使用词语或标签自动将一段音乐标注为一个语义标注集。通常,人们将多标注学习转换为独立二进制分类问题解决,再给每一个语义标注单独建模。为了得到更好的分类结果,应考虑标注之间的依赖关系。文章中尝试共同的音乐... 音乐的语义标注旨在使用词语或标签自动将一段音乐标注为一个语义标注集。通常,人们将多标注学习转换为独立二进制分类问题解决,再给每一个语义标注单独建模。为了得到更好的分类结果,应考虑标注之间的依赖关系。文章中尝试共同的音乐语义标注,对单标注和具有高相关性的成对标注同时建立模型。使用多标注条件随机场(CRF)模型直接参数化多标注分类中的共现标注。用到两种CRF模型,一种是使用无条件标注相关的共同多标注分类(CML)模型,另一种是使用有条件标注相关的考虑特征的共同多标注分类器(CMLF)模型。实验表明,将这两种模型用到CAL10K数据集上,平均精确度、宏F1分数和微F1分数比用高斯混合模型(GMM)给单个标注建模要高。 展开更多
关键词 标注分类 共现标注 CML模型 CMLF模型 CAL10K数据集
下载PDF
语料库建设中的名词标注方法
10
作者 韩蕾 《枣庄学院学报》 2009年第3期27-33,共7页
名词标注是语料库加工的重点和难点问题。兼顾形式和意义的句法语义一体化处理策略,是名词深加工的重要原则。把对大多数组合具有普遍解释力的语义特征构建成层级体系,并确立相应的形式识别标准,就可以将名词进行有效的分类与归类。我... 名词标注是语料库加工的重点和难点问题。兼顾形式和意义的句法语义一体化处理策略,是名词深加工的重要原则。把对大多数组合具有普遍解释力的语义特征构建成层级体系,并确立相应的形式识别标准,就可以将名词进行有效的分类与归类。我们对大量名词所做的组合特征标注实践证明,"特征即关系",名词组合属性的细致标注,对揭示双名直接组合模式与搭配规则能够起到很好的作用。 展开更多
关键词 语料库 名词 多层级分类标注
下载PDF
基于深度卷积神经网络模型的文本情感分类 被引量:17
11
作者 周锦峰 叶施仁 王晖 《计算机工程》 CAS CSCD 北大核心 2019年第3期300-308,共9页
为高效提取不同卷积层窗口的文本局部语义特征,提出一种深度卷积神经网络(CNN)模型。通过堆叠多个卷积层,提取不同窗口的局部语义特征。基于全局最大池化层构建分类模块,对每个窗口的局部语义特征计算情感类别得分,综合类别得分完成情... 为高效提取不同卷积层窗口的文本局部语义特征,提出一种深度卷积神经网络(CNN)模型。通过堆叠多个卷积层,提取不同窗口的局部语义特征。基于全局最大池化层构建分类模块,对每个窗口的局部语义特征计算情感类别得分,综合类别得分完成情感分类标注。实验结果表明,与现有CNN模型相比,该模型具有较快的文本情感分类速度。 展开更多
关键词 情感分析 情感分类标注 深度学习 卷积神经网络 词向量
下载PDF
面向工序建模的特征MBD设计信息提取方法 被引量:3
12
作者 刘世民 王海超 +4 位作者 鲍劲松 张小龙 郭国强 金永乔 郭具涛 《东华大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第4期532-540,共9页
为提供工序建模时所需的特征MBD(model based definition)设计信息,提出了面向工序建模的设计信息提取算法。以MBD模型为唯一依据,获取模型中的设计信息,搜寻设计信息的依附元素所在特征,依据其关联的特征将其分类为独立标注、关联标注... 为提供工序建模时所需的特征MBD(model based definition)设计信息,提出了面向工序建模的设计信息提取算法。以MBD模型为唯一依据,获取模型中的设计信息,搜寻设计信息的依附元素所在特征,依据其关联的特征将其分类为独立标注、关联标注与形状尺寸,最后以特征为单位输出相关的设计信息。试验表明,该方法能有效获取工序建模所需的特征MBD设计信息。 展开更多
关键词 基于模型的定义 标注提取 标注分类 工序建模
下载PDF
公安院校微型警务英语口语语料库的构建与应用 被引量:6
13
作者 刘震宇 《山东警察学院学报》 2014年第5期157-160,共4页
微型警务英语口语语料库的构建对公安院校警务英语教学研究、我国行业英语语料库的建设以及培养懂外语的复合型人才,服务于涉外警务工作具有重要的现实意义。从整体设计、语料搜集、分类标注三个步骤加强微型警务英语口语语料库的构建,... 微型警务英语口语语料库的构建对公安院校警务英语教学研究、我国行业英语语料库的建设以及培养懂外语的复合型人才,服务于涉外警务工作具有重要的现实意义。从整体设计、语料搜集、分类标注三个步骤加强微型警务英语口语语料库的构建,并根据微型警务英语口语语料库的特点和外语教学中的现实情况,尝试将其应用于公安院校的警务英语教学是一条可行的途径。 展开更多
关键词 微型警务英语口语语料库 整体设计 语料搜集 分类标注 应用
下载PDF
电子地图兴趣点分类自动标注算法研究 被引量:2
14
作者 杨小明 《网络安全技术与应用》 2015年第3期13-15,共3页
目前电子地图兴趣点(POI)分类标注主要采用人工判断方法,存在POI标注工作量大和频繁变动问题。本文研究了基于机器学习方法的POI分类自动标注算法,以已校准的POI数据为基础,首先对门店名称做中文分词预处理之后,建立短文本向量空间模型... 目前电子地图兴趣点(POI)分类标注主要采用人工判断方法,存在POI标注工作量大和频繁变动问题。本文研究了基于机器学习方法的POI分类自动标注算法,以已校准的POI数据为基础,首先对门店名称做中文分词预处理之后,建立短文本向量空间模型,然后采用信息增益方法,筛选出主要的分类特征词典,再基于朴素贝叶斯模型估算样本在各分类下选择概率。测试结果表明,该算法取得较高的正确率,可以替代人工判断。 展开更多
关键词 兴趣点 分类自动标注 向量空间模型 朴素贝叶斯模型
原文传递
思维导图在初中语文预习中的运用浅说——以《卖白菜》的预习指导为例 被引量:2
15
作者 瞿文亮 《作文成功之路(小学)》 2016年第11期I0010-I0010,共1页
运用思维导图原理能够帮助学生提高预习效果,比如有效提炼、归类知识点和技能点,清晰化把握文本,明确重难点,便于有效参与课堂活动。
关键词 思维导图 分类梳理标注重难点 纵横链接
下载PDF
艺术园区施工企业工程内业资料管理
16
作者 刘伟 张顺清 《重庆建筑》 2017年第6期70-71,共2页
工程内业资料在工程中起着很大作用,及时有效地收集、整理工程内业资料,可以了解工程施工的全过程。该文主要阐述了艺术园区施工企业工程内业资料管理的具体有效的操作方法与步骤,可供类似工程参考。
关键词 内业资料 资料整理 单项完成 竣工图 分类标注
下载PDF
基于BERT的领域本体分类关系自动识别研究 被引量:11
17
作者 王思丽 杨恒 +1 位作者 祝忠明 刘巍 《情报科学》 CSSCI 北大核心 2021年第7期75-82,共8页
【目的/意义】实现对领域本体分类关系的自动学习识别,解决领域本体知识框架结构体系的自动化构建问题。【方法/过程】通过对领域本体分类关系自动识别的国内外研究现状及存在问题进行分析总结,以当前开源的先进的深度学习文本预训练模... 【目的/意义】实现对领域本体分类关系的自动学习识别,解决领域本体知识框架结构体系的自动化构建问题。【方法/过程】通过对领域本体分类关系自动识别的国内外研究现状及存在问题进行分析总结,以当前开源的先进的深度学习文本预训练模型BERT为基础,研究构建了基于BERT的领域本体分类关系自动识别模型,并以资源环境学科领域为例进行了实验研究和评估分析。【结果/结论】基于BERT构建的分类模型能够实现对领域本体分类关系的自动识别,识别方法和流程具有极大地通用性和可移植性,识别精度比传统方法有了较大提升。【创新/局限】微调与泛化了BERT,提高了领域本体分类关系识别模型的通用性和精度。但由于受分类标注语料的质量限制,模型精度尚未达到峰值,有待进一步优化提升。 展开更多
关键词 深度学习 领域本体 分类关系识别 分类标注 BERT 特征表示
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部