期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
期刊论文结构化数据加工存储标准的研究与探索 被引量:1
1
作者 彭劲松 李璐 《数字出版研究》 2024年第2期57-64,共8页
期刊论文结构化加工在期刊界已经逐步形成共识,国内期刊平台多采用新版期刊文章标签集(Journal Article Tag Suite,JATS)标准进行加工,但JATS标准仅对数据属性提出建议值,自行拓展空间较大,导致实际的数据加工结果千差万别,数据交换困... 期刊论文结构化加工在期刊界已经逐步形成共识,国内期刊平台多采用新版期刊文章标签集(Journal Article Tag Suite,JATS)标准进行加工,但JATS标准仅对数据属性提出建议值,自行拓展空间较大,导致实际的数据加工结果千差万别,数据交换困难重重。本文分析了国内外数字化加工和标准进化的历程及我国在XML结构化数据加工中存在的问题,进一步分析了存档及交换标签集、出版标签集等不同子集的特点,提出既能完整保留论文原始信息,又便于提取各类结构化信息的数据加工及存储解决方案,可以根据需要通过减法转换生成符合各平台标准的数据加工存储格式,从而真正实现一次加工、多渠道投放和传播。 展开更多
关键词 期刊论文结构化 JATS 存档及交换标签集 出版标签集 数据加工存储标准 XML
下载PDF
基于Rough Sets和模糊神经网络的汉语兼类词词性标注规则的获取方法 被引量:1
2
作者 支天云 张仰森 《计算机工程与应用》 CSCD 北大核心 2002年第12期89-91,230,共4页
文章提出了基于RoughSets的汉语兼类词初始标注规则的获取方法,并通过模糊神经网络(FNN)进行优化,最后再进行简化获取模糊规则;文章以人工标注过的句子作为训练集和测试集,得出了训练集左3、左4、右3、右4个兼类词标注规则库;对同样的... 文章提出了基于RoughSets的汉语兼类词初始标注规则的获取方法,并通过模糊神经网络(FNN)进行优化,最后再进行简化获取模糊规则;文章以人工标注过的句子作为训练集和测试集,得出了训练集左3、左4、右3、右4个兼类词标注规则库;对同样的训练集和测试集,采用统计二元模型进行标注后,再利用该方法(粗糙模糊神经网络方法,简称RSFNN)进行二次标注,结果表明RSFNN方法优于统计二元模型方法。最后实例说明汉语兼类词词性标注规则的获取方法。 展开更多
关键词 模糊神经网络 词性标注规则 汉语兼类词 粗糙集理论 自然语音处理
下载PDF
利用随机扰动特性的集合覆盖蚁群算法识别tag SNPs 被引量:1
3
作者 王丽美 王龙香 郑程友 《宜宾学院学报》 2015年第6期81-85,共5页
序列中的标签SNPs-tag SNPs携带了SNPs数据集的绝大部分遗传信息,因此寻找tag SNPs意义重大.但从SNPs数据集中找出tag SNPs需要耗费巨大的计算量,传统的方法效率低且费用昂贵,对于复杂的集合覆盖问题,现有算法难以得到优化解.鉴于蚁群... 序列中的标签SNPs-tag SNPs携带了SNPs数据集的绝大部分遗传信息,因此寻找tag SNPs意义重大.但从SNPs数据集中找出tag SNPs需要耗费巨大的计算量,传统的方法效率低且费用昂贵,对于复杂的集合覆盖问题,现有算法难以得到优化解.鉴于蚁群算法有较强的近优解搜索能力,提出具有随机扰动特性的集合覆盖蚁群算法(RCACO)用于tag SNPs搜索.模拟数据集上进行的算法实验结果表明,与近两年的PSO、GA两类算法相比,所提出的算法运行时间较短,搜索结果精确度更高. 展开更多
关键词 tag SNPS 集合覆盖 蚁群算法 随机扰动
下载PDF
Morpho-Syntactic Tagging of Text in “Baoule” Language Based on Hidden Markov Models (HMM)
4
作者 Hyacinthe Konan Bi Tra Gooré +1 位作者 Raymond Gbégbé Olivier Asseu 《Journal of Software Engineering and Applications》 2016年第10期516-523,共9页
The label text is a very important tool for the automatic processing of language. It is used in several applications such as morphological and syntactic text analysis, index-ing, retrieval, finished networks determini... The label text is a very important tool for the automatic processing of language. It is used in several applications such as morphological and syntactic text analysis, index-ing, retrieval, finished networks deterministic (in which all combinations of words that are accepted by the grammar are listed) or by statistical grammars (e.g., an n-gram in which the probabilities of sequences of n words in a specific order are given), etc. In this article, we developed a morphosyntactic labeling system language “Baoule” using hidden Markov models. This will allow us to build a tagged reference corpus and rep-resent major grammatical rules faced “Baoule” language in general. To estimate the parameters of this model, we used a training corpus manually labeled using a set of morpho-syntactic labels. We then proceed to an improvement of the system through the re-estimation procedure parameters of this model. 展开更多
关键词 CORPUS the set of tags the Morpho-Syntactic tagging “Baoule” Language Hidden Markov Model
下载PDF
EPC RFID标签芯片OSC频率校准方法及OSC电路
5
作者 孔令荣 傅霖煌 陈晶 《现代电子技术》 2023年第8期21-25,共5页
为解决EPC振荡器的性能差和功耗高的问题,介绍一种EPC C1G2无源RFID电子标签芯片OSC的频率校准方法。基于伪锁相环的理论,利用UHF RFID阅读器下发指令帧头的特定字符作为时间基准,校准RFID标签芯片振荡器的工作频率,将振荡器的频率调整... 为解决EPC振荡器的性能差和功耗高的问题,介绍一种EPC C1G2无源RFID电子标签芯片OSC的频率校准方法。基于伪锁相环的理论,利用UHF RFID阅读器下发指令帧头的特定字符作为时间基准,校准RFID标签芯片振荡器的工作频率,将振荡器的频率调整到目标频率,克服因半导体工艺误差引起的振荡器频率偏差,满足UHF RFID标签对振荡器频率偏差的要求。实验结果表明,芯片只需在出厂前进行一次频率校准,并把校准参数存储在芯片的非挥发存储器中,之后在芯片上电时只需从存储器中读取相应的频率校准参数进行设置,而无需再次校准。 展开更多
关键词 频率校准 标签芯片OSC EPC振荡器 射频识别 参数设置 OSC电路 电路测试
下载PDF
基于标签的数据流转控制策略冗余与冲突检测方法 被引量:1
6
作者 谢绒娜 范晓楠 +2 位作者 李苏浙 黄宇欣 史国振 《网络与信息安全学报》 2023年第5期21-32,共12页
基于标签的数据流转控制机制通过主客体标签实现数据流转控制,具有轻量级、延伸控制的优势,引起了广泛关注。数据流转时,标签变更不可避免,而在标签变更时,新标签与已有标签难免存在冗余或者冲突。如何对标签进行冗余与冲突检测是基于... 基于标签的数据流转控制机制通过主客体标签实现数据流转控制,具有轻量级、延伸控制的优势,引起了广泛关注。数据流转时,标签变更不可避免,而在标签变更时,新标签与已有标签难免存在冗余或者冲突。如何对标签进行冗余与冲突检测是基于标签的数据流转控制中急需解决的问题。针对上述问题,提出了基于原子操作的标签描述方法。客体标签由多个原子标签的逻辑组合生成。其中,原子标签用于描述最小的安全需求,解决了标签描述简洁性和丰富性问题。为降低标签冗余与冲突检测难度、提高检测效率,基于标签中不同集合的相关性,提出了基于标签的数据流转控制策略冗余与冲突检测方法。该方法通过分析原子标签中各要素的集合关系对原子标签进行冗余与冲突检测,基于原子标签检测结果和逻辑关系对客体标签进行检测,提高了检测效率;基于不同原子标签中包含操作的关系对原子标签进行冗余与冲突检测,对于包含相同操作的不同原子标签,通过分析不同原子标签中主体属性、环境属性以及规则类型之间关系进行检测,对于包含不同操作的原子标签,如果不同操作之间没有关系,那么原子标签不存在冗余与冲突,如果不同操作之间存在偏序关系,则通过分析不同原子标签中操作的偏序关系、主体属性、环境属性以及规则类型之间关系进行检测。从理论和实验两个角度对提出的冗余与冲突检测方法性能进行分析,通过实验验证了原子标签数量和复杂度对检测性能的影响。 展开更多
关键词 标签 数据流转控制 原子标签 集合相关性 策略冗余与冲突检测
下载PDF
基于标签集相关性学习的驾驶员异常行为预警方法
7
作者 李光华 张洪涛 +1 位作者 谢凤祥 韩名亮 《电子设计工程》 2023年第2期160-165,共6页
目前研究的驾驶员异常行为预警方法,由于用户对于预警信号的理解能力较差,不能在短时间内迅速作出预警反应,导致安全风险较高。为了解决上述问题,提出基于标签集相关性学习的驾驶员异常行为预警方法。分别采用车辆颜色特征、纹理特征以... 目前研究的驾驶员异常行为预警方法,由于用户对于预警信号的理解能力较差,不能在短时间内迅速作出预警反应,导致安全风险较高。为了解决上述问题,提出基于标签集相关性学习的驾驶员异常行为预警方法。分别采用车辆颜色特征、纹理特征以及梯度特征作为车辆异常表征分析,通过梯度特征捕获到驾驶员的瞬时行为,研究颜色特征、纹理特征以及梯度特征之间存在的关联性,利用协方差描述因子对图像数据帧区域的信息进行获取,然后按照各个特征的特点,进行特征提取。应用标签集相关性学习方法,对驾驶员异常行为等级进行划分,设定三种异常行为等级,根据相关等级,给出不同的预警信号,采用语音、视觉以及感知三重叠加预警模式确保用户可以在短时间内发现异常行为。实验结果表明,基于标签集相关性学习的驾驶员异常行为预警方法能够帮助用户快速发现自己的异常行为,用户预警反应时间提高了50%以上,对于用户安全驾驶有重要意义。 展开更多
关键词 标签集 相关性学习 驾驶员行为 异常行为 行为预警
下载PDF
基于条件随机场的藏文人名识别研究 被引量:10
8
作者 康才畯 龙从军 江荻 《计算机工程与应用》 CSCD 北大核心 2015年第3期109-111,185,共4页
基于条件随机场模型在字粒度上识别并切分藏文人名,其优势是可以较好地利用藏文人名在文本中出现的基本特征和上下文特征来确定藏文人名在文本序列中的边界。根据藏文人名自身的特点设定特征标签集,利用条件随机场模型作为标注建模工具... 基于条件随机场模型在字粒度上识别并切分藏文人名,其优势是可以较好地利用藏文人名在文本中出现的基本特征和上下文特征来确定藏文人名在文本序列中的边界。根据藏文人名自身的特点设定特征标签集,利用条件随机场模型作为标注建模工具来进行训练和测试。从实验结果来看,该方法有较高的识别正确率,具有进一步研究的价值。下一步的改进需要扩充训练语料,并针对人名与一般词语同形现象进行特征标签集的优化。 展开更多
关键词 藏文人名 条件随机场 特征标签集
下载PDF
基于最大熵模型的词位标注汉语分词 被引量:8
9
作者 于江德 王希杰 樊孝忠 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期70-74,共5页
近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要... 近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要,采用不同的词位标注集,使用最大熵模型进一步研究了词位标注汉语分词技术.在国际汉语分词评测Bakeoff2005的语料上进行了封闭测试,并对比了不同词位标注集对分词性能的影响.实验表明所采用的六词位标注集配合相应的特征模板集TMPT-6较其他词位标注集分词性能要好. 展开更多
关键词 汉语分词 词位标注 最大熵模型 词位标注集 特征模板
下载PDF
利用扩展标记集的词结构分析 被引量:2
10
作者 孙静 方艳 +1 位作者 丁彬 周国栋 《中文信息学报》 CSCD 北大核心 2014年第5期39-45,82,共8页
该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部... 该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部结构识别问题转换成序列标注问题,通过扩展标记集,采用CRF模型来实现词的内部结构分析。最终实验表明,无论是在总体性能上,还是在各层结构的识别上都取得了较高的准确度。 展开更多
关键词 扩展标记集 词结构分析 前后缀 序列标注问题
下载PDF
基于BI-LSTM-CRF模型的中文分词法 被引量:21
11
作者 张子睿 刘云清 《长春理工大学学报(自然科学版)》 2017年第4期87-92,共6页
递归神经网络能够很好地处理序列标记问题,已被广泛应用到自然语言处理(NLP)任务中。提出了一种基于长短期记忆(LSTM)神经网络改进的双向长短期记忆条件随机场(BI-LSTM-CRF)模型,不仅保留了LSTM能够利用上下文信息的特性,同时能够通过CR... 递归神经网络能够很好地处理序列标记问题,已被广泛应用到自然语言处理(NLP)任务中。提出了一种基于长短期记忆(LSTM)神经网络改进的双向长短期记忆条件随机场(BI-LSTM-CRF)模型,不仅保留了LSTM能够利用上下文信息的特性,同时能够通过CRF层考虑输出标签之间前后的依赖关系。利用该分词模型,通过加入预训练的字嵌入向量,以及使用不同词位标注集在Bakeoff2005数据集上进行的分词实验,结果表明:BI-LSTM-CRF模型比LSTM和双向LSTM模型具有更好的分词性能,同时具有很好地泛化能力;相比四词位,采用六词位标注集的神经网络模型能够取得更好的分词性能。 展开更多
关键词 中文分词 BI-LSTM-CRF 词位标注
下载PDF
基于位置标签与词性结合的组合词抽取方法 被引量:3
12
作者 欧阳柳波 周伟光 《计算机应用研究》 CSCD 北大核心 2016年第4期1062-1065,共4页
现有分词系统不能及时收录新词语,因而不能有效识别领域组合词。针对此问题,提出一种位置标签与词性相结合的组合词抽取方法。首先对语料进行文本预处理、添加位置标签、加权词频过滤等建立词条的位置标签集;然后依据位置标签集计算词... 现有分词系统不能及时收录新词语,因而不能有效识别领域组合词。针对此问题,提出一种位置标签与词性相结合的组合词抽取方法。首先对语料进行文本预处理、添加位置标签、加权词频过滤等建立词条的位置标签集;然后依据位置标签集计算词条在句子中的相邻度判定组合词;最后制定反规则对抽取结果进行过滤,并对垃圾串进行两端逐步消减再判定进一步识别组合词。通过在不同语料库上进行实验,结果表明本方法具有更高的准确率。 展开更多
关键词 组合词抽取 位置标签集 相邻度 反规则过滤 新词发现
下载PDF
《信息处理用现代汉语词类标记规范》修订研究 被引量:1
13
作者 杨丽姣 肖航 刘智颖 《语言文字应用》 CSSCI 北大核心 2021年第3期111-120,共10页
《信息处理用现代汉语词类标记规范》是汉语语言信息处理和语料库建设中关于词类划分和标注的重要参考标准。本次修订的核心内容有两项:一是以完善规范和满足应用需要为导向,对基本词类、其他切分单位及其小类进行了修订,提升了规范的... 《信息处理用现代汉语词类标记规范》是汉语语言信息处理和语料库建设中关于词类划分和标注的重要参考标准。本次修订的核心内容有两项:一是以完善规范和满足应用需要为导向,对基本词类、其他切分单位及其小类进行了修订,提升了规范的严谨性和适用性;二是提出了词类标记的组合应用原则,规定非词切分单位可以在类属标记之外,组合附加词类标记代码,以更全面准确地标注其语法功能。规范修订审慎处理了词类体系、词类划分、标记代码三者关系,为词与非词切分单位的语法功能标注提供了更科学合理的方案,提升了规范的科学性、实用性和可操作性。 展开更多
关键词 词类 标记集 词类标注 规范标准 修订
下载PDF
《信息处理用现代汉语词类标记规范》修订方案 被引量:1
14
作者 杨丽姣 肖航 刘智颖 《语言文字应用》 CSSCI 北大核心 2019年第3期87-95,共9页
《信息处理用现代汉语词类标记规范》的研制顺应了语言资源建设和信息处理研究的需要,颁布实施后为语料库和信息处理系统词类标记的规范化起到了基础性和参照性作用,但随着理论研究和应用实践的发展,其局限也日益凸显。本文在总结规范... 《信息处理用现代汉语词类标记规范》的研制顺应了语言资源建设和信息处理研究的需要,颁布实施后为语料库和信息处理系统词类标记的规范化起到了基础性和参照性作用,但随着理论研究和应用实践的发展,其局限也日益凸显。本文在总结规范修订前期工作的基础上,对修订思路和修订策略进行阐述,提出了拟通过规范修订解决的主要问题,并说明了拟修订调整的内容要点。本文认为,本着积极稳妥、吸收包容的原则,反映词类研究的新成果,体现语言资源建设的新实践,满足语言信息处理研究的新需要,处理好词类体系、词类划分、标记代码三者关系,处理好兼类标注问题,适当调整大类和小类,是制定修订方案的重点。 展开更多
关键词 词类 词类标注 标记集 标记规范 标准修订
下载PDF
现代维吾尔语词干词类标注标记集验证性研究 被引量:2
15
作者 艾孜尔古丽 米尔夏提 玉素甫.艾白都拉 《计算机工程与科学》 CSCD 北大核心 2015年第12期2318-2323,共6页
以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;... 以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;其次讨论《信息处理用现代维吾尔语词干词类标注标记集》的基本情况和多策略现代维吾尔语词干标注系统模型设计与算法;最后分析现代维吾尔语词性标注标记集验证结果,并验证《信息处理用现代维吾尔语词干词类标注标记集》的科学性,补充和改正部分词类的语义分类及标注代码,提出了规范的扩充建议。 展开更多
关键词 现代维吾尔语词干 词类标注 标记集 验证
下载PDF
用于引文内容分析的标准化数据集构建 被引量:21
16
作者 张梦莹 卢超 +1 位作者 郑茹佳 章成志 《图书馆论坛》 CSSCI 北大核心 2016年第8期48-53,共6页
学术论文的全文数据越来越容易获取使大规模的引文内容分析成为可能。文章通过设计引文内容标注框架,开发引文内容标注系统,分别从引用对象、引文功能、引用情感、引文位置、引文重要性、标注自信度等方面进行标注。构建用于引文内容分... 学术论文的全文数据越来越容易获取使大规模的引文内容分析成为可能。文章通过设计引文内容标注框架,开发引文内容标注系统,分别从引用对象、引文功能、引用情感、引文位置、引文重要性、标注自信度等方面进行标注。构建用于引文内容分析的标准化数据集并进行统计分析,可为引文内容的特征分析等基础性研究及学术预测等应用性研究提供数据支撑。 展开更多
关键词 引文内容分析 引文标注系统 标准化数据集 引用功能 引用情感倾向
下载PDF
OPAC与“美味书签”相结合的学术资源导航系统构建探索 被引量:3
17
作者 任家乐 雷若寒 姜晓 《图书馆杂志》 CSSCI 北大核心 2010年第6期21-24,20,共5页
分析了MARC数据的缺陷,提出了OPAC与美味书签结合检索的必要性。通过实证研究的方法,解决了OPAC与美味书签的相互转换。认识到虽然美味书签学术资源导航系统构建中仍存在着一些问题,但是美味书签与OPAC相结合的检索方式,对于网络资源分... 分析了MARC数据的缺陷,提出了OPAC与美味书签结合检索的必要性。通过实证研究的方法,解决了OPAC与美味书签的相互转换。认识到虽然美味书签学术资源导航系统构建中仍存在着一些问题,但是美味书签与OPAC相结合的检索方式,对于网络资源分类整理,拓宽读者视野,提高检索效率具有重要意义。 展开更多
关键词 美味书签 标签 OPAC DOI 自由分类法 复合检索
下载PDF
应用粗糙集理论提取特征的词性标注模型 被引量:3
18
作者 姜维 王晓龙 +1 位作者 关毅 徐志明 《高技术通讯》 CAS CSCD 北大核心 2006年第10期996-1000,共5页
针对词性标注中的复杂特征提取问题,应用粗糙集理论(rough sets),有效地挖掘了包括长距离特征在内的复杂特征,并有效地处理了语料库噪声问题.最后,将这些特征融合于最大熵模型中,训练时按模型整体性能为其分配权重.开放实验表明:增... 针对词性标注中的复杂特征提取问题,应用粗糙集理论(rough sets),有效地挖掘了包括长距离特征在内的复杂特征,并有效地处理了语料库噪声问题.最后,将这些特征融合于最大熵模型中,训练时按模型整体性能为其分配权重.开放实验表明:增加粗规则后获得96.29%的标注精度,相比原有模型提高了0.83%. 展开更多
关键词 粗糙集 特征提取 词性标注
下载PDF
RFID防碰撞算法计算机仿真模型的研究 被引量:2
19
作者 李宝山 罗春青 《自动化与仪器仪表》 2010年第5期13-14,共2页
对RFID物理组成结构进行了分析,并提出了由读写器、标签集、收发器、中间媒介和噪声五部分组成的防碰撞算法仿真模型,可以利用此模型对防碰撞算法进行算法设计和研究。
关键词 防碰撞 仿真 标签集
下载PDF
汉语语料词性标注自动校对方法的研究 被引量:11
20
作者 钱揖丽 郑家恒 《中文信息学报》 CSCD 北大核心 2004年第2期30-35,共6页
兼类词的词类排歧是汉语语料词性标注中的难点问题 ,它严重影响语料的词性标注质量。针对这一难点问题 ,本文提出了一种兼类词词性标注的自动校对方法。它利用数据挖掘的方法从正确标注的训练语料中挖掘获取有效信息 ,自动生成兼类词词... 兼类词的词类排歧是汉语语料词性标注中的难点问题 ,它严重影响语料的词性标注质量。针对这一难点问题 ,本文提出了一种兼类词词性标注的自动校对方法。它利用数据挖掘的方法从正确标注的训练语料中挖掘获取有效信息 ,自动生成兼类词词性校对规则 ,并应用获取的规则实现对机器初始标注语料的自动校对 ,从而提高语料中兼类词的词性标注质量。分别对 5 0万汉语语料做封闭测试和开放测试 ,结果显示 ,校对后语料的兼类词词性标注正确率分别可提高 11 32 %和 5 97%。 展开更多
关键词 计算机应用 中文信息处理 兼类词 汉语词性标注 自动校对 粗糙集
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部