期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
汉英双语标注集的研究与实现 被引量:2
1
作者 杨沐昀 李生 赵铁军 《情报学报》 CSSCI 北大核心 2000年第5期464-469,共6页
标注集是任何自然语言处理研究中的知识表达基础。本文结合汉英双向机器翻译开发和双语语料库加工的实践 ,提出了建立标准的汉英双语标注集的必要性 ,探讨了该标注集设计过程中遇到的几个关键问题并给出了一个比较完备的汉英双语标注集... 标注集是任何自然语言处理研究中的知识表达基础。本文结合汉英双向机器翻译开发和双语语料库加工的实践 ,提出了建立标准的汉英双语标注集的必要性 ,探讨了该标注集设计过程中遇到的几个关键问题并给出了一个比较完备的汉英双语标注集解决方案。实践证明 ,该方案具有良好的开放性和兼容性 ,对于汉英双向机器翻译系统和汉英双语语料库研究都具有适用性。 展开更多
关键词 标注集 英语 汉语 双语语料库 机器翻译
下载PDF
英汉对比视角下的中英文词性标注集分析 被引量:1
2
作者 李晓雨 《海外英语》 2017年第3期191-192,共2页
计算所汉语词性标记集(ICTPOS3.0)和CLAWS7 POS Tagset词性赋码集是当前对中文和英文赋码准确率较高,同时接受程度较高的两个词性标注集。该文试以名词作为出发点,描写不同语言特点下词性赋码的异同。标注可以为语料库带来增值,因而就... 计算所汉语词性标记集(ICTPOS3.0)和CLAWS7 POS Tagset词性赋码集是当前对中文和英文赋码准确率较高,同时接受程度较高的两个词性标注集。该文试以名词作为出发点,描写不同语言特点下词性赋码的异同。标注可以为语料库带来增值,因而就要求对标注进行不断地优化,以提高准确率。希望通过对中英文词性标注集的对比能使两个标注集进行互补优化。 展开更多
关键词 英汉对比 名词特征 中英文词性标注集
下载PDF
方块苗文词性标注集的设计 被引量:1
3
作者 周潭 莫礼平 +3 位作者 曾虎 雷智 李文宇 吴莹 《智能计算机与应用》 2019年第1期131-134,共4页
词性标注集是计算机处理自然语言时进行词类表示的工具。任何自然语言的词性标注都必须以词性标注集为基础。本文根据方块苗文信息化的实际需要,结合方块苗文的造字原理及词语的使用特点,在介绍对词性标注及标注集相关概念的基础上,参... 词性标注集是计算机处理自然语言时进行词类表示的工具。任何自然语言的词性标注都必须以词性标注集为基础。本文根据方块苗文信息化的实际需要,结合方块苗文的造字原理及词语的使用特点,在介绍对词性标注及标注集相关概念的基础上,参考汉语词性标注规范设计方法,基本确定了方块苗文的词性和种类,设计了方块苗文的词性标注符号和基于语法范畴的分类标记体系;初步制订了用于方块苗文信息处理领域的词性标注集,在某种意义上为方块苗文词性标注建立了参考标准。 展开更多
关键词 自然语言处理 方块苗文 词性标注 词性标注集
下载PDF
人工智能囊胚形态评估数据集构建与质控专家共识
4
作者 王浩 张孝东 +25 位作者 孙莹璞 孙海翔 邓成艳 黄学锋 刘平 周灿权 冯云 郝桂敏 卢文红 沈浣 师娟子 张松英 滕晓明 王晓红 王秀霞 伍琼芳 全松 曾勇 钟影 邵小光 柯林楠 毛歆 韩倩倩 黄国宁 中华医学会生殖医学分会第五届委员会 中国食品药品检定研究院 《生殖医学杂志》 CAS 2024年第7期843-851,共9页
囊胚形态人工智能(AI)评估是AI医疗器械发展的新兴方向,也是AI在辅助生殖领域的重要应用。AI在新领域应用的起步阶段,数据集的构建与质控对产品质量有重要影响。目前,囊胚形态学AI评估在数据采集、标注、质控等方面尚未形成统一的规范... 囊胚形态人工智能(AI)评估是AI医疗器械发展的新兴方向,也是AI在辅助生殖领域的重要应用。AI在新领域应用的起步阶段,数据集的构建与质控对产品质量有重要影响。目前,囊胚形态学AI评估在数据采集、标注、质控等方面尚未形成统一的规范。在参考AI医疗器械、辅助生殖医疗器械现有国家行业标准的基础上,本文以囊胚形态AI评估数据集为主题,对数据集构建与质控要求进行了探讨,对数据集质量特性进行了解析,旨在指导数据集制造责任方加强数据集全生命周期管理,更好地为产品研发、测试、临床试验等环节提供质量保障,助力产业发展。 展开更多
关键词 人工智能(AI) 囊胚形态评估 数据构建 数据标注 数据质量控制
下载PDF
基于Penn Treebank英语标注集对《圣经》标注集的扩充研究
5
作者 张晨 祁坤钰 《才智》 2009年第20期184-184,共1页
标注集是词性标注的前提,根据语料的不同确定一个准确详细的标注集尤其重要,本文通过对《圣经》的词性标注,对Penn Treebank标注集进行了扩充,为进一步对《圣经》中的词法和句法特点的研究奠定了基础。
关键词 标注集 词性标注 扩充
原文传递
集团公司标注厂名和厂址的规定
6
《山东肉类科技》 CAS 1997年第2期6-6,共1页
国家技术监督局“关于集团公司如何执行《产品质量法】第十五条有关规定意见”中,对于在我国依法组建的集团公司(包括集团有限责任公司和集团股份有限公司)如何执行《产品质量法》第十五条规定,在生产的产品或其包装上标注“生产厂厂名... 国家技术监督局“关于集团公司如何执行《产品质量法】第十五条有关规定意见”中,对于在我国依法组建的集团公司(包括集团有限责任公司和集团股份有限公司)如何执行《产品质量法》第十五条规定,在生产的产品或其包装上标注“生产厂厂名和厂址”的问题,明确规定如下: 依法独立承担法律责任的集团公司或者其子公司,对其生产的产品,应当标注各自的名称。 展开更多
关键词 企业名称 商标管理法规 《产品质量法》 生产厂厂名 有限责任公司 股份有限公司 标注集 生产基地 国家技术监督局 广告监督管理
下载PDF
信息处理用维语词汇标注标记集的确定 被引量:4
7
作者 玉素甫.艾白都拉 阿不都热依木.沙力 阿拉帕提古丽 《计算机应用》 CSCD 北大核心 2009年第7期2006-2008,共3页
介绍了研究和制定信息处理用维语标注标记集的研究进展。讨论了研究与制订"维语标注标记集"必要性,说明了只靠语法角度提出的词汇一级"维语标注标记集"的有限性,论述国内外英语、汉语层次分析研究的最新成果,结合... 介绍了研究和制定信息处理用维语标注标记集的研究进展。讨论了研究与制订"维语标注标记集"必要性,说明了只靠语法角度提出的词汇一级"维语标注标记集"的有限性,论述国内外英语、汉语层次分析研究的最新成果,结合维语的本身特点研究维语语义分类体系迫切性,给出了"维语标注标记集"的工作思路、标记集制定的原则和语法语义词汇一级词性标记集的内容,比较了标记集两个版本的特点,展望了其发展。 展开更多
关键词 维吾尔语 信息处理 标注标记
下载PDF
基于最大熵模型的词位标注汉语分词 被引量:8
8
作者 于江德 王希杰 樊孝忠 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期70-74,共5页
近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要... 近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要,采用不同的词位标注集,使用最大熵模型进一步研究了词位标注汉语分词技术.在国际汉语分词评测Bakeoff2005的语料上进行了封闭测试,并对比了不同词位标注集对分词性能的影响.实验表明所采用的六词位标注集配合相应的特征模板集TMPT-6较其他词位标注集分词性能要好. 展开更多
关键词 汉语分词 词位标注 最大熵模型 词位标注集 特征模板
下载PDF
依据MBD技术的船舶数据集定义与标注方法
9
作者 邵明智 李细红 +1 位作者 冯帮顺 方伟 《造船技术》 2021年第3期80-83,共4页
依据基于模型定义(Model Based Definition,MBD)技术开展船舶数据集定义与标注方法研究。介绍MBD技术和MBD数据集,提出船体专业和舾装专业的船舶MBD数据集定义方法及船舶MBD数据集标注方法,为造船企业应用MBD技术提高船舶生产设计水平... 依据基于模型定义(Model Based Definition,MBD)技术开展船舶数据集定义与标注方法研究。介绍MBD技术和MBD数据集,提出船体专业和舾装专业的船舶MBD数据集定义方法及船舶MBD数据集标注方法,为造船企业应用MBD技术提高船舶生产设计水平提供参考。 展开更多
关键词 船舶 MBD 生产设计 数据定义方法 数据标注方法
下载PDF
基于HMM的藏语语料库词性自动标注研究 被引量:6
10
作者 苏俊峰 祁坤钰 本太 《西北民族大学学报(自然科学版)》 2009年第1期42-45,共4页
针对藏语区别于英语和汉语,分析藏语的构形特征,得到词性标注集.从人工标注的语料中统计词和词性频率以及训练得到二元语法的HMM模型参数,运用Viterbi算法完成基于统计方法的词性标注.
关键词 藏语词性标注 词性标注集 HMM
下载PDF
面向人工智能的传统音乐标注数据集构建研究——兼论多模态胡琴标注数据集的建设与应用
11
作者 张宇 孙茂松 《中央音乐学院学报》 北大核心 2024年第2期66-83,共18页
当前人工智能在音乐方面的研究和应用主要集中在西方古典音乐和流行音乐等领域。以世界各地的传统音乐为对象的相关研究仍然处于初级阶段,其中一个主要原因是缺乏高质量的数据集和标注规范。文章从数据的内容、标注和应用等方面,探讨了... 当前人工智能在音乐方面的研究和应用主要集中在西方古典音乐和流行音乐等领域。以世界各地的传统音乐为对象的相关研究仍然处于初级阶段,其中一个主要原因是缺乏高质量的数据集和标注规范。文章从数据的内容、标注和应用等方面,探讨了传统音乐标注数据集的发展现状。基于对当前研究的深入分析,文章提出了面向人工智能的音乐标注数据集的构建原则,并针对传统音乐的特点加以阐述。在此基础上,以第一个中国胡琴音乐标注数据集(CCOM-HuQin)为例介绍了数据集在人工智能领域的研究成果和应用前景。文章强调了人工智能应用于传统音乐的意义不仅在于辅助创作和表演,更是为了促进传统音乐的保护、传承和发展。 展开更多
关键词 人工智能 标注数据 音乐信息检索 传统音乐 胡琴
原文传递
基于HMM的维吾尔语词性标注研究 被引量:1
12
作者 李萍 杨勇 +1 位作者 赛买提.艾力 任鸽 《现代计算机》 2017年第5期11-14,共4页
在维吾尔语与汉语的机器翻译的研究中,词性标注起到很大的作用,词性标注也是自然语言处理的基础性工作。介绍基于隐马尔可夫模型的词性标注算法和词性标注器Citar,并且将Citar标注器应用到维吾尔语上进行词性标注。为了能对维吾尔语进... 在维吾尔语与汉语的机器翻译的研究中,词性标注起到很大的作用,词性标注也是自然语言处理的基础性工作。介绍基于隐马尔可夫模型的词性标注算法和词性标注器Citar,并且将Citar标注器应用到维吾尔语上进行词性标注。为了能对维吾尔语进行词性标注,在在布朗词性标注集的基础上,定义一套适用于维吾尔语的词性标注集,采用基于隐马尔可夫模型的方法,对部分维吾尔语进行词性标注实验,经过实验表明,Citar标注器能准确对维吾尔语进行词性标注,从而表明此标注器适用于维吾尔语。 展开更多
关键词 机器翻译 词性标注 隐马尔可夫模型 词性标注集 维吾尔语
下载PDF
基于统计的汉语词性自动标注方法 被引量:2
13
作者 白栓虎 《语文建设》 CSSCI 北大核心 1994年第10期38-40,共3页
基于统计的汉语词性自动标注方法白栓虎一词性标注的统计方法所谓词性自动标注,就是利用计算机根据上下文判定在给定句子中每个词的语法范畴。一般来说,用统计方法进行词性自动标注要作以下工作。首先要制订词性标记集,然后人工标注... 基于统计的汉语词性自动标注方法白栓虎一词性标注的统计方法所谓词性自动标注,就是利用计算机根据上下文判定在给定句子中每个词的语法范畴。一般来说,用统计方法进行词性自动标注要作以下工作。首先要制订词性标记集,然后人工标注一定数量的语料,对语料中每一个词给... 展开更多
关键词 自动标注 语法范畴 汉语研究 自然语言处理 语法体系 语法标记 人工标注 意义标准 朱德熙先生 标注集
下载PDF
基于多通道卷积神经网络的非结构化数据标注 被引量:1
14
作者 米启超 赵红梅 林丽萍 《计算机仿真》 北大核心 2021年第6期400-404,共5页
非结构化数据存在差异性,对标注模型的构建存在不足,影响标注质量。提出基于多通道卷积神经网络的非结构化数据标注方法。建立Hive分布式查询框架,对其中与标注目标相关的数据进行相似性查找,同时建立众包标注集,确定相关标注概念。对... 非结构化数据存在差异性,对标注模型的构建存在不足,影响标注质量。提出基于多通道卷积神经网络的非结构化数据标注方法。建立Hive分布式查询框架,对其中与标注目标相关的数据进行相似性查找,同时建立众包标注集,确定相关标注概念。对标注集中的标注差异性,利用多通道卷积神经网络对其差异性进行确认,并确定标注任务函数。利用标注任务函数,建立任务标注模型,利用模型中求得函数解值完成标注任务。为了验证设计的非结构化数据标注方法的可行性,实验结果证明设计方法下得到的标注质量更高,方法性能更好,满足设计初衷。 展开更多
关键词 众包标注集 数据标注 非结构化 标注概念 标注任务函数
下载PDF
产品标识标注规定
15
《山东肉类科技》 CAS 1998年第1期15-15,共1页
最近国家技术监督局公布了《产品标识标注规定》。该规定共有25条。其中规定: 一、产品标识应当有生产者的名称和地址。生产者的名称和地址应当是依法登记注册的,能承担产品质量责任的生产者名称和地址。 进口产品可以不标原生产者的名... 最近国家技术监督局公布了《产品标识标注规定》。该规定共有25条。其中规定: 一、产品标识应当有生产者的名称和地址。生产者的名称和地址应当是依法登记注册的,能承担产品质量责任的生产者名称和地址。 进口产品可以不标原生产者的名称、地址,但应当标明该产品的原产地(国家/地区,下同),以及代理商或者进口商或者销售商在中国依法登记注册的名称和地址。进口产品的原产地。 展开更多
关键词 产品标识标注 生产者名称和地址 产品质量责任 货物原产地 登记注册 承担法律责任 标注集 国家技术监督局 委托人 进口产品
下载PDF
信息处理用现代维吾尔语词干词类标记集研究 被引量:8
16
作者 玉素甫.艾白都拉 张海军 艾孜尔古丽 《信息技术与标准化》 2011年第6期45-48,63,共5页
阐述了研究与制定"现代维吾尔语词干词类标注标记集"必要性,讨论只靠语法角度提出的一类词干"现代维吾尔语词干词类标注标记集"有限性;论述了通过吸收国内外英语、汉语层次分析研究的最新成果,结合现代维吾尔语词... 阐述了研究与制定"现代维吾尔语词干词类标注标记集"必要性,讨论只靠语法角度提出的一类词干"现代维吾尔语词干词类标注标记集"有限性;论述了通过吸收国内外英语、汉语层次分析研究的最新成果,结合现代维吾尔语词干的本身特点研究现代维吾尔语词干语法语义分类体系迫切性;讨论信息处理用现代维吾尔语一类、二类、三类和四类词干词类标记规范。 展开更多
关键词 维吾尔语 信息处理 词干 标注标记
下载PDF
现代维吾尔语动词标记集验证性研究
17
作者 努尔加玛力.沙依提 艾孜尔古丽 玉素甫.艾白都拉 《电子制作》 2014年第11X期188-189,共2页
维吾尔语词性标注是维吾尔语短语分析和句法分析必不可少的环节及其信息处理研究的重要工作,对维汉词典提供很好的基础。本论文首先介绍了词性标注的重要性及其它在自然语言信息处理工作中的作用,然后进行了现代维吾尔语动词语法语义相... 维吾尔语词性标注是维吾尔语短语分析和句法分析必不可少的环节及其信息处理研究的重要工作,对维汉词典提供很好的基础。本论文首先介绍了词性标注的重要性及其它在自然语言信息处理工作中的作用,然后进行了现代维吾尔语动词语法语义相结合的动词词性标注标记集验证性研究,跟现有的现代维吾尔语动词标注标记集规范进行了比较,验证和补充,最后进行统计找出了每一种动词的词种数和频次。 展开更多
关键词 维吾尔语 动词 词性标注标记 验证性研究
下载PDF
基于深度学习的分心驾驶行为检测方法 被引量:2
18
作者 曹立波 杨洒 +2 位作者 艾昌硕 颜京才 李旭升 《汽车技术》 CSCD 北大核心 2023年第6期49-54,共6页
针对现有分心驾驶行为检测方法存在的检测精度低、实时性差等问题,利用基于深度学习的目标检测方法进行了驾驶员分心驾驶行为检测,首先构建分心驾驶行为数据集,包括驾驶员使用手机、饮水和吸烟3种行为的图像,并进行目标物的标注,然后选... 针对现有分心驾驶行为检测方法存在的检测精度低、实时性差等问题,利用基于深度学习的目标检测方法进行了驾驶员分心驾驶行为检测,首先构建分心驾驶行为数据集,包括驾驶员使用手机、饮水和吸烟3种行为的图像,并进行目标物的标注,然后选用轻量化目标检测模型NanoDet进行训练验证,结果表明,该方法可以准确并快速地识别出驾驶员在驾驶过程中使用手机、饮水和吸烟的行为。 展开更多
关键词 分心驾驶 目标检测 数据标注 轻量化模型
下载PDF
基于机器学习的文本分类技术研究进展 被引量:383
19
作者 苏金树 张博锋 徐昕 《软件学报》 EI CSCD 北大核心 2006年第9期1848-1859,共12页
文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.提出了基于机器学习的文本分类技术所面临的互联网内容信息处理等复杂应用的挑战,从模型、算法和评测等方面对其研究进展进行综述评论.... 文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.提出了基于机器学习的文本分类技术所面临的互联网内容信息处理等复杂应用的挑战,从模型、算法和评测等方面对其研究进展进行综述评论.认为非线性、数据集偏斜、标注瓶颈、多层分类、算法的扩展性及Web页分类等问题是目前文本分类研究的关键问题,并讨论了这些问题可能采取的方法.最后对研究的方向进行了展望. 展开更多
关键词 自动文本分类 机器学习 降维 核方法 标注集 偏斜数据 分级分类 大规模文本分类 Web页分类
下载PDF
基于含边界词性特征的中文命名实体识别 被引量:7
20
作者 邱莎 王付艳 +3 位作者 申浩如 段玻 阿圆 丁海燕 《计算机工程》 CAS CSCD 2012年第13期128-130,共3页
根据词性在任务中可能出现的特征表达,在字粒度一级,基于条件随机场模型,对词性特征在中文命名实体识别任务中的应用进行研究,提出一种将词性和词边界合成为一个特征项的方法。在相同实验环境下针对多种词性特征的应用情况,采用序列标... 根据词性在任务中可能出现的特征表达,在字粒度一级,基于条件随机场模型,对词性特征在中文命名实体识别任务中的应用进行研究,提出一种将词性和词边界合成为一个特征项的方法。在相同实验环境下针对多种词性特征的应用情况,采用序列标注的方式在公共语料上进行多次中文命名实体识别实验。通过对多次实验结果的比较分析得出,二级词性与词边界合成的特征在系统执行性能和识别效果等方面均为最优。 展开更多
关键词 中文命名实体识别 条件随机场 特征模板 词性 词边界 标注集
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部