期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
藏语动词语义角色的定义及标注标记集
1
作者 完么扎西 嘎玛扎西 头旦才让 《高原科学研究》 CSCD 2023年第4期86-94,共9页
语义角色的研究是实现浅层语义分析的基础,其对自然语言的语义理解和分析有着重要的作用,定义一个具体且清晰的语义角色分类体系来解释句子成分的语义显得至关重要,它能够促进语义角色数据集的建立以及相关语义分析模型的研究。文章在... 语义角色的研究是实现浅层语义分析的基础,其对自然语言的语义理解和分析有着重要的作用,定义一个具体且清晰的语义角色分类体系来解释句子成分的语义显得至关重要,它能够促进语义角色数据集的建立以及相关语义分析模型的研究。文章在已有研究基础上,根据动词的及物不及物、自主非自主和自动他动等范畴,对藏语谓词论元结构进行了详细探讨,提出了一个用于标注藏语句子中动词论元成分的语义角色分类体系。该体系共有21种角色,结合藏文文法并通过具体实例对相应的角色进行了定义,确定了语义角色标记集,为构建藏语语义角色标注数据集提供了理论支撑。 展开更多
关键词 藏语 动词 语义角色 分类体系 标记集
下载PDF
语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》 被引量:11
2
作者 靳光瑾 郭曙纶 +1 位作者 肖航 章云帆 《语言文字应用》 CSSCI 北大核心 2003年第4期16-24,共9页
本文就制定《信息处理用现代汉语词类标记集规范》阐述我们对于规范问题的看法和做法。规范不是强制的 ,只规范加工结果 ,不规范加工过程。《规范》研制的目的在于为中文信息处理研究提供一套可以作为国家规范的现代汉语词类标记集体系 ... 本文就制定《信息处理用现代汉语词类标记集规范》阐述我们对于规范问题的看法和做法。规范不是强制的 ,只规范加工结果 ,不规范加工过程。《规范》研制的目的在于为中文信息处理研究提供一套可以作为国家规范的现代汉语词类标记集体系 ,以便各个中文信息处理系统能够使用规范统一的词类标记集。这个《规范》试图解决词类标记的统一问题 ,该《规范》的特点是 :继承性 ,单功能性 ,通用性和可扩充性。本文还主要讨论了关于研制规范的一些原则性问题和小类标记问题 ,最后给出基于《规范》的词性标注在真实语料中的覆盖实验数据。 展开更多
关键词 词类标记集 规范 语料库 《信息处理用现代汉语词类标记集规范》
下载PDF
汉语短语标注标记集的确定 被引量:35
3
作者 周强 俞士汶 《中文信息学报》 CSCD 1996年第4期1-11,共11页
本文提出了一个汉语短语标注的基本标记集,并从句法功能和结构组成方面对不同短语的性质进行了深入的分析和探讨,以期为汉语短语划分和标注的自动处理和人工校对提供一个统一的处理标准。
关键词 汉语 短语标注 短语标记集 汉语语料库
下载PDF
利用扩展标记集的词结构分析 被引量:2
4
作者 孙静 方艳 +1 位作者 丁彬 周国栋 《中文信息学报》 CSCD 北大核心 2014年第5期39-45,82,共8页
该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部... 该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部结构识别问题转换成序列标注问题,通过扩展标记集,采用CRF模型来实现词的内部结构分析。最终实验表明,无论是在总体性能上,还是在各层结构的识别上都取得了较高的准确度。 展开更多
关键词 扩展标记集 词结构分析 前后缀 序列标注问题
下载PDF
藏语语料库词语分类体系及标记集研究 被引量:18
5
作者 才让加 《中文信息学报》 CSCD 北大核心 2009年第4期107-112,共6页
青海师范大学藏文信息处理与机器翻译省级重点实验室已完成1 000万字的藏语语料库的加工实验,加工的主要目的是使计算机能够对藏语语料库中的藏语词语进行自动切分和自动标注。该文在对大规模藏语语料库进行自动切分和人工分析的基础上... 青海师范大学藏文信息处理与机器翻译省级重点实验室已完成1 000万字的藏语语料库的加工实验,加工的主要目的是使计算机能够对藏语语料库中的藏语词语进行自动切分和自动标注。该文在对大规模藏语语料库进行自动切分和人工分析的基础上提出了一个藏语词语分类体系和标记集。根据藏语语料库和计算机自动切分和标注的实际需要,在藏语词语分类体系的构建上,采用先分虚实,再确定大类,在大类的基础上分出小类,再分出不同深度的子类。在藏语语料库加工实验中的应用表明,该分类方法和标记集是一个比较合理和实用的。 展开更多
关键词 计算机应用 中文信息处理 语料库 藏语词语 分类体系 标记集
下载PDF
现代维吾尔语词干词类标注标记集验证性研究 被引量:2
6
作者 艾孜尔古丽 米尔夏提 玉素甫.艾白都拉 《计算机工程与科学》 CSCD 北大核心 2015年第12期2318-2323,共6页
以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;... 以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;其次讨论《信息处理用现代维吾尔语词干词类标注标记集》的基本情况和多策略现代维吾尔语词干标注系统模型设计与算法;最后分析现代维吾尔语词性标注标记集验证结果,并验证《信息处理用现代维吾尔语词干词类标注标记集》的科学性,补充和改正部分词类的语义分类及标注代码,提出了规范的扩充建议。 展开更多
关键词 现代维吾尔语词干 词类标注 标记集 验证
下载PDF
利用遗传算法实现词类标记集的优化 被引量:1
7
作者 孙宏林 陆勤 俞士汶 《中文信息学报》 CSCD 北大核心 2001年第1期19-27,共9页
过去词类标记集的选择主要基于专家的经验知识 ,缺乏自动或半自动的方法来辅助这一过程。本文提出了一种利用遗传算法来搜索优化的标记集的新方法。这种方法可以在一个候选标记集集合中自动搜索一个最优或较优的标记集 ,并可根据应用的... 过去词类标记集的选择主要基于专家的经验知识 ,缺乏自动或半自动的方法来辅助这一过程。本文提出了一种利用遗传算法来搜索优化的标记集的新方法。这种方法可以在一个候选标记集集合中自动搜索一个最优或较优的标记集 ,并可根据应用的需求调整参数以适应特定任务的需求。实验表明 展开更多
关键词 词性标注 词类标记集 遗传算法 概率型优化方法 评价函数 词汇分类
下载PDF
信息处理用现代汉语词类标记集规范 被引量:13
8
《语言文字应用》 CSSCI 北大核心 2001年第3期16-20,共5页
关键词 信息处理 现代汉语 词类标记集 分类依据 术语使用 数据转换 《信息处理用现代汉语词类标记集规范》
下载PDF
试论句法范畴义征标记集的建构
9
作者 孙道功 《语言文字应用》 CSSCI 北大核心 2012年第1期125-132,共8页
"词汇语义—句法语义"的衔接是句法—语义接口的重要内容,也是句法结构生成的关键。句法范畴义征是词汇语义与句法语义的衔接桥梁,其提取和标记集的建构是衔接研究的基础。本研究基于语义范畴的义征分析和语义子场的概括抽象... "词汇语义—句法语义"的衔接是句法—语义接口的重要内容,也是句法结构生成的关键。句法范畴义征是词汇语义与句法语义的衔接桥梁,其提取和标记集的建构是衔接研究的基础。本研究基于语义范畴的义征分析和语义子场的概括抽象,共提取句法范畴义征61个,经过对《受限词元表》中50个常用词(包括名、动、形三类)所形成的组合结构以及汉语简单句型(220个)的验证增补,建构了优化的《句法范畴义征标记集》(76个),并对所提取的范畴义征进行了界定。作为工程语言学项目,句法范畴义征标记集的建构,最终是为句法结构的理解生成服务的。 展开更多
关键词 句法范畴义征 语义范畴 语义子场 义征分析 标记集
下载PDF
基于边界标记集的专利文献术语抽取方法 被引量:7
10
作者 丁杰 吕学强 刘克会 《计算机工程与科学》 CSCD 北大核心 2015年第8期1591-1598,共8页
目前,大部分术语边界的确定方法是通过选取合适的统计量,设置合适的阈值计算字符串之间的紧密程度,但该类方法在抽取长术语时不能得到很好的效果。为了解决在术语抽取过程中长术语抽取召回率低的问题,在研究了大量专利文献的基础上,提... 目前,大部分术语边界的确定方法是通过选取合适的统计量,设置合适的阈值计算字符串之间的紧密程度,但该类方法在抽取长术语时不能得到很好的效果。为了解决在术语抽取过程中长术语抽取召回率低的问题,在研究了大量专利文献的基础上,提出了一种基于专利术语边界标记集的术语抽取方法。方法中提出了边界标记集的概念,并结合专利文献中术语边界的特点构建专利术语边界标记集;提出了一种种子术语权重计算方法抽取种子术语;使用人民日报语料作为对比语料抽取专利文献术语部件词库,提高候选术语的术语度;最后采用左右边界熵的方法对识别出的术语进行过滤。实验表明,所提出的方法具有较好的实验结果,正确率81.67%,召回率71.92%,F值0.765,较对比实验有较大提高。 展开更多
关键词 边界标记集 种子术语 部件库 左右边界熵
下载PDF
信息处理用维语词汇标注标记集的确定 被引量:4
11
作者 玉素甫.艾白都拉 阿不都热依木.沙力 阿拉帕提古丽 《计算机应用》 CSCD 北大核心 2009年第7期2006-2008,共3页
介绍了研究和制定信息处理用维语标注标记集的研究进展。讨论了研究与制订"维语标注标记集"必要性,说明了只靠语法角度提出的词汇一级"维语标注标记集"的有限性,论述国内外英语、汉语层次分析研究的最新成果,结合... 介绍了研究和制定信息处理用维语标注标记集的研究进展。讨论了研究与制订"维语标注标记集"必要性,说明了只靠语法角度提出的词汇一级"维语标注标记集"的有限性,论述国内外英语、汉语层次分析研究的最新成果,结合维语的本身特点研究维语语义分类体系迫切性,给出了"维语标注标记集"的工作思路、标记集制定的原则和语法语义词汇一级词性标记集的内容,比较了标记集两个版本的特点,展望了其发展。 展开更多
关键词 维吾尔语 信息处理 标注标记集
下载PDF
信息处理用现代维吾尔语词干词类标记集研究 被引量:8
12
作者 玉素甫.艾白都拉 张海军 艾孜尔古丽 《信息技术与标准化》 2011年第6期45-48,63,共5页
阐述了研究与制定"现代维吾尔语词干词类标注标记集"必要性,讨论只靠语法角度提出的一类词干"现代维吾尔语词干词类标注标记集"有限性;论述了通过吸收国内外英语、汉语层次分析研究的最新成果,结合现代维吾尔语词... 阐述了研究与制定"现代维吾尔语词干词类标注标记集"必要性,讨论只靠语法角度提出的一类词干"现代维吾尔语词干词类标注标记集"有限性;论述了通过吸收国内外英语、汉语层次分析研究的最新成果,结合现代维吾尔语词干的本身特点研究现代维吾尔语词干语法语义分类体系迫切性;讨论信息处理用现代维吾尔语一类、二类、三类和四类词干词类标记规范。 展开更多
关键词 维吾尔语 信息处理 词干 标注标记集
下载PDF
维吾尔语框架语义角色标注标记集研究 被引量:1
13
作者 阿里甫.库尔班 吾买尔江.库尔班 房鼎益 《中文信息学报》 CSCD 北大核心 2013年第2期41-46,共6页
该文阐述了对词一级的维吾尔语框架语义网络构建过程中,制订和规范化维吾尔语框架语义角色的语义类型和标注标记符集、短语类型和标注符号集、句法功能的标注符号集的研究。研究内容对基于阿拉伯字符的维吾尔语框架语义成分的依存关系... 该文阐述了对词一级的维吾尔语框架语义网络构建过程中,制订和规范化维吾尔语框架语义角色的语义类型和标注标记符集、短语类型和标注符号集、句法功能的标注符号集的研究。研究内容对基于阿拉伯字符的维吾尔语框架语义成分的依存关系、语义角色分解与自动识别技术,语义角色知识库的构建和自动标注等相关技术提供基础研究服务。 展开更多
关键词 维吾尔语 框架语义 语义角色 短语类型 句法功能 标记集
下载PDF
现代维吾尔语动词标记集验证性研究
14
作者 努尔加玛力.沙依提 艾孜尔古丽 玉素甫.艾白都拉 《电子制作》 2014年第11X期188-189,共2页
维吾尔语词性标注是维吾尔语短语分析和句法分析必不可少的环节及其信息处理研究的重要工作,对维汉词典提供很好的基础。本论文首先介绍了词性标注的重要性及其它在自然语言信息处理工作中的作用,然后进行了现代维吾尔语动词语法语义相... 维吾尔语词性标注是维吾尔语短语分析和句法分析必不可少的环节及其信息处理研究的重要工作,对维汉词典提供很好的基础。本论文首先介绍了词性标注的重要性及其它在自然语言信息处理工作中的作用,然后进行了现代维吾尔语动词语法语义相结合的动词词性标注标记集验证性研究,跟现有的现代维吾尔语动词标注标记集规范进行了比较,验证和补充,最后进行统计找出了每一种动词的词种数和频次。 展开更多
关键词 维吾尔语 动词 词性标注标记集 验证性研究
下载PDF
信息处理用现代汉语词类及标记集规范
15
作者 李竹 《语言文字应用》 CSSCI 北大核心 2000年第1期16-19,共4页
关键词 信息处理 现代汉语 词类 词类标记集规范
全文增补中
基于恒定动量矢量的快速大形变微分同胚非刚体标记点集匹配算法 被引量:2
16
作者 赵键 鲁敏 张军 《电子学报》 EI CAS CSCD 北大核心 2015年第9期1714-1722,共9页
目前经典的基于微分同胚非刚体变换的标记点匹配算法虽然克服了以往非微分同胚变换方法不能处理大形变非刚体变换的问题,但是普遍存在时空复杂度较高,算法收敛速度较慢以及匹配精确性和变换光滑性不能兼顾等问题.针对这些问题,本文提出... 目前经典的基于微分同胚非刚体变换的标记点匹配算法虽然克服了以往非微分同胚变换方法不能处理大形变非刚体变换的问题,但是普遍存在时空复杂度较高,算法收敛速度较慢以及匹配精确性和变换光滑性不能兼顾等问题.针对这些问题,本文提出了一种新的基于恒定动量矢量的快速大形变微分同胚非刚体标记点集匹配算法,该方法利用拉格朗日坐标系下的恒定动量矢量以及时间依赖的多尺度再生核来构造速度矢量场,然后采用基于规则化控制参数的确定性退火机制来搜索最优动量矢量,从而得到最终的微分同胚变换形变场.最后实验验证了本文所提新算法能使匹配的精确性和变换的光滑性达到较好的平衡兼顾,而且也较大程度地降低了算法的时间复杂度以及空间复杂度. 展开更多
关键词 大形变微分同胚非刚体变换 标记匹配 拉格朗日坐标 恒定动量矢量 多尺度再生核 确定性退火
下载PDF
《信息处理用现代汉语词类标记规范》修订研究 被引量:1
17
作者 杨丽姣 肖航 刘智颖 《语言文字应用》 CSSCI 北大核心 2021年第3期111-120,共10页
《信息处理用现代汉语词类标记规范》是汉语语言信息处理和语料库建设中关于词类划分和标注的重要参考标准。本次修订的核心内容有两项:一是以完善规范和满足应用需要为导向,对基本词类、其他切分单位及其小类进行了修订,提升了规范的... 《信息处理用现代汉语词类标记规范》是汉语语言信息处理和语料库建设中关于词类划分和标注的重要参考标准。本次修订的核心内容有两项:一是以完善规范和满足应用需要为导向,对基本词类、其他切分单位及其小类进行了修订,提升了规范的严谨性和适用性;二是提出了词类标记的组合应用原则,规定非词切分单位可以在类属标记之外,组合附加词类标记代码,以更全面准确地标注其语法功能。规范修订审慎处理了词类体系、词类划分、标记代码三者关系,为词与非词切分单位的语法功能标注提供了更科学合理的方案,提升了规范的科学性、实用性和可操作性。 展开更多
关键词 词类 标记集 词类标注 规范标准 修订
下载PDF
《信息处理用现代汉语词类标记规范》修订方案 被引量:1
18
作者 杨丽姣 肖航 刘智颖 《语言文字应用》 CSSCI 北大核心 2019年第3期87-95,共9页
《信息处理用现代汉语词类标记规范》的研制顺应了语言资源建设和信息处理研究的需要,颁布实施后为语料库和信息处理系统词类标记的规范化起到了基础性和参照性作用,但随着理论研究和应用实践的发展,其局限也日益凸显。本文在总结规范... 《信息处理用现代汉语词类标记规范》的研制顺应了语言资源建设和信息处理研究的需要,颁布实施后为语料库和信息处理系统词类标记的规范化起到了基础性和参照性作用,但随着理论研究和应用实践的发展,其局限也日益凸显。本文在总结规范修订前期工作的基础上,对修订思路和修订策略进行阐述,提出了拟通过规范修订解决的主要问题,并说明了拟修订调整的内容要点。本文认为,本着积极稳妥、吸收包容的原则,反映词类研究的新成果,体现语言资源建设的新实践,满足语言信息处理研究的新需要,处理好词类体系、词类划分、标记代码三者关系,处理好兼类标注问题,适当调整大类和小类,是制定修订方案的重点。 展开更多
关键词 词类 词类标注 标记集 标记规范 标准修订
下载PDF
面向信息处理的维吾尔语词语分类体系及标记研究(Ⅱ) 被引量:7
19
作者 阿里甫.库尔班 吾买尔江.库尔班 吐尔根.伊布拉音 《新疆大学学报(自然科学版)》 CAS 2010年第1期106-112,116,共8页
研制《维吾尔语词语分类体系及其标记集》是维吾尔文信息处理的支柱工程.动词在维吾尔语句子构成中常常是一个句子的核心.本文在以往有关维吾尔语词性标注研究成果的基础上,提出了一个面向信息处理的现代维吾尔语动词体系及其标记集,并... 研制《维吾尔语词语分类体系及其标记集》是维吾尔文信息处理的支柱工程.动词在维吾尔语句子构成中常常是一个句子的核心.本文在以往有关维吾尔语词性标注研究成果的基础上,提出了一个面向信息处理的现代维吾尔语动词体系及其标记集,并且对维吾尔语动词的形态特征、语法范畴以及短语组合功能等方面进行了详细的描述. 展开更多
关键词 维吾尔语动词分类体系 信息处理 动词标记集
下载PDF
九声音阶概析及九声音阶音集之己见 被引量:2
20
作者 高畅 《星海音乐学院学报》 2014年第4期148-158,共11页
与五声音阶、六声音阶、全音阶、自然(七声)音阶和八声音阶这些均有所特指的音阶相比,九声音阶这一称呼至今还没有一个被大家所公认的具体所指。为此,文章将已经明确地在音乐实践中使用过的、且有明确记载或有人研究过的几种九声音阶进... 与五声音阶、六声音阶、全音阶、自然(七声)音阶和八声音阶这些均有所特指的音阶相比,九声音阶这一称呼至今还没有一个被大家所公认的具体所指。为此,文章将已经明确地在音乐实践中使用过的、且有明确记载或有人研究过的几种九声音阶进行了比较和分析,认为所有九声音阶中最具对称特性的,即连续两次相隔半音和一次相隔一个全音而循环构成的九声音阶,也就是我们所熟知的"齐尔品九声音阶"和"梅西安有限移位模式Ⅲ"是最典型的也是使用最广泛的,故而笔者提出这两种音阶最该"享用"九声音阶这一特别称呼。另外,文章还就非调性语境中的九声音阶音集类型作了理论剖析,对其中笔者所特指的九声音阶音集从其特性、标记和应用模式等方面进行了阐述。 展开更多
关键词 九声音阶(nonatonic scale) 九声音阶音(nonatonic collection) 齐尔品九声音阶(the ninestep SCALE of Tcherepnin) 梅西安有限移位模式Ⅲ 九声音阶音标记 九声音阶音应用模式
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部