期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
构建大规模的汉语事件知识库 被引量:2
1
作者 周强 王俊俊 陈丽欧 《中文信息学报》 CSCD 北大核心 2012年第3期86-91,103,共7页
该文提出了一种静态知识库和动态标注库相结合的汉语事件知识库构建方法。在统一的设计框架下,将相关事件知识拆分成五个相对独立的知识子库,并通过各子库之间的内在联系使之互相参照互为补充。经过有效拆分和信息联动,增强信息的丰富... 该文提出了一种静态知识库和动态标注库相结合的汉语事件知识库构建方法。在统一的设计框架下,将相关事件知识拆分成五个相对独立的知识子库,并通过各子库之间的内在联系使之互相参照互为补充。经过有效拆分和信息联动,增强信息的丰富性和可靠性,同时细化工作的粒度,具有较好的可操作性。以此为基础,开发完成一个汉语"存在拥有类"事件知识库,其中静态知识库覆盖72个情境和1 548个词语义项,动态标注库包含598个事件目标动词的10万句标注结果,取得了较好的实验效果。 展开更多
关键词 事件内容分析 事件语义标注资源 汉语事件知识库
下载PDF
基于HNC的汉语词语知识库改进 被引量:1
2
作者 王青海 马海慧 +2 位作者 池毓焕 李颖 董凌冲 《中文信息学报》 CSCD 北大核心 2012年第2期35-39,共5页
汉语词语知识库是HNC知识库系统的重要组成部分,目前其结构设计简单,加大了对HNC符号解析的难度。该文在分析了HNC的编码特点的基础上,改进了汉语词语知识库模型,阐述了改进后汉语词语知识库实体属性的设计方法和知识库的填写原则,并用... 汉语词语知识库是HNC知识库系统的重要组成部分,目前其结构设计简单,加大了对HNC符号解析的难度。该文在分析了HNC的编码特点的基础上,改进了汉语词语知识库模型,阐述了改进后汉语词语知识库实体属性的设计方法和知识库的填写原则,并用实例说明了改进后的词语知识库可以提高自然语言处理的效率。 展开更多
关键词 汉语词语知识库 HNC理论 关系数据库
下载PDF
现代汉语语义知识库用于句法分析的研究 被引量:1
3
作者 尹一瓴 陈群秀 《计算机应用》 CSCD 北大核心 2004年第B12期264-267,共4页
汉语在词类这个语言层次上存在着许多歧义结构,仅仅依靠句子中词的词性标记无法正确 获得汉语词之间的句法关系。针对这种情况,在已有的基于规则与概率模型的句法分析器基础上,使用 现代汉语语义知识库作为语义资源,进行了在句法分... 汉语在词类这个语言层次上存在着许多歧义结构,仅仅依靠句子中词的词性标记无法正确 获得汉语词之间的句法关系。针对这种情况,在已有的基于规则与概率模型的句法分析器基础上,使用 现代汉语语义知识库作为语义资源,进行了在句法分析中引入语义信息以提高分析正确性的研究。 展开更多
关键词 现代汉语语义知识库 句法分析 语义信息 排歧
下载PDF
以超语知识库推动澳洲中文教学本土化
4
作者 赵昆鹏 李伟 王丹萍 《创新教育研究》 2024年第8期385-394,共10页
随着中国经济的迅猛发展,在世界各地掀起了一股学习中文的热潮。例如,澳洲当地教育部门在中小学创办了各种有特色的中文教学项目,以培养学生对中文的兴趣和为当地劳动力市场提供有能力的双语人才。然而,这些项目中的中文教师大多数是来... 随着中国经济的迅猛发展,在世界各地掀起了一股学习中文的热潮。例如,澳洲当地教育部门在中小学创办了各种有特色的中文教学项目,以培养学生对中文的兴趣和为当地劳动力市场提供有能力的双语人才。然而,这些项目中的中文教师大多数是来自中国,在教学理念、内容和方法上很难适应和满足当地学生的特点及需求。鉴于此,当前案例研究者参与了澳洲当地一项中文教学研究项目,并且结合观察、照片启发式访谈与文件方法收集了相关数据。研究者通过激活和利用其汉语语言与文化中的相关概念与隐喻,作为已有的知识库,体现了其强有力的超语能力,并且在教学过程中结合互动白板科技,提高了当地学生的课堂参与度和学习成效。因此,这样不仅为构建澳洲本土化的中文课程做出了相应的贡献,而且为国际中文教育领域带来了新的研究视角和方向。With the rapid development of China’s economy, there has been a wave of learning Chinese language all over the world. For example, in Australia, the local education department has established various distinctive Chinese teaching and learning programs for primary and secondary school students to cultivate their interests in Chinese and to provide capable bilingual talents for its labour market. However, most teachers in these programs are native Chinese speakers that are from China. It is more difficult for them to adapt to and meet the characteristics and needs of local students in terms of teaching concepts, content and methods. In view of this, the teacher-researcher in this case study participated in a local Chinese teaching and research program, with the combination of observations, photo-elicitation interviews and documents for data collection. By activating and utilizing the relevant concepts and metaphors, originated from the teacher-researcher’s Chinese language and culture, as the existing funds of knowledge, such a process embodied his powerful translanguaging capability, and the combination of interactive whiteboard technology in improving the local school students’ engagement and learning outcomes in class. It thus not only contributed to the construction of localized Chinese curriculums in the Australian education context, but also brought a new research perspective and direction concerning the field of international Chinese language education. 展开更多
关键词 中文教学本土化 汉语语言与文化知识库 超语能力 互动白板科技
下载PDF
词汇计量研究与常用词知识库建设 被引量:5
5
作者 俞士汶 朱学锋 《中文信息学报》 CSCD 北大核心 2015年第3期16-20,共5页
面向自然语言处理的词汇语义研究应该以词汇的计量研究为基础。该文在评述汉语词汇计量研究的主要成果以后,提出一个汉语常用词知识库的建设任务,并给出常用词表的构造性定义、词表常用性的定量评价方法以及"部件词"的概念,... 面向自然语言处理的词汇语义研究应该以词汇的计量研究为基础。该文在评述汉语词汇计量研究的主要成果以后,提出一个汉语常用词知识库的建设任务,并给出常用词表的构造性定义、词表常用性的定量评价方法以及"部件词"的概念,最后介绍现代汉语常用词知识库的总体设计和已经做的工作。期望常用词知识库的建设能为汉语词汇语义学研究、为中文信息处理事业的发展做出贡献。 展开更多
关键词 汉语常用词知识库 《中国语言生活状况报告》 综合型语言知识库 《现代汉语语法信息词典》 部件词
下载PDF
汉语框架语义角色的自动标注 被引量:42
6
作者 李济洪 王瑞波 +1 位作者 王蔚林 李国臣 《软件学报》 EI CSCD 北大核心 2010年第4期597-611,共15页
基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及... 基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及其组合为特征.针对每个特征设定若干可选的窗口,组合构成模型的各种特征模板,基于统计学中的正交表,给出一种较优模板选择方法.全部实验在选出的25个框架的6692个例句的语料上进行.对每一个框架,分别按照其例句训练一个模型,同时进行语义角色的边界识别与分类,进行2-fold交叉验证.在给定句子中的目标词以及目标词所属的框架情况下,25个框架交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%和61.62%. 展开更多
关键词 汉语框架语义知识库 语义角色标注 正交表 特征选择 条件随机场
下载PDF
汉语框架自动识别中的歧义消解 被引量:11
7
作者 李济洪 高亚慧 +1 位作者 王瑞波 李国臣 《中文信息学报》 CSCD 北大核心 2011年第3期38-44,共7页
该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特... 该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特征,并使用开窗口技术和BOW策略,以目前汉语框架语义知识库中的88个词元的2 077条例句为训练、测试语料,进行了3-fold交叉验证实验,最好结果取得69.28%的精确率(Accuracy)。 展开更多
关键词 汉语框架语义知识库 框架语义 框架消歧 最大熵模型
下载PDF
基于条件随机场的汉语框架语义角色自动标注 被引量:8
8
作者 宋毅君 王瑞波 +1 位作者 李济洪 李国臣 《中文信息学报》 CSCD 北大核心 2014年第3期36-47,共12页
在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华... 在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华大学的基本块自动分析器进行分析,提取出15个块层面的新特征,并将这些特征标记形式化到词序列上。以文献[20]已有的12个词层面特征以及15个块层面特征共同构成候选特征集,采用正交表方法来选择模型的最优特征模板。在与文献[20]相同的语料上,相同的3组2折交叉验证实验下,语义角色标注的总性能的F1-值比文献[20]的F1-值提高了近1%,且在显著水平0.05的t-检验下显著。实验结果表明:(1)基于词序列模型,新加入的15个块层面特征可以显著提高标注模型的性能,但这类特征主要对角色分类有显著作用,对角色识别作用不显著;(2)基于词序列的标注模型显著好于以基本块为标注单元以及以句法成分为标注单元的标注模型。 展开更多
关键词 汉语框架语义知识库 语义角色标注 条件随机场模型 基本块
下载PDF
现代汉语语义资源用于短语歧义模式消歧研究 被引量:9
9
作者 王锦 陈群秀 《中文信息学报》 CSCD 北大核心 2007年第5期80-86,共7页
现代汉语存在着许多歧义短语结构,仅依靠句中词性标记无法获得词与词之间正确的搭配关系。本文研究了大量包含歧义的短语实例,分析了计算机处理汉语结构时面临的定界歧义和结构关系歧义问题,在已有短语结构规则的基础上归纳出了七种结... 现代汉语存在着许多歧义短语结构,仅依靠句中词性标记无法获得词与词之间正确的搭配关系。本文研究了大量包含歧义的短语实例,分析了计算机处理汉语结构时面临的定界歧义和结构关系歧义问题,在已有短语结构规则的基础上归纳出了七种结构歧义模式,提出了分析歧义模式的关键是四种基本搭配信息的判断,并实现了基于语义知识和搭配知识的消歧算法。对887处短语进行排歧的实验结果表明,处理短语结构的正确率由82.30%上升到87.18%。 展开更多
关键词 计算机应用 中文信息处理 现代汉语语义知识库 搭配词典 短语歧义排歧
下载PDF
《信息处理用词汇研究》九五项目结题汇报 现代汉语述语动词机器词典的扩充和槽关系研究 被引量:4
10
作者 陈群秀 《语言文字应用》 CSSCI 北大核心 2001年第4期98-104,共7页
“现代汉语述语动词机器词典的扩充和槽关系研究”是国家社科“九五”重大项目“信息处理用现代汉语词汇研究”中的一个子课题。本文首先概述这个子课题的主要研究内容和研究方法 ,然后介绍这个子课题已经取得的成果 ,最后探讨这个子课... “现代汉语述语动词机器词典的扩充和槽关系研究”是国家社科“九五”重大项目“信息处理用现代汉语词汇研究”中的一个子课题。本文首先概述这个子课题的主要研究内容和研究方法 ,然后介绍这个子课题已经取得的成果 ,最后探讨这个子课题进一步发展的方向。 展开更多
关键词 现代汉语述语动词机器词典 现代汉语名词槽关系系统 槽关系表示方法 语类 槽类型 槽序 槽关系表达式联想 现代汉语语义知识库
下载PDF
基于词分布表征的汉语框架排歧研究 被引量:4
11
作者 党帅兵 李国臣 +1 位作者 王瑞波 李济洪 《中北大学学报(自然科学版)》 CAS 北大核心 2015年第3期328-332,337,共6页
框架排歧目的在于根据句子中目标词的上下文环境,从现有的框架库中为该目标词自动标注一个合适的框架.将框架排歧任务看作分类问题,首次将词的低维分布表征信息作为模型特征引入到汉语框架排歧研究中,来探讨仅从词特征出发,不同的特征... 框架排歧目的在于根据句子中目标词的上下文环境,从现有的框架库中为该目标词自动标注一个合适的框架.将框架排歧任务看作分类问题,首次将词的低维分布表征信息作为模型特征引入到汉语框架排歧研究中,来探讨仅从词特征出发,不同的特征表示对框架排歧模型的影响.实验选取了88个词元中2 077条例句为数据集,并将目标词周围的词分布表征信息加入到最大熵算法中进行建模.实验结果表明,使用词分布表征信息的框架排歧模型可以达到58.11%的精度,该结果与传统的仅使用词特征时(47.47%)的结果相比有大幅度提高.这说明词分布表征对汉语框架排歧任务是有重要作用的. 展开更多
关键词 框架排歧 最大熵模型 词分布表征 汉语框架语义知识库
下载PDF
结合Hybrid Attention机制和BiLSTM-CRF的汉语否定语义表示及标注 被引量:2
12
作者 李晋荣 吕国英 +2 位作者 李茹 柴清华 王超 《计算机工程与应用》 CSCD 北大核心 2023年第9期167-175,共9页
阅读理解中否定是一种复杂的语言现象,其往往会反转情感或态度的极性。因此,正确分析否定语义对语篇理解具有重要意义。现有否定语义分析方法存在两个问题:第一,研究的否定词较少达不到应用目的;第二,目前汉语否定语义标注只是标注整个... 阅读理解中否定是一种复杂的语言现象,其往往会反转情感或态度的极性。因此,正确分析否定语义对语篇理解具有重要意义。现有否定语义分析方法存在两个问题:第一,研究的否定词较少达不到应用目的;第二,目前汉语否定语义标注只是标注整个句子,这无法明确否定语义。针对该问题提出基于汉语框架语义知识库(Chinese FrameNet)进行否定语义角色标注方法。在框架语义学理论指导下结合汉语否定语义特征对已由FrameNet继承的否定框架重新构建;为了解决捕捉长距离信息以及句法特征问题,提出一种基于Hybrid Attention机制的BiLSTMCRF语义角色标注模型,其中,Hybrid Attention机制层将局部注意与全局注意结合准确表示句子中的否定语义,BiLSTM网络层自动学习并提取语句上下文信息,CRF层预测最优否定语义角色标签。经过比对验证,该模型能够有效提取出含有否定语义信息,在否定语义框架数据集上F1值达到89.82%。 展开更多
关键词 汉语框架语义知识库 语义角色标注 否定框架 双向长短期记忆网络 混合注意力机制
下载PDF
基于框架表示学习的汉语框架排歧 被引量:2
13
作者 侯运瑶 曹学飞 +3 位作者 崔军 王瑞波 李济洪 李茹 《计算机应用研究》 CSCD 北大核心 2020年第12期3640-3644,共5页
为了改善框架排歧模型的性能,区别于传统分类算法人工提取特征的做法,直接从语料中的例句出发,使用神经网络模型给出了一种框架表示学习的算法,并将学习到的框架表示向量用于框架排歧任务,显著提升了框架排歧的性能。该算法充分利用CFN... 为了改善框架排歧模型的性能,区别于传统分类算法人工提取特征的做法,直接从语料中的例句出发,使用神经网络模型给出了一种框架表示学习的算法,并将学习到的框架表示向量用于框架排歧任务,显著提升了框架排歧的性能。该算法充分利用CFN中例句库、词元库,基于hinge-loss的神经网络,学习到能最大区别正确框架与错误框架的框架表示向量。此外,还使用WSABIE算法学习到目标词及其上下文的表示向量,排歧时以上下文表示向量与框架表示向量做余弦夹角来判决。在CFN中88个有歧义的词元上进行3组2折交叉验证(3×2 BCV)实验,框架排歧精度最好达到72.52%,t-检验结果表明该方法性能显著高于其他框架排歧方法。 展开更多
关键词 框架排歧 框架表示 表示学习 汉语框架语义知识库
下载PDF
一种文本信息隐藏中的语法检测算法 被引量:4
14
作者 付敏 戴祖旭 胡文涛 《科学技术与工程》 北大核心 2015年第21期142-145,共4页
基于文本的信息隐藏方法是通过对大量汉语句子进行考察和结构分析,抽出以关键词为核心的改写模板,对具有一定结构特点的语句改写。但是经过同义词替换后可能会破坏句子的语言一致性。针对这一缺点,提出了一种语法检测的算法。首先根据... 基于文本的信息隐藏方法是通过对大量汉语句子进行考察和结构分析,抽出以关键词为核心的改写模板,对具有一定结构特点的语句改写。但是经过同义词替换后可能会破坏句子的语言一致性。针对这一缺点,提出了一种语法检测的算法。首先根据语法库统计出词性的可选搭配对进行词性搭配检测是否合理,再检测词语属性的搭配,最后决定是否对词本身有要求进行检测。在C平台下的数值实验表明该检测算法能够有效的处理文本信息隐藏。 展开更多
关键词 同义词替换 信息隐藏 汉语知识库 语法检测
下载PDF
中文阅读理解语料库构建技术研究 被引量:3
15
作者 郝晓燕 李济洪 +1 位作者 由丽萍 刘开瑛 《中文信息学报》 CSCD 北大核心 2007年第6期29-35,共7页
阅读理解问答系统指的是能够自动分析一个自然语言文章,并且根据文中的信息为每个问题生成一个答案的系统,具有很高的研究价值。然而,缺乏中文阅读理解语料库已经成为制约汉语阅读理解问答系统发展的主要障碍。本文对于中文阅读理解语... 阅读理解问答系统指的是能够自动分析一个自然语言文章,并且根据文中的信息为每个问题生成一个答案的系统,具有很高的研究价值。然而,缺乏中文阅读理解语料库已经成为制约汉语阅读理解问答系统发展的主要障碍。本文对于中文阅读理解语料库的构建过程进行了详细的介绍,包括语料选材、编写问句,标注答案句、语料加工和评测机制,尤其是基于汉语框架语义知识库对语料进行了框架元素、短语类型和句法功能三个层面标注的深加工技术。 展开更多
关键词 计算机应用 中文信息处理 阅读理解问答系统 中文阅读理解语料库 汉语框架语义知识库
下载PDF
成语知识库及“以”在成语中的词类—义项分布
16
作者 俞士汶 朱学锋 王治敏 《汉语应用语言学研究》 2018年第1期1-11,共11页
本文研究基于以下两个数据基础:(1)北京大学计算语言学研究所研制的汉语成语知识库;(2)基于《古今汉语字典》建立的单字词“以”的知识数据库.从成语知识库中抽取出含“以”的成语,整理后有427个.对“以”标注词类和义项,并按照“以”... 本文研究基于以下两个数据基础:(1)北京大学计算语言学研究所研制的汉语成语知识库;(2)基于《古今汉语字典》建立的单字词“以”的知识数据库.从成语知识库中抽取出含“以”的成语,整理后有427个.对“以”标注词类和义项,并按照“以”在成语中的位置进行统计,得到“以”与位置相关的词类—义项分布.这项成果可以在文本机器理解及语文学习中得到应用.本文还初步探讨了古今汉语的一些变化. 展开更多
关键词 成语 汉语成语知识库 词类 义项 词类—义项分布
原文传递
基于语义依存分析的CFN框架排歧 被引量:2
17
作者 门宇鹏 郝晓燕 董嘉敏 《计算机工程与设计》 北大核心 2019年第9期2654-2659,共6页
为大规模自动构建语料库,使计算机能够理解文本信息,提出框架自动识别,框架排歧作为框架识别的子任务,是亟待解决的。框架排歧即根据目标词的上下文信息,从现有的框架库中,自动为该目标词标注一个合适的框架。利用分类算法的思想,使用... 为大规模自动构建语料库,使计算机能够理解文本信息,提出框架自动识别,框架排歧作为框架识别的子任务,是亟待解决的。框架排歧即根据目标词的上下文信息,从现有的框架库中,自动为该目标词标注一个合适的框架。利用分类算法的思想,使用支持向量机(SVM)中的“一对一”方法建立多个分类器来解决多分类问题。通过向已有的词性与依存句法关系特征之上再加入语义依存分析关系特征来提升框架排歧的准确率。训练语料和测试语料为山西大学建立的汉语框架语义知识库(CFN)中的7个词元,1519条例句,采用5-fold交叉验证。实验取得的最好结果为80.67%,验证了语义依存分析对框架排歧的有效性。 展开更多
关键词 汉语框架语义知识库(CFN) 框架排歧 多分类 支撑向量机 语义依存分析 交叉验证
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部