期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
综合型语言知识库的建设与利用 被引量:29
1
作者 俞士汶 段慧明 +1 位作者 朱学锋 张化瑞 《中文信息学报》 CSCD 北大核心 2004年第5期1-10,共10页
语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义词典 ,中文概念词... 语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义词典 ,中文概念词典 ,不同单位对齐的双语语料库 ,多个专业领域的术语库 ,现代汉语短语结构规则库 ,中国古代诗词语料库等等。本项研究将把这些语言数据资源集成为一个综合型的语言知识库。集成不同的语言数据资源时 ,必须克服它们之间的“缝隙”。规划中的综合型语言知识库除了有统一的友好的使用界面和方便的应用程序接口外 ,还将提供支持知识挖掘的工具软件 ,促使现有的语言数据资源从初级产品形式向深加工产品形式不断发展 ;提供多种形式的知识传播和信息服务机制 ,让综合型语言知识库为语言信息处理研究、语言学本体研究和语言教学提供全方位的。 展开更多
关键词 计算机应用 中文信息处理 语言处理 语言知识库 语言数据资源 电子词典 语料库
下载PDF
基于组件的异构数据集成平台的设计与研究 被引量:16
2
作者 李培峰 朱巧明 钱培德 《计算机应用与软件》 CSCD 北大核心 2005年第9期41-43,107,共4页
对分布、异构、自治和数据变化的管理信息系统进行集成是当务之急。本文介绍了一个采用组件技术,面向只读应用的异构数据集成平台模型,该平台模型主要用于集成各种信息管理系统的不同类型数据源,从而为用户提供透明访问各个成员数据源... 对分布、异构、自治和数据变化的管理信息系统进行集成是当务之急。本文介绍了一个采用组件技术,面向只读应用的异构数据集成平台模型,该平台模型主要用于集成各种信息管理系统的不同类型数据源,从而为用户提供透明访问各个成员数据源的中间平台。 展开更多
关键词 异构数据集成平台 组件 封装器 数据字典 全局基本查询语句 数据集成平台 异构数据集成 组件技术 设计与研究 管理信息系统
下载PDF
人机交互式的汉语辞书编纂系统 被引量:5
3
作者 傅爱平 吴杰 +1 位作者 张弘 李芸 《辞书研究》 北大核心 2013年第6期1-12,93,共12页
人机交互式的汉语辞书编纂系统是一个计算机网络应用系统,在互联网上为汉语语文辞书的编纂提供协同工作环境。这个系统以语言数据资源的建设和应用为基础,借鉴语言信息处理的相关研究成果,融入汉语语文辞书编纂的知识和经验,用人机交互... 人机交互式的汉语辞书编纂系统是一个计算机网络应用系统,在互联网上为汉语语文辞书的编纂提供协同工作环境。这个系统以语言数据资源的建设和应用为基础,借鉴语言信息处理的相关研究成果,融入汉语语文辞书编纂的知识和经验,用人机交互方式管理词典编纂的工作流程,包括新编词典立项、词条结构设置、选词立目、词条编写修改和审定、词条编审历程的保留与追溯、辅助词典成书等,同时也集成了多个语料库、已有辞书和词表,提供给词典编者作为参考。文章简要论述这个系统的设计思想、主要功能和关键技术。 展开更多
关键词 计算机辅助辞书编纂 语言数据建模 汉语辞书数据库 基于XML的语言数据处理
下载PDF
基于特征分选策略的中文共指消解方法 被引量:2
4
作者 李渝勤 甘润生 +1 位作者 杨永红 施水才 《计算机工程》 CAS CSCD 北大核心 2011年第18期180-182,共3页
针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征... 针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征在共指消解过程中产生的"噪声"。实验结果表明,该中文共指消解方法能提高共指消解的性能,F值达到80.72%。 展开更多
关键词 共指消解 特征选择 自然语言处理 支撑向量机 数据词典
下载PDF
数据字典在地质矿产术语分类代码修编平台中的应用 被引量:5
5
作者 汪新庆 康承旭 《地质学刊》 CAS 2014年第3期408-411,共4页
基于B/S模式的《地质矿产术语分类代码》(GB 9649—1988)修编平台是提高该标准修编工作效率的一种必然手段,而数据字典在该平台中的穿插使用保证了修编工作的合理与安全。通过论述数据字典技术在实现修编平台的修编权限控制、修编版本... 基于B/S模式的《地质矿产术语分类代码》(GB 9649—1988)修编平台是提高该标准修编工作效率的一种必然手段,而数据字典在该平台中的穿插使用保证了修编工作的合理与安全。通过论述数据字典技术在实现修编平台的修编权限控制、修编版本管理功能中的具体应用,体现了数据字典技术在数据处理方面的独特优势。数据字典技术在该平台中的应用,不仅对修编人员的修编权限进行了灵活的约束,而且修编过程中产生的不同版本也得到了有效的管理。 展开更多
关键词 数据字典 GB 9649-1988 标准修编
下载PDF
一次全面深入的修订——《汉语大词典》第二版第一册管窥 被引量:4
6
作者 江蓝生 《辞书研究》 2019年第4期1-7,I0001,共8页
文章指出《汉语大词典》的修订是一项难度很大、需要付出艰辛劳动的工作;通过与旧版的比较,认为第二版的修订目标和实际工作远远超出预期,是一次全面而深入的修订;文中扼要介绍了第二版第一册取得的成绩和闪烁的亮点,也指出第一册尚存... 文章指出《汉语大词典》的修订是一项难度很大、需要付出艰辛劳动的工作;通过与旧版的比较,认为第二版的修订目标和实际工作远远超出预期,是一次全面而深入的修订;文中扼要介绍了第二版第一册取得的成绩和闪烁的亮点,也指出第一册尚存在的不足,并对今后的工作提出了两点供参考的建议。 展开更多
关键词 《汉语大词典》第二版第一册 辞书修订 语料基础 书证优化 释义改善
下载PDF
电子语料库与语文辞书的编纂修订 被引量:2
7
作者 蒋宗福 《四川大学学报(哲学社会科学版)》 CSSCI 北大核心 2005年第5期79-86,共8页
迄今各种语文辞书不下数千种,但经过修订的却很少,究其原因是靠手工修订,学术水平难有大的提高。当前计算机技术和电子语料库已完全能满足语文辞书编纂修订的需要,积极探讨和推进辞书编纂修订手段的现代化,亟待引起重视。
关键词 电子语料库 语文辞书 编纂修订
下载PDF
论墓志后嗣义词语对辞书编纂之价值 被引量:2
8
作者 周阿根 《中国文字研究》 CSSCI 2016年第1期119-125,共7页
墓志文献语言是一种程式化的语言,其中包含了大量特色词汇。近年来,墓志词汇研究异军突起,研究成果丰硕。文章运用词汇学、辞书学等理论,以汉魏以来历代墓志为研究语料,对其中蕴含的后嗣义词汇进行系统研究,我们的研究成果可以为汉语词... 墓志文献语言是一种程式化的语言,其中包含了大量特色词汇。近年来,墓志词汇研究异军突起,研究成果丰硕。文章运用词汇学、辞书学等理论,以汉魏以来历代墓志为研究语料,对其中蕴含的后嗣义词汇进行系统研究,我们的研究成果可以为汉语词汇史研究提供可靠的第一手资料,同时可以为《汉语大词典》等大型辞书编纂和修订,提供有益的参考。 展开更多
关键词 墓志 后嗣义 特色词汇 辞书编纂 汉语史
下载PDF
美国国会图书馆MARC21书目数据格式的重要变化及我国西文编目工具书机读目录格式的修订建议 被引量:2
9
作者 曾伟忠 陈欣雨 胡惠芳 《图书馆理论与实践》 CSSCI 2019年第5期77-80,共4页
文章通过分析美国国会图书馆MARC21书目数据格式的重要变化,即控制子字段的变化、3XX字段的变化、4XX字段的变化以及7XX字段的变化,对《MARC21书目数据格式使用手册》和《CALIS联机合作编目手册(下册)》提出了修订建议,并指出了《西文... 文章通过分析美国国会图书馆MARC21书目数据格式的重要变化,即控制子字段的变化、3XX字段的变化、4XX字段的变化以及7XX字段的变化,对《MARC21书目数据格式使用手册》和《CALIS联机合作编目手册(下册)》提出了修订建议,并指出了《西文编目实用手册》的特色和存在的不足。 展开更多
关键词 MARC21 书目数据格式 机读目录格式修订 西文编目
下载PDF
基于数据挖掘的尿浊用药规律分析 被引量:3
10
作者 林明 文豪 +1 位作者 李修身 池晓玲 《亚太传统医药》 2020年第3期160-163,共4页
目的:研究《中医方剂大辞典》中治疗尿浊方剂的组方用药规律。方法:收集、整理《中医方剂大辞典》中治疗尿浊的方剂,构建数据库,应用数据挖掘方法(频数分析、层次聚类分析、关联规则)对其用药规律进行分析。结果:253首治疗尿浊的方剂中... 目的:研究《中医方剂大辞典》中治疗尿浊方剂的组方用药规律。方法:收集、整理《中医方剂大辞典》中治疗尿浊的方剂,构建数据库,应用数据挖掘方法(频数分析、层次聚类分析、关联规则)对其用药规律进行分析。结果:253首治疗尿浊的方剂中,共涉及272味中药,使用频率排在前6位的中药为茯苓、龙骨、甘草、牡蛎、人参、黄柏,药物类别以补虚药、利水渗湿药、安神药、收涩药、清热药为主。对高频药物进行层次聚类分析,共得到8个聚类组合,每类按照中药功效可归纳为:健脾燥湿、温肾利湿、清热利湿、固肾涩精、补肾壮阳、滋肾补阴、宁心安神、益气补血。通过关联规则分析发现,常用药对及药组主要是补虚药、收涩药、利水渗湿药、温里药、安神药类药物的不同组合,其中桑螵蛸与龙骨是治疗尿浊最常见的药对。结论:尿浊方剂的用药规律以清利湿热、补益脾肾为主。中医治疗尿浊应先辨虚实,初期多为实证,治以清利湿热;久病多虚,宜健脾益气、填补肾精,但要做到清补兼顾。 展开更多
关键词 尿浊 用药规律 数据挖掘 R语言 《中医方剂大辞典》
下载PDF
《汉书·五行志》考论
11
作者 王华宝 《南京师大学报(社会科学版)》 CSSCI 北大核心 2001年第5期150-155,共6页
班固《汉书》创设“五行志”一目 ,集先秦两汉阴阳五行灾异学说之大成 ,对后出史书多有影响 ,而近现代学术界对之评价较低 ,重视不够。本文通过对中华书局标点本存在的标点、校勘问题和《汉语大词典》与《汉书·五行志》相关的立目... 班固《汉书》创设“五行志”一目 ,集先秦两汉阴阳五行灾异学说之大成 ,对后出史书多有影响 ,而近现代学术界对之评价较低 ,重视不够。本文通过对中华书局标点本存在的标点、校勘问题和《汉语大词典》与《汉书·五行志》相关的立目释义和书证问题等的考查 ,认为对“五行志”一目的设立及其价值应当重估 ,在古籍整理和学术研究过程中 ,应重视“五行志” 展开更多
关键词 《汉书·五行志》 校点 文献价值 汉语大词典 校勘
下载PDF
提升规范型语文词典释义质量的探索与思考——以《现代汉语规范词典》的编修为例
12
作者 仇志群 《北华大学学报(社会科学版)》 2022年第5期28-35,151,152,共10页
《现代汉语规范词典》第1版于2004年出版,18年的时间里进行了3次修订。在编写、修订过程中,编修人员吸收词典学、词汇学和语言文字规范化标准化方面的研究成果,同时借鉴同类型语文词典的编纂经验,在释义方面进行了从理论到实践的探索和... 《现代汉语规范词典》第1版于2004年出版,18年的时间里进行了3次修订。在编写、修订过程中,编修人员吸收词典学、词汇学和语言文字规范化标准化方面的研究成果,同时借鉴同类型语文词典的编纂经验,在释义方面进行了从理论到实践的探索和思考,收获了宝贵的编修经验。 展开更多
关键词 《现代汉语规范词典》 语文词典 编写与修订 词条释义
下载PDF
与时俱进,精益求精——《现代汉语规范词典》第3版修订述要
13
作者 李行健 《北华大学学报(社会科学版)》 2022年第5期20-27,151,共9页
《现代汉语规范词典》第3版于2014年出版发行,不久就启动修订工作。进入改革开放新时期后,社会语言生活发生了深刻变化,也对汉语规范化和词典功能提出新的要求。为读者提供一部新时代的规范、好用的语文工具书是这次修订工作的目标。编... 《现代汉语规范词典》第3版于2014年出版发行,不久就启动修订工作。进入改革开放新时期后,社会语言生活发生了深刻变化,也对汉语规范化和词典功能提出新的要求。为读者提供一部新时代的规范、好用的语文工具书是这次修订工作的目标。编修组成员对词目的字形、读音、释义、配例等项内容全面检查,精心进行了增、删、改等修订操作。 展开更多
关键词 《现代汉语规范词典》 词典修订 语文规范 语言生活
下载PDF
报文解析工具中的XML数据字典 被引量:4
14
作者 刘烨 王永斌 刘宏波 《计算机工程》 CAS CSCD 北大核心 2009年第3期68-70,共3页
针对报文解析过程中存在的数据存储无序、查询和调用不便等问题,提出应用XML数据字典进行数据存储的方案。根据给定的数据表,设计XML形式的数据字典。实现XML字典数据的解析,能在可视化界面上进行数据存储、查询和调用等操作,并用类图... 针对报文解析过程中存在的数据存储无序、查询和调用不便等问题,提出应用XML数据字典进行数据存储的方案。根据给定的数据表,设计XML形式的数据字典。实现XML字典数据的解析,能在可视化界面上进行数据存储、查询和调用等操作,并用类图描述数据字典的存储和调用过程。结果证明,使用XML形式的数据字典,系统存储结构清晰,查询方便。 展开更多
关键词 可扩展标记语言 数据字典 解析工具 类图
下载PDF
不同历史时期虚劳病组方用药规律分析 被引量:10
15
作者 许银坤 王一凡 +9 位作者 李梓媛 李玥鑫 丁富平 黄进 张玉卓 梁嘉颖 植耀锋 许世超 游幸 张进 《中医药导报》 2020年第2期101-105,共5页
目的:探究《中医方剂大辞典精选本》中隋唐及之前,宋元时期与明清及近代的虚劳病组方用药规律。方法:利用R语言数据挖掘软件对《中医方剂大词典精选本》中的方剂药物信息进行描述性分析(药物药类及药物性味与归经)、关联规则分析与聚类... 目的:探究《中医方剂大辞典精选本》中隋唐及之前,宋元时期与明清及近代的虚劳病组方用药规律。方法:利用R语言数据挖掘软件对《中医方剂大词典精选本》中的方剂药物信息进行描述性分析(药物药类及药物性味与归经)、关联规则分析与聚类分析。结果:3个历史时期使用频率最高的药物分别为甘草、人参与熟地黄,使用药类居前的均包含补虚药、清热药、收涩药、利水渗湿药、温里药,累计频率均高于62.40%,药性以温性居多,药味都以甘、辛、苦为主,药物归经中归肾经药物的使用频率最高。关联规则与聚类分析共得出45个药对与药组,27个聚类方。结论:虚劳病的治疗在隋唐及之前取法经方以调和气血,宋元时期以补阳与补土为特点,明清及近代则重视阴精补益,呈现由气血并治,到倾向阴阳分治的特点。 展开更多
关键词 虚劳 中医方剂大辞典精选本 数据挖掘 R语言 组方用药规律 历史时期
下载PDF
机器翻译的产生及现状
16
作者 杨学泉 《水利电力机械电子技术》 1994年第1期55-61,共7页
本文介绍了机器翻译的产生及其发展历史,阐述了它的现状及使用情况.同时指出了在实际使用中机器翻译存在的若干问题.最后,介绍了日本对机器翻译的实验评价方法.
关键词 机器翻译 数据库 计算机
下载PDF
基于SDAI的STEP-NC解释器的研究 被引量:1
17
作者 张雪芬 邬义杰 周刚 《组合机床与自动化加工技术》 2006年第6期22-24,共3页
通过分析STEP-NC数据模型及加工程序结构,构造利于加工信息表述的系统核心数据结构,并且给出了系统框架关于时间和空间的数据流模型,提出基于SDAI的STEP-NC解释器系统框架结构,最后开发了原型系统,并就STEP-NC标准草案的实例加以论证。
关键词 STEP-NC SDAI 语言联编 数据字典
下载PDF
数字图书馆中文文本数据对象转换为XML格式文档的实现方法 被引量:1
18
作者 陈玲灵 唐志国 史庆周 《燕山大学学报》 CAS 2002年第2期184-188,共5页
数字图书馆的建设面临着资源整理、查找、存储等一系列问题,传统的文档存储形式不利于信息的再利用、web发布等。提出了将中文文本数据转换为可扩展标记语言(XML)文档的一种方法,通过解析一个文件类型表示(DTD),利用DTD中给定的元... 数字图书馆的建设面临着资源整理、查找、存储等一系列问题,传统的文档存储形式不利于信息的再利用、web发布等。提出了将中文文本数据转换为可扩展标记语言(XML)文档的一种方法,通过解析一个文件类型表示(DTD),利用DTD中给定的元素名称、属性等从文本数据中找到相应元素的内容,从而形成一个特定DTD下的XML文档。 展开更多
关键词 文本文件 可扩展标记语言 文档类型定义 数据字典
下载PDF
数据字典在火控系统报文解析中的应用 被引量:2
19
作者 王瑞雪 张振华 +2 位作者 张宾 程子兵 段笑笑 《兵器装备工程学报》 CAS 北大核心 2019年第4期190-192,共3页
结合元数据、数据字典和XML技术,提出建立数据字典和通用协议解码方法来提高火控系统报文解码可扩展性。建立了火控系统数据字典和通用协议解码方法,增强了报文解析的扩展性,实现了上层应用与协议的松耦合。开发了一个具有界面操作和显... 结合元数据、数据字典和XML技术,提出建立数据字典和通用协议解码方法来提高火控系统报文解码可扩展性。建立了火控系统数据字典和通用协议解码方法,增强了报文解析的扩展性,实现了上层应用与协议的松耦合。开发了一个具有界面操作和显示功能的火控系统通用报文解析工具,使用报文解析工具进行测试验证了火控系统数据字典和通用协议解析方法在报文解析上的高可扩展性。实验结果表明,数据字典与通用的协议解码方法能够达到报文频繁变更带来的报文解析可扩展性要求。 展开更多
关键词 可扩展标记语言 数据字典 火控系统 报文解析工具
下载PDF
全面细致的审订、充实和提升——《汉语大词典》二版修订定稿略记 被引量:2
20
作者 陈增杰 《温州大学学报(社会科学版)》 2019年第2期66-85,共20页
1994年出版的《汉语大词典》是一部代表国家科研水平的特大型汉语详解词典,曾获首届国家图书奖。《汉语大词典》第二版的修订编纂工作于2012年12月启动,现已进入分册主编定稿阶段。本文从分册主编定稿工作的实践出发,就正误和词目、释... 1994年出版的《汉语大词典》是一部代表国家科研水平的特大型汉语详解词典,曾获首届国家图书奖。《汉语大词典》第二版的修订编纂工作于2012年12月启动,现已进入分册主编定稿阶段。本文从分册主编定稿工作的实践出发,就正误和词目、释义、义项、引证诸方面分类展开举证论述,于中可略见二版修纂之原则、范围和程度。 展开更多
关键词 《汉语大词典》 第二版 修订 编纂
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部