期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
中国民族语言大规模标注文本的检索技术实现及其价值 被引量:1
1
作者 江荻 龙从军 《云南师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2023年第6期36-44,共9页
《中国民族语言语法标注文本》丛书是国内第一套大规模真实文本资源,涵盖十余种低资源中国民族语言,又具有语法标注精深学术价值,因此引起学界广泛的兴趣和关注。鉴于该套丛书大规模标注文检索技术实现的重要价值,本文通过介绍该项目的... 《中国民族语言语法标注文本》丛书是国内第一套大规模真实文本资源,涵盖十余种低资源中国民族语言,又具有语法标注精深学术价值,因此引起学界广泛的兴趣和关注。鉴于该套丛书大规模标注文检索技术实现的重要价值,本文通过介绍该项目的内容、技术实现过程和可期的检索功能,特别对国际通行隔行对照化对齐文本的实现技术加以详释,使读者在项目上线之前就对丛书电子化和检索技术的实现有客观而清晰的认识。 展开更多
关键词 民族语 标注文本 语料数据 检索技术
下载PDF
文本标注的历史性跨跃与改进空间——以“中国民族语言语法标注文本丛书”为例
2
作者 刘丹青 《民族语文》 CSSCI 北大核心 2024年第2期3-18,共16页
本文指出在中国民族语言记录描写中,文本的语法标注是一个薄弱环节,而“中国民族语言语法标注文本丛书”采用基于类型学语言多样性而设计的多行标注法,更充分、更精准地提供了句子结构的句法语义信息,显著提升了文本的语言学价值,实现... 本文指出在中国民族语言记录描写中,文本的语法标注是一个薄弱环节,而“中国民族语言语法标注文本丛书”采用基于类型学语言多样性而设计的多行标注法,更充分、更精准地提供了句子结构的句法语义信息,显著提升了文本的语言学价值,实现了文本标注的历史性跨越。文章以具体实例的细致分析,既展示了新型标注法的6方面优点,也指出了丛书作为新的尝试尚存的4方面问题,为完善民族语言标注法提出了建议。 展开更多
关键词 民族语言 文本标注 逐词标注 语法素
原文传递
面向医疗文本的实体及关系标注平台的构建及应用 被引量:13
3
作者 张坤丽 赵旭 +3 位作者 关同峰 尚柏羽 李羽蒙 昝红英 《中文信息学报》 CSCD 北大核心 2020年第6期36-44,共9页
医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用。对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。传统的人工标... 医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用。对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。传统的人工标注方法费力费时,已难以适应大数据发展的需求。该文以构建中文医学知识图谱的任务为驱动,构建了半自动化实体及关系标注平台。该平台融合多种算法,能够实现文本预标注、进度控制、质量把控和数据分析等多种功能。利用该平台,进行了医学知识图谱中实体和关系标注,结果表明该平台能够在文本资源建设中控制标注过程,保证标注质量,提高标注效率。同时该平台也被应用于其他文本标注任务,表明该平台具有较好的任务移植性。 展开更多
关键词 文本标注 标注平台 实体标注 关系标注 数据分析
下载PDF
古籍资料库的自动超文本标注 被引量:3
4
作者 李新福 郭宝兰 《情报学报》 CSSCI 北大核心 1999年第3期250-254,共5页
依据古籍文献正文、校勘、参考文献等部分之间的非线性结构特性和计算机超文本技术,以720万字的《续资治通鉴长编》文本资料库超文本标注为例,着重讨论了超文本自动标注及其实现方法,并简要介绍了超文本和超文本标注语言(HTM... 依据古籍文献正文、校勘、参考文献等部分之间的非线性结构特性和计算机超文本技术,以720万字的《续资治通鉴长编》文本资料库超文本标注为例,着重讨论了超文本自动标注及其实现方法,并简要介绍了超文本和超文本标注语言(HTML)。 展开更多
关键词 古籍 文本 文本标注语言 标注 古籍资料库
下载PDF
基于双视角投影空间表示的文本多标签标注方法 被引量:1
5
作者 温雯 韦滨 +2 位作者 杜文俊 蔡瑞初 郝志峰 《计算机应用研究》 CSCD 北大核心 2020年第9期2684-2688,共5页
在传统的多标签文本标注领域中,面临着维数灾难和双信息源数据的问题。针对这两个问题,提出一种基于双视角投影空间表示的文本多标签标注方法,通过交替方向乘子法和Bregman迭代对目标函数进行优化求解,得到低维的隐语义投影空间。在雅... 在传统的多标签文本标注领域中,面临着维数灾难和双信息源数据的问题。针对这两个问题,提出一种基于双视角投影空间表示的文本多标签标注方法,通过交替方向乘子法和Bregman迭代对目标函数进行优化求解,得到低维的隐语义投影空间。在雅虎和路透社的新闻数据集上的实验结果验证表明,该方法在解决文本多标签标注问题上性能有明显的提高,其在召回率、覆盖误差和排名平均精度方面优于近年来的其他方法,可应用于新闻推荐,标签系统和情感分析等场景中。 展开更多
关键词 投影空间 文本标注 多标签 双视角
下载PDF
虚拟装配自动文本标注研究及在动车组中的应用 被引量:1
6
作者 周韶泽 兆文忠 +1 位作者 张军 马思群 《工程图学学报》 CSCD 北大核心 2011年第1期83-88,共6页
三维自动标注可明显提高复杂产品虚拟装配及虚拟样机技术的实用性。针对复杂产品虚拟装配实时文本标注复杂和效率低问题,提出交互式快速文本标注布局算法。算法通过预定义标注位置,建立文本压盖避让规则、动态调整标注规则,实现了移动... 三维自动标注可明显提高复杂产品虚拟装配及虚拟样机技术的实用性。针对复杂产品虚拟装配实时文本标注复杂和效率低问题,提出交互式快速文本标注布局算法。算法通过预定义标注位置,建立文本压盖避让规则、动态调整标注规则,实现了移动三维模型点标注和左右标注快速自动布局。实例结果表明,该方法显著提高了复杂产品三维模型的可读性,增强了仿真的整体效果,提高了设计及培训效率。 展开更多
关键词 计算机应用 自动文本标注 标记压盖避让 虚拟装配 动车组
下载PDF
配电网CAD系统中文本标注技术与应用 被引量:1
7
作者 李兰友 黄晓伟 +1 位作者 邵定宏 陶科 《微计算机信息》 北大核心 2007年第19期216-218,共3页
本文介绍了矢量绘图系统中文本标注技术的原理和方法,结合配电网CAD系统的开发,给出了在VC++开发环境下多行文本标注的具体实现方法。标注文本能和系统图形同步显示,具有矢量性,且编辑时能动态更新。
关键词 文本标注 配电网 CAD 矢量图形
下载PDF
数字人文视域中的古籍文本标注方法研究——以MARKUS为例 被引量:6
8
作者 于亚秀 李欣 《大数据》 2022年第6期15-25,共11页
文本标注是文本分析挖掘中的重要一步,面对大规模古籍资源,人工标注无法满足人文研究需求,且古籍语法结构和语言特点特殊,现代文本标注技术很难直接用于古籍研究。在分析人文研究者进行古籍文本标注中面临的难点和痛点的基础上,提出普... 文本标注是文本分析挖掘中的重要一步,面对大规模古籍资源,人工标注无法满足人文研究需求,且古籍语法结构和语言特点特殊,现代文本标注技术很难直接用于古籍研究。在分析人文研究者进行古籍文本标注中面临的难点和痛点的基础上,提出普适性的古籍标注标准流程,给出基于MARKUS的文本标注模型,并通过具体实践,探索基于该模型的古籍文本标注方法,旨在助推借助数字人文工具改变古籍人文研究方式,拓宽研究规模的应用深度。 展开更多
关键词 数字人文 古籍 文本标注 MARKUS
下载PDF
基于知网的文本标注 被引量:1
9
作者 陈晓明 周渝 《贵州大学学报(自然科学版)》 2001年第3期170-175,共6页
知网 (英文名称HowNet)是一个以汉语和英语的词语所代表的概念为描述对象 ,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库 本论文以知网中的知识词典为资源 ,以两篇真实文本为示例 ,研究基于知网的文本标... 知网 (英文名称HowNet)是一个以汉语和英语的词语所代表的概念为描述对象 ,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库 本论文以知网中的知识词典为资源 ,以两篇真实文本为示例 ,研究基于知网的文本标注 。 展开更多
关键词 知网 概念 文本标注 知识库 中文信息处理
下载PDF
基于大语言模型的中文科技文献标注方法 被引量:2
10
作者 杨冬菊 黄俊涛 《计算机工程》 CAS CSCD 北大核心 2024年第9期113-120,共8页
高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题,提出一种基于大语言模型的中文科技文献标注方法。首先,制定适用于多领域中文科... 高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题,提出一种基于大语言模型的中文科技文献标注方法。首先,制定适用于多领域中文科技文献的细粒度标注规范,明确标注实体类型以及标注粒度;其次,设计结构化文本标注提示模板和生成解析器,将中文科技文献标注任务设置成单阶段单轮问答过程,将标注规范和带标注文本填充至提示模板中相应的槽位以构建任务提示词;然后,将提示词注入到大语言模型中生成包含标注信息的输出文本,经由解析器解析得到结构化的标注数据;最后,利用基于大语言模型的提示学习生成中文科技文献实体标注数据集ACSL,其中包含分布在48个学科的10000篇标注文档以及72536个标注实体,并在ACSL上提出基于RoBERTa-wwm-ext的3个基准模型。实验结果表明,BERT+Span模型在长跨度的中文科技文献实体识别任务中表现最佳,F1值为0.335。上述结果可作为后续研究的测试基准。 展开更多
关键词 文本标注方法 中文科技文献 大语言模型 提示学习 信息抽取
下载PDF
用Auto CAD绘图时特殊文本的标注方法
11
作者 李燕 《武汉工业学院学报》 CAS 2001年第2期25-27,共3页
介绍了利用AutoCAD自有的文本标注功能、Word编辑器及高级形定义技术标注特殊文本的方法 ,使工程图中复杂的图符、公式、文字能够通过几种标注方法的组合得到准确、快捷地表达。
关键词 特殊文本标注 工程绘图 AUTOCAD 十六进制 文本编辑器
下载PDF
图形处理中的文本标注功能实现
12
作者 王建民 唐文彬 《软件开发与应用》 1997年第6期25-27,共3页
给出了图形处理中基于Windows环境下的文本标注功能的一种技术实现方法。
关键词 文本标注 TYPE字体 图形处理 字体控制
下载PDF
修改字体文件 改善文本标注
13
作者 付卫民 《有色冶金设计与研究》 2001年第1期61-64,共4页
通过对 AutoCAD的字体文件的分析,提出用修改字体文件的方法使 AutoCAD的文本标注更加灵活、美观、高效。
关键词 字体文件 形定义 标注文本
下载PDF
基于差异性评估对Co-training文本分类算法的改进 被引量:4
14
作者 唐焕玲 林正奎 鲁明羽 《电子学报》 EI CAS CSCD 北大核心 2008年第B12期138-143,共6页
Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视... Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视图的目标,转变成寻找两个既满足一定的正确性,又存在较大的差异性的两个基分类器的问题.首先利用特征评估函数建立多个特征视图,每个特征视图包含足够的信息训练生成一个基分类器,然后通过评估基分类器之间的差异性间接评估二者的独立性,选择两个满足一定的正确性和差异性比较大的基分类器协同训练.根据每个视图上采用的分类算法是否相同,提出了两种改进算法TV-SC和TV-DC.实验表明改进的TV-SC和TV-DC算法明显优于基于随机分割特征视图的Co-Rnd算法,而且TV-DC算法的分类效果要优于TV-SC算法. 展开更多
关键词 半监督文本分类 CO-TRAINING 特征视图 差异性评估 标注文本 标注文本
下载PDF
基于Web的众包文本标注平台构建与应用 被引量:3
15
作者 项威 刘文卓 王邦 《计算机应用》 CSCD 北大核心 2022年第S01期1-6,共6页
针对现有文本标注工具中缺乏复杂类型标注功能和众包质量检测方法等问题,构建了一个基于Web的众包文本标注平台。一方面,平台采用浏览器/服务器(B/S)的开发架构和前后端分离的开发方式,实现了复杂类型文本标注的需求,提供序列标注、单... 针对现有文本标注工具中缺乏复杂类型标注功能和众包质量检测方法等问题,构建了一个基于Web的众包文本标注平台。一方面,平台采用浏览器/服务器(B/S)的开发架构和前后端分离的开发方式,实现了复杂类型文本标注的需求,提供序列标注、单标签标注、量级标签标注、多层次标签标注和嵌套文本标注等场景的文本标注功能;另一方面,还提出了一种基于监督数据的多数投票一致性检测方法,在随机注入的监督数据上计算标注参与者的标注能力,作为多数投票的权重,进行真值推断得到最终的标注结果。最后,进行了系统功能测试、系统性能测试和浏览器兼容性测试,测试结果表明该系统能够满足复杂类型文本标注的需求,所提出的一致性检测方法能够筛选出高质量的标注内容反馈给用户。提供了一个高效便捷的众包文本标注平台,以构建高质量的文本语料库,助力自然语言处理(NLP)相关任务的研究,并已部署在服务器上,互联网用户可直接通过浏览器访问。 展开更多
关键词 文本标注 自然语言处理 众包 WEB 一致性检测
下载PDF
使用方便的AUTOCAD文本标注程序
16
作者 宋巧莲 吴斌 《微型机与应用》 1998年第4期55-56,共2页
利用WindowsGUI技术、ADS技术编制了在AUTOCADforWindows中使用的新的文本标注程序。利用该程序可方便地进行文本的标注处理。
关键词 文本标注程序 AUTOCAD 程序设计 应用程序
下载PDF
一种文本输入时语义标注系统的实现
17
作者 林文 林祖增 《福建电脑》 2017年第2期154-155,共2页
语义标注技术是将非结构化的自然语言文本数据转变为语义数据的有效手段。现有的语义标注技术方法准确度受制于样本质量,对新词汇和领域词汇的判别能力不强。本文设计了一种新的输入法,通过交互式过程,将输入文本和对应的语义进行精确关... 语义标注技术是将非结构化的自然语言文本数据转变为语义数据的有效手段。现有的语义标注技术方法准确度受制于样本质量,对新词汇和领域词汇的判别能力不强。本文设计了一种新的输入法,通过交互式过程,将输入文本和对应的语义进行精确关联,并探索了带有语义信息的文本在现有计算机系统中的保存方法。 展开更多
关键词 文本语义标注 命名实体标注 输入法 消除歧义
下载PDF
科技创新政策文本本体设计与标注应用研究
18
作者 翁梦娟 宋宁远 《情报探索》 2020年第2期42-49,共8页
[目的/意义]旨在为提升政策文本的自动化处理程度提供参考。[方法/过程]在梳理已有政策本体及其构建方式基础上,提出由词汇语义主导的自下而上的本体构建方法,运用本体构建工具Protégé5.5.0构建科技创新政策文本本体,对部分... [目的/意义]旨在为提升政策文本的自动化处理程度提供参考。[方法/过程]在梳理已有政策本体及其构建方式基础上,提出由词汇语义主导的自下而上的本体构建方法,运用本体构建工具Protégé5.5.0构建科技创新政策文本本体,对部分政策内容进行标注并可视化。[结果/结论]该本体适用于科技创新政策文本的结构化语义抽取,能够在一定程度上揭示科技创新政策的结构化语义特征。 展开更多
关键词 科技创新政策 文本本体 本体构建 文本标注
下载PDF
作为文件管理手段的标准通用标注语言(SGML)和超文本标注语言(HTML)
19
作者 杨则正 《管理观察》 1998年第11期55-55,共1页
关键词 文本标注语言 文件管理 HTML SGML 用户界面 两种语言 应用特点 生命周期 电子出版 WEB系统
下载PDF
基于UG的汉字标注研究及应用 被引量:1
20
作者 杨嘉涛 《现代制造工程》 CSCD 北大核心 2003年第12期45-48,共4页
针对UG文本标注存在的汉字与英文 (数字 )不匹配以及不能标注一些专用符号的问题 ,研究UG的标注系统 ,提出通过生成字体文件的方法解决标注存在的问题。结合实际工程的需要 ,生成了一个字体文件 ,可用于UG中汉字、英文及专用符号的标注。
关键词 文本标注 UG 汉字 字体文件 CAD
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部