期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
跨领域模式下语料库信息智能筛选仿真研究 被引量:1
1
作者 官小龙 《计算机仿真》 北大核心 2018年第9期311-314,381,共5页
对跨领域模式下语料库信息进行筛选,能够提高语料库信息提取的完整性。针对当前跨领域模式下语料库信息智能筛选方法存在的筛选质量差,筛选执行时间较长,占用计算机内存较大问题,提出一种基于多层向量空间模型的跨领域模式下语料库信息... 对跨领域模式下语料库信息进行筛选,能够提高语料库信息提取的完整性。针对当前跨领域模式下语料库信息智能筛选方法存在的筛选质量差,筛选执行时间较长,占用计算机内存较大问题,提出一种基于多层向量空间模型的跨领域模式下语料库信息智能筛选方法,通过编辑距离、向量余弦和Jaccard系数方法对跨领域模式下语料库信息文本的相似度进行评价,根据评价结果,将语料库信息划分为多个相对独立的文本段,根据文本段中索引项位置的不同,赋予文本段不同的权重,构建多层向量空间模型,并根据文本相似度确定模型相似度,根据相似度结果,完成跨领域模式下语料库信息智能筛选。实验结果表明,所提方法能够有效提高信息筛选的质量,且筛选速度较快,占用的计算机内存较少。 展开更多
关键词 跨领域模式 语料库信息 智能筛选
下载PDF
基于第三代语料库的信息领域术语动态更新 被引量:4
2
作者 邢红兵 《语言文字应用》 CSSCI 北大核心 2000年第2期58-62,共5页
本文以张普提出的“动态流通语料库”“语言知识动态更新”为理论基础 ,介绍了属于第三代语料库中的一个专业语料库———信息领域语料库建设的设想以及目前的进展情况 ,分析了术语的特点及其在语料库中的分布情况 ,探讨了如何利用动态... 本文以张普提出的“动态流通语料库”“语言知识动态更新”为理论基础 ,介绍了属于第三代语料库中的一个专业语料库———信息领域语料库建设的设想以及目前的进展情况 ,分析了术语的特点及其在语料库中的分布情况 ,探讨了如何利用动态流通语料库实现术语的动态更新。 展开更多
关键词 第三代语料库 信息领域语料库建设 术语 动态更新
下载PDF
信息领域汉英术语的特征及其在语料中的分布规律 被引量:12
3
作者 邢红兵 《术语标准化与信息技术》 2000年第3期17-21,共5页
在对 725万字的信息领域专业文献中带英文注释的术语(汉英术语)进行了人工标记,然后利用程序提取汉英术语及其前界环境(前至少 4个汉字)的工作基础上 ,本文对汉英术语的自身特征和前界环境进行了分析,目的是为术语的自动抽取提供... 在对 725万字的信息领域专业文献中带英文注释的术语(汉英术语)进行了人工标记,然后利用程序提取汉英术语及其前界环境(前至少 4个汉字)的工作基础上 ,本文对汉英术语的自身特征和前界环境进行了分析,目的是为术语的自动抽取提供规则及相关统计数据。 展开更多
关键词 汉英术语 信息领域语料库 术语自动抽取
下载PDF
语篇信息分析:多模态语篇分析难题的解决方法 被引量:4
4
作者 杜金榜 《中原工学院学报》 CAS 2015年第2期17-23,共7页
多模态语篇分析正成为法律语篇研究的热点之一,但是有关非语言模态信息与语言语篇信息的结合,研究者尚未找到有效的解决方法,这已经成为多模态语篇分析的难题之一。本文尝试采用法律语篇信息分析的方法,基于信息型语料库技术,对多模态... 多模态语篇分析正成为法律语篇研究的热点之一,但是有关非语言模态信息与语言语篇信息的结合,研究者尚未找到有效的解决方法,这已经成为多模态语篇分析的难题之一。本文尝试采用法律语篇信息分析的方法,基于信息型语料库技术,对多模态信息进行分析并将其与语言语篇信息整合。论述了多模态语篇信息分析的原则、多模态信息的语篇化处理、语篇信息的分析与标注以及多模态信息的整合与调用,并采用非法律语篇实例进行分析和操作。研究表明,从语篇信息角度进行多模态语篇分析是一种可具操作性的方法。该方法除了应用于法律语言学研究外,还可广泛应用于其他相关领域。 展开更多
关键词 多模态语篇信息分析 语篇化 信息语料库技术 关联点
下载PDF
Language Style Reflected by Tourist English Hypertext
5
作者 ZHANG Jie 《Sino-US English Teaching》 2013年第12期955-962,共8页
Corpus-based linguistic approach is one of the most used text studies. Nowadays, stylistic analysis has been adopted to shed new light on tourism English. The topic is to apply the language theory--the stylistic analy... Corpus-based linguistic approach is one of the most used text studies. Nowadays, stylistic analysis has been adopted to shed new light on tourism English. The topic is to apply the language theory--the stylistic analysis to the tourist text analysis, to discover the style essence of Tourist English Hypertext. The stylistic features include graphological analysis of Tourist English Hypertext, lexical features in hypertext, syntactical analysis of Tourist English Hypertext. It summarizes online Tourist English Hypertext information with some typical samples, with the methods of examples and analysis. It aims to offer an in-depth insight into the stylistic features of online tourism English texts, helping people to grasp the key points of the online information when they are browsing the information on the Internet. So this paper both enlarges the application of the stylistic analysis and presents summary for online tourist information. 展开更多
关键词 language style Tourist English Hypertext stylistic features tourist English hypertext analysis graphological features lexical features syntactic features
下载PDF
基于BiLSTM-CRF的中文地质时间信息抽取 被引量:11
6
作者 刘文聪 张春菊 +4 位作者 汪陈 张雪英 朱月琴 焦守涛 鲁艳旭 《地球科学进展》 CAS CSCD 北大核心 2021年第2期211-220,共10页
时间信息贯穿于地质现象和事件产生、发展、消亡的整个过程中,反映了地质现象和事件的状态和演变过程。特别是,地质时间表达通常与成矿内在机制和时空演化规律有关。设计并实现了基于深度学习的通用时间和地质时间信息抽取方法。结合地... 时间信息贯穿于地质现象和事件产生、发展、消亡的整个过程中,反映了地质现象和事件的状态和演变过程。特别是,地质时间表达通常与成矿内在机制和时空演化规律有关。设计并实现了基于深度学习的通用时间和地质时间信息抽取方法。结合地质矿产文本中时间信息的描述特点,将时间信息划分为通用时间信息与地质时间信息两种类型,并对两种时间信息类型进行细分;基于自主研发的"交互式矿产信息标注软件",采用交叉验证及意见反馈模式构建了地质时间信息语料库;实现了基于双向长短期记忆神经网络-条件随机场(BiLSTM-CRF)的时间信息抽取方法;并与主流的卷积神经网络(CNN)和条件随机场(CRF)模型的抽取结果进行了比较。实验结果表明,基于双向长短期记忆神经网络-条件随机场的时间信息抽取效果最好,对总体时间抽取的F1值达到95.49%,较好地解决了地质文本中时间信息的规范化表达和结构化抽取问题。 展开更多
关键词 地质时间 时间抽取 时间信息语料库 条件随机场 双向长短期记忆神经网络
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部