期刊文献+
共找到340篇文章
< 1 2 17 >
每页显示 20 50 100
文本处理技术在高校审计中的应用探索
1
作者 梅胜 李晨 《现代商贸工业》 2024年第16期243-244,共2页
随着信息化技术的发展,高校审计面临着海量文本数据资料的挑战,而传统的数据处理方法和工具对文本信息的适用性不足。本文立足高校审计应用,以Python语言为例,以合同审计为应用场景,探讨文本处理技术实现路径,助力提升高校审计工作质效。
关键词 文本处理技术 高校审计 应用探索
下载PDF
基于单元教学的文本处理策略 被引量:1
2
作者 黄厚江 《语文建设》 北大核心 2023年第21期9-12,共4页
从教学操作层面看,单元教学与单篇教学之间的关系问题,其实就是在单元教学中如何科学合理地处理文本。基于单元教学的文本处理与传统的单篇教学具有显著的差异。一般来说,它更着眼于从一个单元去认识一篇文本的教学价值,更多的是基于单... 从教学操作层面看,单元教学与单篇教学之间的关系问题,其实就是在单元教学中如何科学合理地处理文本。基于单元教学的文本处理与传统的单篇教学具有显著的差异。一般来说,它更着眼于从一个单元去认识一篇文本的教学价值,更多的是基于单元整体的学习目标和学习内容以及单元文本之间的关系去确定教学内容、设计学习任务。通常的策略是:或者以核心文本为支点,统领辐射多篇文本;或者基于单篇进行文本纵向串联,基于单元进行文本横向并联;或者对文本进行“二次组元”,再基于“小单元”进行比较与整合;或者为单篇文本配置有参照性的学习资源,在多维比较中取得单元学习的效果。 展开更多
关键词 单元教学 单篇教学 文本处理 教学策略
下载PDF
基于注意力机制的文本处理技术在自然语言处理中的应用研究 被引量:1
3
作者 杨枭 《互联网周刊》 2023年第15期27-29,共3页
在信息时代,人们对自然语言的需求日益增加,在线翻译、智能问答等多种应用技术不断进步,使得自然语言处理技术成为当前人工智能的研究热点。目前,人工智能技术已经成为科技领域发展的重要篇章。在自然语言处理中,文本处理扮演着重要的... 在信息时代,人们对自然语言的需求日益增加,在线翻译、智能问答等多种应用技术不断进步,使得自然语言处理技术成为当前人工智能的研究热点。目前,人工智能技术已经成为科技领域发展的重要篇章。在自然语言处理中,文本处理扮演着重要的角色。目前,基于注意力机制的文本处理技术在自然语言处理中得到了广泛应用,促进了计算机文字识别和机器翻译等多个领域的快速发展。本文从自然语言处理的相关概念入手,探讨基于注意力机制的文本处理技术在自然语言处理中的应用。 展开更多
关键词 注意力机制 文本处理技术 自然语言处理
下载PDF
大规模真实文本处理的理论与方法
4
作者 黄昌宁 《国际学术动态》 1998年第4期14-16,共3页
背景随着因特网和光盘等大容量存储技术的普及,机储文本语料库的规模已冲破1万亿(10~(12)字节。它一方面带来了巨大的商业利益,促进了信息咨询业的空前发展;另一方面也向学术界和企业界提出了挑战,呼唤着大规模真实文本处理技术的革新... 背景随着因特网和光盘等大容量存储技术的普及,机储文本语料库的规模已冲破1万亿(10~(12)字节。它一方面带来了巨大的商业利益,促进了信息咨询业的空前发展;另一方面也向学术界和企业界提出了挑战,呼唤着大规模真实文本处理技术的革新。据美国Lexis-Nexis公司John Rausch高级工程师在第5届国际大规模语料库研讨会(The Fifth workshop on Verylarge Corpora,简称WVLC-5)上披露,这家提供信息检索服务的公司今年的机储文档已达15亿件,相当于15000亿字符,是该公司1993年机储文档的7.5倍,并且持续以每周950万件的速度递增。此外Lexis—Nexis公司平均每天要接受50万次客户查询,每次查询平均访问182个不同数据库,而每次查询的响应时间平均为4.8秒,公司每天为客户打印的文档多达37.5万件。从以上数据中不难看到,信息资源在当今社会中的重要性,以及文本语料库(或数据库)所达到的巨大规模和相应的处理技术。 展开更多
关键词 大规模语料库 真实文本处理 文本处理 文本分析
下载PDF
隐含语义索引及其在中文文本处理中的应用研究 被引量:41
5
作者 周水庚 关佶红 胡运发 《小型微型计算机系统》 CSCD 北大核心 2001年第2期239-243,共5页
信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量投影到一个低维空间 ,消减了词和文档之间的语义模糊度 ,使得... 信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量投影到一个低维空间 ,消减了词和文档之间的语义模糊度 ,使得文档之间的语义关系更为明晰 .实验和理论结果证实了隐含语义索引能够取得更好的检索效果 .本文论述了隐含语义索引的理论基础 ,研究了隐含语义索引在中文文本处理中的应用 ,包括中文文本检索、中文文本分类和中文文本聚类等 . 展开更多
关键词 信息检索 隐含语义索引 中文文本处理 中文信息处理
下载PDF
微博文本处理研究综述 被引量:55
6
作者 张剑峰 夏云庆 姚建民 《中文信息学报》 CSCD 北大核心 2012年第4期21-27,42,共8页
微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要... 微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要的课题。该文对微博文本进行了定义,阐述了微博文本研究的重要性,并从微博文本的不同应用领域出发,对微博文本的研究现状进行了综述,介绍了目前已经存在的微博文本数据集和应用系统。 展开更多
关键词 微博文本 语言分析 文本处理
下载PDF
一种文本处理中的朴素贝叶斯分类器 被引量:75
7
作者 李静梅 孙丽华 +1 位作者 张巧荣 张春生 《哈尔滨工程大学学报》 EI CAS CSCD 2003年第1期71-74,共4页
首先在特征独立性假设的基础上,讨论了朴素贝叶斯分类器的原理,以及训练朴素贝叶斯分类器和应用朴素贝叶斯分类器进行分类的问题.然后,通过EM算法(期望值最大算法),自动增加训练量,以得到较为完备的训练文本库,扩展了朴素贝叶斯分类器... 首先在特征独立性假设的基础上,讨论了朴素贝叶斯分类器的原理,以及训练朴素贝叶斯分类器和应用朴素贝叶斯分类器进行分类的问题.然后,通过EM算法(期望值最大算法),自动增加训练量,以得到较为完备的训练文本库,扩展了朴素贝叶斯分类器的应用,提高了朴素贝叶斯分类器的分类精度.文章最后给出一组实验数据.本文的研究发现,朴素贝叶斯分类器分类精度较高,并且不存在单分类器与多分类器的实现差异,是一个比较实用的分类器. 展开更多
关键词 朴素贝叶斯分类器 特征独立 文本分类 文本处理
下载PDF
文本处理中的MapReduce技术 被引量:18
8
作者 李锐 王斌 《中文信息学报》 CSCD 北大核心 2012年第4期9-20,共12页
用于文本处理的很多数据集已经达到TB、PB甚至更大规模,传统的单机方法难以对这些数据进行有效处理。近年来出现的MapReduce计算框架能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,得到了学术界和工业界的广泛认可和... 用于文本处理的很多数据集已经达到TB、PB甚至更大规模,传统的单机方法难以对这些数据进行有效处理。近年来出现的MapReduce计算框架能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,得到了学术界和工业界的广泛认可和使用。目前,MapReduce已经被用于自然语言处理、机器学习及大规模图处理等领域。该文首先对MapReduce做了简单的介绍,并分析了其特点、优势还有不足;然后对MapReduce近年来在文本处理各个方面的应用进行分类总结和整理;最后对MapReduce的系统和性能方面的研究也做了一些介绍与展望。 展开更多
关键词 文本处理 MAPREDUCE 分布式计算 综述 HADOOP
下载PDF
基于Hadoop云计算平台的海量文本处理研究 被引量:11
9
作者 张学亮 陈金勇 陈勇 《无线电通信技术》 2014年第1期54-57,共4页
针对海量文本数据处理,为实现快速文本处理响应,缩短海量数据为辅助决策提供服务的时间,基于Hadoop云计算平台,建立HDFS分布式文件系统存储海量文本数据集,通过文本词频利用MapReduce原理建立分布式索引,以分布式数据库HBase存储关键词... 针对海量文本数据处理,为实现快速文本处理响应,缩短海量数据为辅助决策提供服务的时间,基于Hadoop云计算平台,建立HDFS分布式文件系统存储海量文本数据集,通过文本词频利用MapReduce原理建立分布式索引,以分布式数据库HBase存储关键词索引,并提供实时检索,实现对海量文本数据的分布式并行处理。实验结果表明,Hadoop框架为大规模数据的分布式并行处理提供了很好的解决方案。 展开更多
关键词 海量文本处理 HADOOP HDFS HBASE MAPREDUCE 分布式并行处理
下载PDF
通用文本处理方法的研究与设计 被引量:3
10
作者 宋友 梁士兴 黄璐 《计算机工程》 CAS CSCD 北大核心 2010年第6期1-4,共4页
设计描述通用文本处理逻辑的规则以及执行规则的引擎,使开发文本处理程序简化为开发应用规则。用XML描述规则的数据模型,规则元素包括原子规则、规则集、前置条件和数据上下文,在规则中用正则表达式实现文本匹配,用转义符和脚本语言实... 设计描述通用文本处理逻辑的规则以及执行规则的引擎,使开发文本处理程序简化为开发应用规则。用XML描述规则的数据模型,规则元素包括原子规则、规则集、前置条件和数据上下文,在规则中用正则表达式实现文本匹配,用转义符和脚本语言实现多种转换逻辑。利用该方法进行Web主题文本提取,验证了规则的合理性和引擎的有效性。 展开更多
关键词 文本处理 正则表达式 脚本语言
下载PDF
文本处理中基于随机映射的加速LSI方法 被引量:1
11
作者 钱晓东 王正欧 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2005年第4期372-376,共5页
首先针对在文本处理的高维矢量环境中Kohonen自组织映射神经网络的计算瓶颈问题和输入矢量空间中存在的问题进行分析,然后对随机映射(RM)和隐含语义索引(LSI)方法分别进行理论分析,提出用于文本处理的基于随机映射的加速LSI方法.试验结... 首先针对在文本处理的高维矢量环境中Kohonen自组织映射神经网络的计算瓶颈问题和输入矢量空间中存在的问题进行分析,然后对随机映射(RM)和隐含语义索引(LSI)方法分别进行理论分析,提出用于文本处理的基于随机映射的加速LSI方法.试验结果表明,加速LSI方法可以在凸现原有语义联系的基础上,低代价、有效、可控地解决上述问题,极大地降低文本处理环境中Kohonen自组织神经网络的规模和计算代价. 展开更多
关键词 文本处理 隐含语义索引 自组织神经网络 随机映射
下载PDF
基于词汇坐标的语料库文本处理模型:原理及方法 被引量:1
12
作者 刘国兵 刘瑞 《河南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期133-136,共4页
介绍基于词汇坐标的语料库文本处理模型,并对英语文本词汇坐标思想进行详细阐述.对语料库文本进行词汇坐标化处理从本质上讲就是从字母串到数字串的映射实现过程.基于词汇坐标的文本处理模型改变了传统的语料库检索模式,从一定程度上适... 介绍基于词汇坐标的语料库文本处理模型,并对英语文本词汇坐标思想进行详细阐述.对语料库文本进行词汇坐标化处理从本质上讲就是从字母串到数字串的映射实现过程.基于词汇坐标的文本处理模型改变了传统的语料库检索模式,从一定程度上适应了当前超大型语料库建设的需要. 展开更多
关键词 语料库 词汇坐标 文本处理
下载PDF
基于matlab的文本处理系统的设计与实现 被引量:1
13
作者 费扬 杜庆治 《软件》 2017年第8期226-229,共4页
为了进行关键词的文本查重和文本检索,设计出基于matlab的文本处理系统。首先,研究文本处理系统的相关原理及技术;其次,设计系统的总体框架,细化功能;最后,采用matlab语言来设计系统,利用多个TXT文本构建语料数据库,设计出基于matlab的... 为了进行关键词的文本查重和文本检索,设计出基于matlab的文本处理系统。首先,研究文本处理系统的相关原理及技术;其次,设计系统的总体框架,细化功能;最后,采用matlab语言来设计系统,利用多个TXT文本构建语料数据库,设计出基于matlab的文本处理系统应用程序。测试表明:该系统能有效地实现文本查重和文本检索。 展开更多
关键词 MATLAB 文本处理 文本查重 文本检索 TF-IDF
下载PDF
解构和整合:文本处理的两个核心环节 被引量:3
14
作者 黄厚江 《语文教学通讯(初中)(B)》 2013年第1期9-11,共3页
阅读教学的文本处理,是一个系统的过程。这个过程包含了文本解读——文本解构——内容选择——内容整合等诸多环节。在这个过程中,文本解读和内容选择已经得到了人们广泛的关注。我自己也先后写过不止一篇文章,阐述自己的认识。而文... 阅读教学的文本处理,是一个系统的过程。这个过程包含了文本解读——文本解构——内容选择——内容整合等诸多环节。在这个过程中,文本解读和内容选择已经得到了人们广泛的关注。我自己也先后写过不止一篇文章,阐述自己的认识。而文本解构和文本整合还没有得到人们应有的重视。 展开更多
关键词 文本处理 内容整合 解构 内容选择 文本解读 阅读教学 文章
下载PDF
浅谈CorelDRAW中的文本处理 被引量:1
15
作者 周倩 叶潮流 《电脑知识与技术(过刊)》 2010年第17期4781-4782,共2页
艺术作品的创作,离不开文本的辅助处理。不仅是一款矢量图创作的专业软件,也是一款集文字处理和图文混排的软件。CorelDRAW为用户提供了如何处理对美术文本和段落文本的方法。
关键词 文本处理 设计文本 图文混排 CORELDRAW
下载PDF
心理契约视角下文学鉴赏课程教学与文本处理
16
作者 傅嘉 《教育理论与实践》 CSSCI 北大核心 2017年第27期50-52,共3页
心理契约作为一种主观的心理约定,存在于教学的主体与客体之间。文学鉴赏课程中的师生心理契约具有主观性、内隐性、变动性和非盈利性的特点。构建文学鉴赏课程教学中的和谐心理契约需要构建和谐的师生关系,教师要与学生实现心理相守以... 心理契约作为一种主观的心理约定,存在于教学的主体与客体之间。文学鉴赏课程中的师生心理契约具有主观性、内隐性、变动性和非盈利性的特点。构建文学鉴赏课程教学中的和谐心理契约需要构建和谐的师生关系,教师要与学生实现心理相守以及从和谐心理的角度处理文本。 展开更多
关键词 心理契约 文学鉴赏课程 和谐教学关系 文本处理
下载PDF
再现中文化Adobe InDesign2.0强大的文本处理功能及操作方法
17
作者 王彩印 《广东印刷》 2007年第1期23-24,共2页
InDesign是Adobe公司通过对已有排版软件的透测分析,取其精华。将Quark公司QuarkXPress和著名Corel公司CoreIVentura等优秀排版软件的高度结构化程序方式与自然化的PageMaker方式相结合,提供一系列完善的排版功能来满足杂志、书籍、... InDesign是Adobe公司通过对已有排版软件的透测分析,取其精华。将Quark公司QuarkXPress和著名Corel公司CoreIVentura等优秀排版软件的高度结构化程序方式与自然化的PageMaker方式相结合,提供一系列完善的排版功能来满足杂志、书籍、广告等灵活多变、复杂的设计工作的排版软件。 展开更多
关键词 InDesign2.0 Adobe公司 QUARKXPRESS 操作方法 文本处理 中文化 PAGEMAKER Corel公司
下载PDF
敲启文本细细寻——由“与文本对话”引发的对文本处理的思考
18
作者 王建 《语文教学研究》 2011年第4期26-27,共2页
解读文本是阅读教学的关键和根本,然而当前阅读教学更多集中在课堂操作程序和技术上。一方面漠视文本,追求课堂的热闹纷繁;另一方面,忽视学生对文本的理解,教师按照自己的预设,层层盘问,不停地把学生的回答扭到自己准备好的答案... 解读文本是阅读教学的关键和根本,然而当前阅读教学更多集中在课堂操作程序和技术上。一方面漠视文本,追求课堂的热闹纷繁;另一方面,忽视学生对文本的理解,教师按照自己的预设,层层盘问,不停地把学生的回答扭到自己准备好的答案上,结果使深刻的理性流于形式。如何挖掘出文本的内在价值和教育价值,构建一个师生互动的良好而和谐的课堂,以彰显语文学习的魅力呢?笔者谈一些自己的想法和做法,以求语文学习的要义。 展开更多
关键词 文本处理 文本对话 阅读教学 语文学习 解读文本 操作程序 教育价值 内在价值
下载PDF
划分“11段”的思想在文本处理方面的研究
19
作者 王慧慧 《电脑知识与技术》 2009年第10X期8557-8558,共2页
将文本进行语法分析的结果存放于11段的数据结构中,通过语意分析提取语句中的各种知识,存放于事件表和实体表中,然后由问句触发一系列动作,从而执行相应的运算,这在文本处理方面具有很好的应用前景。
关键词 11段 文本处理 事件 实体
下载PDF
Windows环境下蒙古文复杂文本处理的研究 被引量:6
20
作者 斯.劳格劳 敖其尔 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第5期582-585,共4页
简要介绍了复杂文本和Uniscribe布局引擎,然后介绍一种基于Uniscribe的蒙古文Unicode文本的解释算法,解决Windows环境下字处理软件不支持蒙古文国际标准编码的问题.该算法具有较好的通用性,能够有效处理多种复杂文本语言,在蒙古文字处... 简要介绍了复杂文本和Uniscribe布局引擎,然后介绍一种基于Uniscribe的蒙古文Unicode文本的解释算法,解决Windows环境下字处理软件不支持蒙古文国际标准编码的问题.该算法具有较好的通用性,能够有效处理多种复杂文本语言,在蒙古文字处理软件MWord中的应用说明了该算法的有效性. 展开更多
关键词 蒙古文 复杂文本 文本处理 Uniscribe OPENTYPE
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部