期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
中美政府网站的网页文本对比及编译
1
作者 冯琰 《江苏理工学院学报》 2016年第3期10-15,共6页
以中国中央人民政府英文网站和美国联邦政府网站的网页文本为研究语料,以德国学者Werlich的文本语法为理论框架,构建适用于政府网站编译的文本比较模式,并将其运用于中国政府网站英文版的编译,编译了其首页文本的新模板,既突出中国集体... 以中国中央人民政府英文网站和美国联邦政府网站的网页文本为研究语料,以德国学者Werlich的文本语法为理论框架,构建适用于政府网站编译的文本比较模式,并将其运用于中国政府网站英文版的编译,编译了其首页文本的新模板,既突出中国集体主义精神,又展示中国民众生活,同时,照顾目标读者的期待视野和阅读习惯。 展开更多
关键词 中美政府英文网站 网页文本对比 编译
下载PDF
一种改进的文本网页分类特征选择方法 被引量:8
2
作者 李粤 李星 +1 位作者 刘辉 许静芳 《计算机应用》 CSCD 北大核心 2004年第7期119-121,共3页
网页分类是网络信息检索研究的关键技术之一。文中针对分类技术中的特征选择方法展开研究。在分析、比较常用的文本分类特征选择方法基础上 ,提出了一种联合特征选择方法。该方法将已有的X2 统计方法和互信息方法综合起来 ,在标准文本... 网页分类是网络信息检索研究的关键技术之一。文中针对分类技术中的特征选择方法展开研究。在分析、比较常用的文本分类特征选择方法基础上 ,提出了一种联合特征选择方法。该方法将已有的X2 统计方法和互信息方法综合起来 ,在标准文本网页数据集分类实验中 ,综合查全率和查准率得到明显的提高。该选择方法已应用于“网络指南针” 展开更多
关键词 文本网页分类 特征选择 X^2统计量 互信息量 联合特征选择
下载PDF
融合LSI和支持向量聚类的网页文本分类算法 被引量:1
3
作者 史长琼 黄辉 +2 位作者 王大卫 姜腊林 扶宗文 《计算机应用研究》 CSCD 北大核心 2009年第12期4523-4525,共3页
特征选择和分类算法是网页文本聚类中最关键的技术。提出对网页文本提取特征值后,利用潜在语义索引对网页文本降维,采用支持向量聚类(SVC)算法对降维后的特征向量进行聚类,以此进行文本分类。实验结果显示具有较好的效果。
关键词 特征提取 潜在语义索引 网页文本 语义聚类 支持向量聚类
下载PDF
基于混合智能算法的网页文本分类仿真研究 被引量:5
4
作者 李建军 宋志章 《科技通报》 北大核心 2012年第6期152-154,共3页
网页文本特征数常高达上万个,无用和冗余特征相当多,为提高网页文本分类精度,提出一种混合智能算法的网页文本分类方法。首先采用遗传算法对网页文本特征初步选择,然后采用蚁群算法对初步选择特征进行精细选择,最后采用K近邻算法建立文... 网页文本特征数常高达上万个,无用和冗余特征相当多,为提高网页文本分类精度,提出一种混合智能算法的网页文本分类方法。首先采用遗传算法对网页文本特征初步选择,然后采用蚁群算法对初步选择特征进行精细选择,最后采用K近邻算法建立文本分类器。结果表明,混合智能算法很好消除无用和冗余特征,提高了网页文本分类的精度,加快分类速度。 展开更多
关键词 网页文本 智能算法 分类方法 文本特征
下载PDF
基于网页结构特征的网页主要文本信息抽取策略 被引量:4
5
作者 火善栋 《现代计算机》 2008年第4期73-75,共3页
根据网页文本信息的存储特点,提出一种网页文本信息抽取策略,有效地实现了对文本丰富型网页中主要文本信息的抽取工作,该抽取方法具有较强的空间适应性和时间适应性。
关键词 表格 网页文本 信息抽取
下载PDF
绍兴旅游网页文本翻译中的中英思维模式转换 被引量:2
6
作者 王鉴莺 《佳木斯职业学院学报》 2014年第4期406-407,共2页
本文通过对比分析中英思维模式在句子结构、表达风格、语篇构成三方面的差异,试图获得英译绍兴旅游网页文本的有益借鉴。
关键词 中英思维模式 绍兴旅游 网页文本
下载PDF
面向网页文本的地理要素变化发现 被引量:4
7
作者 郭俊枫 赵仁亮 郑娇龙 《地理信息世界》 2015年第1期52-56,共5页
地理要素变化发现是地理信息数据库动态更新的重要组成部分。互联网在信息传播中扮演着越来越重要的角色,网页文本中蕴含着一些现势性很强的地理要素信息,可作为地理要素变化发现的数据源。本文结合网络爬虫和朴素贝叶斯分类模型,提出... 地理要素变化发现是地理信息数据库动态更新的重要组成部分。互联网在信息传播中扮演着越来越重要的角色,网页文本中蕴含着一些现势性很强的地理要素信息,可作为地理要素变化发现的数据源。本文结合网络爬虫和朴素贝叶斯分类模型,提出并实现了一种面向网页文本的地理要素变化发现方法。首先,本文在收集分析地理要素变化新闻锚文本的基础上,构建了网络地理要素变化新闻关键词库,并基于关键词库设计了适于地理要素变化发现的网络爬虫,实现了候选网页文本的主动获取;接着为了提取地理要素变化新闻,本文训练构造了适于地理要素变化发现的朴素贝叶斯分类器,对候选网页文本进行筛选。最后通过实验对比了本文方法与现有方法在准确性和全面性上的表现。 展开更多
关键词 地理要素 动态更新 变化发现 网页文本 贝叶斯分类
下载PDF
基于潜在语义分析的网页文本分类研究 被引量:2
8
作者 王剑锋 乔冬 +1 位作者 麻丽娜 李新叶 《应用能源技术》 2009年第11期41-44,共4页
传统的基于词空间的文本分类方法很难处理文本的高维特性,提出基于潜在语义空间的网页文本分类方法,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间。在潜在语义空间中利用支持向量机方法实现文本分类;实验... 传统的基于词空间的文本分类方法很难处理文本的高维特性,提出基于潜在语义空间的网页文本分类方法,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间。在潜在语义空间中利用支持向量机方法实现文本分类;实验表明该方法对于改进文本分类的性能具有较好的效果。 展开更多
关键词 潜在语义分析 网页文本分类 支持向量机
下载PDF
基于网页文本的数据处理类岗位需求分析 被引量:3
9
作者 陈伟龙 邱梁泉 张小华 《信息记录材料》 2018年第11期219-220,共2页
大数据背景下,数据处理类岗位需求激增,本文通过网页爬虫获取拉勾网一年的网页数据,分析数据处理类岗位的行业分布和地域分布。将数据处理类岗位分位三类:数据分析师、数据工程师、数据科学家。从薪资水平、岗位职责和要求、就业技能三... 大数据背景下,数据处理类岗位需求激增,本文通过网页爬虫获取拉勾网一年的网页数据,分析数据处理类岗位的行业分布和地域分布。将数据处理类岗位分位三类:数据分析师、数据工程师、数据科学家。从薪资水平、岗位职责和要求、就业技能三个方面分析三类岗位的差异,选取公司规模、融资阶段、经验和学历要求四个指标,使用Kruskal-Wallis检验分析不同岗位的薪资影响因素,为数据人才就业和职业发提供参考。 展开更多
关键词 数据处理岗 网页文本爬虫 Kruskal-Wallis检验
下载PDF
Word格式化网页文本全攻略
10
作者 温仁凤 《教育信息技术》 2007年第9期48-48,F0003,共2页
一、通过实例掌握操作技巧 网上复制下来的文字材料,在Word中进行排版时,如何进行快速格式化?查看过不少这方面的资料,都谈到了一些有用的操作方法,但用起来总是稍有欠缺,不能够尽如人意。笔者在参考这些资料的同时,经过反复的... 一、通过实例掌握操作技巧 网上复制下来的文字材料,在Word中进行排版时,如何进行快速格式化?查看过不少这方面的资料,都谈到了一些有用的操作方法,但用起来总是稍有欠缺,不能够尽如人意。笔者在参考这些资料的同时,经过反复的试验、摸索、总结得出了一个较全面的方案,下面以一实例进行说明: 展开更多
关键词 快速格式化 WORD 网页文本 全攻略 操作技巧 操作方法 实例
下载PDF
轻松收集网页文本
11
作者 树林 《软件》 2005年第8期65-65,共1页
从网页中复制粘贴下来的文章总是会经常有很多空格或者空行需要删除,如果一个一个找到后,然后再删除就显得太麻烦了。现在用 Microsoft OfficeWord"替换"功能就可以很快删除这一切。
关键词 网页文本 MICROSOFT 收集 OFFICE “替换”功能 WORD 删除 空格
下载PDF
用CSS滤镜和蒙古文镜像字体制作蒙古文文本网页的方法
12
作者 海泉 《内蒙古民族大学学报》 2011年第2期11-12,共2页
文章介绍了用CSS滤镜和蒙古文镜像字体实现蒙古文文本网页编辑和显示的一种方法。这种方法克服了用图形方式或逆向输入蒙古文的方法制作蒙古文网页的不足,能够直接从WPS等文本编辑器通过复制和粘贴的方法将蒙古文文本内容复制到网页编... 文章介绍了用CSS滤镜和蒙古文镜像字体实现蒙古文文本网页编辑和显示的一种方法。这种方法克服了用图形方式或逆向输入蒙古文的方法制作蒙古文网页的不足,能够直接从WPS等文本编辑器通过复制和粘贴的方法将蒙古文文本内容复制到网页编辑器中,同样通过复制和粘贴的方法将网页中显示的蒙古文文本内容复制到WPS等文本编辑中,保证文本的内容和顺序不变。这样既提高蒙古文网页编辑速度,又能为广大用户移置网页内容提供了方便。 展开更多
关键词 CSS滤镜 FLIPV FLIPH 蒙古文镜像字体 网页对象 文本网页
下载PDF
网页文本特效——面纱效果
13
作者 7star 《电脑知识与技术(经验技巧)》 2003年第12期84-85,共2页
关键词 网页文本 特效 背景图片 面纱
下载PDF
重新语境化视域下能源企业网页文本英译研究
14
作者 韩依格 王晟 《海外英语》 2022年第12期16-18,共3页
由于中西方语境差异,企业网页文本在翻译时需要进行重新语境化改适转换。研究选取五家中国能源企业中英文网页文本,分析了要素删除、要素添加、要素替代、要素重组等四种改适转换形式的具体应用。通过改适转换,信息要素能够摆脱原语境... 由于中西方语境差异,企业网页文本在翻译时需要进行重新语境化改适转换。研究选取五家中国能源企业中英文网页文本,分析了要素删除、要素添加、要素替代、要素重组等四种改适转换形式的具体应用。通过改适转换,信息要素能够摆脱原语境的束缚,满足新语境的要求,传递有效信息,从而提高企业对外交流的有效性。 展开更多
关键词 重新语境化 能源企业 网页文本 汉译英 改适转换
下载PDF
网页文本,获取排版多步合成一步走
15
作者 杯中水 《网友世界》 2010年第3期65-65,共1页
需要保存网页上的文本信息时,通常情况下会选择另存为文本文件或者复制粘贴到其他文字处理软件中,然后再编辑处理的方法,但整个过程非常繁琐,需要经过多步操作,排版时也比较困难,
关键词 网页文本 多步合成 排版 文字处理软件 文本信息 文本文件 编辑处理
下载PDF
从文本中获取植物知识方法的研究 被引量:13
16
作者 罗贝 吴洁 +1 位作者 曹存根 邵志清 《计算机科学》 CSCD 北大核心 2005年第10期6-13,共8页
知识获取一直是人工智能中的一个关键问题。当前,知识的文本挖掘(KAT)已经成为计算机领域的一个重要的研究课题。本文中,给出了基于植物本体的从海量网页文本库中自动获取植物领域知识的方法。该方法包括两个部分,一是植物本体(Botanica... 知识获取一直是人工智能中的一个关键问题。当前,知识的文本挖掘(KAT)已经成为计算机领域的一个重要的研究课题。本文中,给出了基于植物本体的从海量网页文本库中自动获取植物领域知识的方法。该方法包括两个部分,一是植物本体(BotanicalOntology),它是顾芳博士等建立的生物本体的扩展。第二部分是以植物本体为基础,在网络文本库中进行文本挖掘(TextMining),自动获取植物知识。实验证明,基于本体的文本挖掘是一种有效的知识获取方法。 展开更多
关键词 植物本体 植物知识 基于本体的知识获取与分析 知识获取 文本挖掘 植物 自动获取 人工智能 领域知识 网页文本 实验证明 获取方法
下载PDF
国外大数据硕士人才培养的经验与启示——基于大数据文本挖掘 被引量:9
17
作者 阮敬 刘宏晶 纪宏 《统计与信息论坛》 CSSCI 北大核心 2017年第9期29-36,共8页
利用半结构化文本数据分析方法,从国外高校387个大数据硕士相关项目及国内22个相关硕士项目人才培养方案中提取出大数据高端人才培养的七大方向,并对不同方向的培养目标、课程、学分、学制等设置及其对应的人才市场需求匹配情况等相关... 利用半结构化文本数据分析方法,从国外高校387个大数据硕士相关项目及国内22个相关硕士项目人才培养方案中提取出大数据高端人才培养的七大方向,并对不同方向的培养目标、课程、学分、学制等设置及其对应的人才市场需求匹配情况等相关内容进行剖析,为改革中国大数据高端人才的供给提出一定建议。 展开更多
关键词 大数据 大数据人才 人才培养 网页文本挖掘
下载PDF
基于NB和CHI值的农业文本分类方法 被引量:4
18
作者 周云成 许童羽 邓寒冰 《江苏农业科学》 2018年第17期219-223,共5页
对采集自网络的农业文本进行自动化分类是进一步利用的前提。拟提出1种结合朴素贝叶斯(naive Bayes,简称NB)和χ2(Chi-square,简称CHI)特征词选取的农业文本分类方法,并用Python语言实现相应的文本分类程序和特征词选择程序。通过从农... 对采集自网络的农业文本进行自动化分类是进一步利用的前提。拟提出1种结合朴素贝叶斯(naive Bayes,简称NB)和χ2(Chi-square,简称CHI)特征词选取的农业文本分类方法,并用Python语言实现相应的文本分类程序和特征词选择程序。通过从农业信息网站获取已经过良好分类的文档,并对其进行净化、分词等预处理,构建含有4种文本的农业语料库。针对特征词选择数量、训练样本数等对分类识别率的影响及用标题进行网页文本分类的可行性问题开展研究。结果表明,文本分类的正确率主要由CHI值较高的少量特征词条决定,但是按CHI值降序增加特征词条的数量不会对文本识别率造成负面影响;训练样本数量对文本分类的正确率具有一定影响,为了达到较高的识别率,训练样本需要达到一定的数量,然后持续增加样本量,对识别率没有明显贡献;利用网页标题对采集自网络的农业文本进行分类是可行的。通过结合朴素贝叶斯和基于CHI值的特征词选取方法能够很好地对农业文本进行分类,识别率较高。 展开更多
关键词 文本分类 农业文本 朴素贝叶斯 CHI值 特征词选取 标题 网页文本分类
下载PDF
基于文本特征的Deep Web分类研究
19
作者 罗国涛 马在强 《计算机与现代化》 2012年第10期58-61,64,共5页
讨论若干Deep Web数据库分类准确性的前沿技术,建立基于词频和DOM树的文本特征提取方法模型,提出计算Deep Web数据库的基于权值的K-NN(K Nearest Neighbors)分类优化算法。利用UIUC提供的TEL-8数据集和WEKA平台的各类算法进行实验,并对... 讨论若干Deep Web数据库分类准确性的前沿技术,建立基于词频和DOM树的文本特征提取方法模型,提出计算Deep Web数据库的基于权值的K-NN(K Nearest Neighbors)分类优化算法。利用UIUC提供的TEL-8数据集和WEKA平台的各类算法进行实验,并对分类精度、召回率和综合F-measure等测度上的分类结果进行比较。实验结果表明,该方法模型在3个指标上表现都较为突出。 展开更多
关键词 DEEP Web 网页文本 词频 K-NN分类算法 DOM树
下载PDF
目的论视角下西安博物馆网页英译策略探析
20
作者 雷蕾 陈柯 《西安石油大学学报(社会科学版)》 2017年第4期104-107,共4页
以功能目的论为理论指导,以西安各博物馆英文网页文本为研究对象,针对其特点进行系统分析,提出博物馆英文网页翻译中应采取的变通翻译策略,以期达到使博物馆英文网页文本能够如实贴切地传递文化信息的目的,为西安历史文化的对外传播奠... 以功能目的论为理论指导,以西安各博物馆英文网页文本为研究对象,针对其特点进行系统分析,提出博物馆英文网页翻译中应采取的变通翻译策略,以期达到使博物馆英文网页文本能够如实贴切地传递文化信息的目的,为西安历史文化的对外传播奠定良好基础。 展开更多
关键词 博物馆 网页文本 功能目的论 翻译策略
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部