期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
41
篇文章
<
1
2
3
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中美政府网站的网页文本对比及编译
1
作者
冯琰
《江苏理工学院学报》
2016年第3期10-15,共6页
以中国中央人民政府英文网站和美国联邦政府网站的网页文本为研究语料,以德国学者Werlich的文本语法为理论框架,构建适用于政府网站编译的文本比较模式,并将其运用于中国政府网站英文版的编译,编译了其首页文本的新模板,既突出中国集体...
以中国中央人民政府英文网站和美国联邦政府网站的网页文本为研究语料,以德国学者Werlich的文本语法为理论框架,构建适用于政府网站编译的文本比较模式,并将其运用于中国政府网站英文版的编译,编译了其首页文本的新模板,既突出中国集体主义精神,又展示中国民众生活,同时,照顾目标读者的期待视野和阅读习惯。
展开更多
关键词
中美政府英文网站
网页文本对比
编译
下载PDF
职称材料
一种改进的文本网页分类特征选择方法
被引量:
8
2
作者
李粤
李星
+1 位作者
刘辉
许静芳
《计算机应用》
CSCD
北大核心
2004年第7期119-121,共3页
网页分类是网络信息检索研究的关键技术之一。文中针对分类技术中的特征选择方法展开研究。在分析、比较常用的文本分类特征选择方法基础上 ,提出了一种联合特征选择方法。该方法将已有的X2 统计方法和互信息方法综合起来 ,在标准文本...
网页分类是网络信息检索研究的关键技术之一。文中针对分类技术中的特征选择方法展开研究。在分析、比较常用的文本分类特征选择方法基础上 ,提出了一种联合特征选择方法。该方法将已有的X2 统计方法和互信息方法综合起来 ,在标准文本网页数据集分类实验中 ,综合查全率和查准率得到明显的提高。该选择方法已应用于“网络指南针”
展开更多
关键词
文本
网页
分类
特征选择
X^2统计量
互信息量
联合特征选择
下载PDF
职称材料
融合LSI和支持向量聚类的网页文本分类算法
被引量:
1
3
作者
史长琼
黄辉
+2 位作者
王大卫
姜腊林
扶宗文
《计算机应用研究》
CSCD
北大核心
2009年第12期4523-4525,共3页
特征选择和分类算法是网页文本聚类中最关键的技术。提出对网页文本提取特征值后,利用潜在语义索引对网页文本降维,采用支持向量聚类(SVC)算法对降维后的特征向量进行聚类,以此进行文本分类。实验结果显示具有较好的效果。
关键词
特征提取
潜在语义索引
网页
文本
语义聚类
支持向量聚类
下载PDF
职称材料
基于混合智能算法的网页文本分类仿真研究
被引量:
5
4
作者
李建军
宋志章
《科技通报》
北大核心
2012年第6期152-154,共3页
网页文本特征数常高达上万个,无用和冗余特征相当多,为提高网页文本分类精度,提出一种混合智能算法的网页文本分类方法。首先采用遗传算法对网页文本特征初步选择,然后采用蚁群算法对初步选择特征进行精细选择,最后采用K近邻算法建立文...
网页文本特征数常高达上万个,无用和冗余特征相当多,为提高网页文本分类精度,提出一种混合智能算法的网页文本分类方法。首先采用遗传算法对网页文本特征初步选择,然后采用蚁群算法对初步选择特征进行精细选择,最后采用K近邻算法建立文本分类器。结果表明,混合智能算法很好消除无用和冗余特征,提高了网页文本分类的精度,加快分类速度。
展开更多
关键词
网页
文本
智能算法
分类方法
文本
特征
下载PDF
职称材料
基于网页结构特征的网页主要文本信息抽取策略
被引量:
4
5
作者
火善栋
《现代计算机》
2008年第4期73-75,共3页
根据网页文本信息的存储特点,提出一种网页文本信息抽取策略,有效地实现了对文本丰富型网页中主要文本信息的抽取工作,该抽取方法具有较强的空间适应性和时间适应性。
关键词
表格
网页
文本
信息抽取
下载PDF
职称材料
绍兴旅游网页文本翻译中的中英思维模式转换
被引量:
2
6
作者
王鉴莺
《佳木斯职业学院学报》
2014年第4期406-407,共2页
本文通过对比分析中英思维模式在句子结构、表达风格、语篇构成三方面的差异,试图获得英译绍兴旅游网页文本的有益借鉴。
关键词
中英思维模式
绍兴旅游
网页
文本
下载PDF
职称材料
面向网页文本的地理要素变化发现
被引量:
4
7
作者
郭俊枫
赵仁亮
郑娇龙
《地理信息世界》
2015年第1期52-56,共5页
地理要素变化发现是地理信息数据库动态更新的重要组成部分。互联网在信息传播中扮演着越来越重要的角色,网页文本中蕴含着一些现势性很强的地理要素信息,可作为地理要素变化发现的数据源。本文结合网络爬虫和朴素贝叶斯分类模型,提出...
地理要素变化发现是地理信息数据库动态更新的重要组成部分。互联网在信息传播中扮演着越来越重要的角色,网页文本中蕴含着一些现势性很强的地理要素信息,可作为地理要素变化发现的数据源。本文结合网络爬虫和朴素贝叶斯分类模型,提出并实现了一种面向网页文本的地理要素变化发现方法。首先,本文在收集分析地理要素变化新闻锚文本的基础上,构建了网络地理要素变化新闻关键词库,并基于关键词库设计了适于地理要素变化发现的网络爬虫,实现了候选网页文本的主动获取;接着为了提取地理要素变化新闻,本文训练构造了适于地理要素变化发现的朴素贝叶斯分类器,对候选网页文本进行筛选。最后通过实验对比了本文方法与现有方法在准确性和全面性上的表现。
展开更多
关键词
地理要素
动态更新
变化发现
网页
文本
贝叶斯分类
下载PDF
职称材料
基于潜在语义分析的网页文本分类研究
被引量:
2
8
作者
王剑锋
乔冬
+1 位作者
麻丽娜
李新叶
《应用能源技术》
2009年第11期41-44,共4页
传统的基于词空间的文本分类方法很难处理文本的高维特性,提出基于潜在语义空间的网页文本分类方法,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间。在潜在语义空间中利用支持向量机方法实现文本分类;实验...
传统的基于词空间的文本分类方法很难处理文本的高维特性,提出基于潜在语义空间的网页文本分类方法,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间。在潜在语义空间中利用支持向量机方法实现文本分类;实验表明该方法对于改进文本分类的性能具有较好的效果。
展开更多
关键词
潜在语义分析
网页
文本
分类
支持向量机
下载PDF
职称材料
基于网页文本的数据处理类岗位需求分析
被引量:
3
9
作者
陈伟龙
邱梁泉
张小华
《信息记录材料》
2018年第11期219-220,共2页
大数据背景下,数据处理类岗位需求激增,本文通过网页爬虫获取拉勾网一年的网页数据,分析数据处理类岗位的行业分布和地域分布。将数据处理类岗位分位三类:数据分析师、数据工程师、数据科学家。从薪资水平、岗位职责和要求、就业技能三...
大数据背景下,数据处理类岗位需求激增,本文通过网页爬虫获取拉勾网一年的网页数据,分析数据处理类岗位的行业分布和地域分布。将数据处理类岗位分位三类:数据分析师、数据工程师、数据科学家。从薪资水平、岗位职责和要求、就业技能三个方面分析三类岗位的差异,选取公司规模、融资阶段、经验和学历要求四个指标,使用Kruskal-Wallis检验分析不同岗位的薪资影响因素,为数据人才就业和职业发提供参考。
展开更多
关键词
数据处理岗
网页
文本
爬虫
Kruskal-Wallis检验
下载PDF
职称材料
Word格式化网页文本全攻略
10
作者
温仁凤
《教育信息技术》
2007年第9期48-48,F0003,共2页
一、通过实例掌握操作技巧 网上复制下来的文字材料,在Word中进行排版时,如何进行快速格式化?查看过不少这方面的资料,都谈到了一些有用的操作方法,但用起来总是稍有欠缺,不能够尽如人意。笔者在参考这些资料的同时,经过反复的...
一、通过实例掌握操作技巧 网上复制下来的文字材料,在Word中进行排版时,如何进行快速格式化?查看过不少这方面的资料,都谈到了一些有用的操作方法,但用起来总是稍有欠缺,不能够尽如人意。笔者在参考这些资料的同时,经过反复的试验、摸索、总结得出了一个较全面的方案,下面以一实例进行说明:
展开更多
关键词
快速格式化
WORD
网页
文本
全攻略
操作技巧
操作方法
实例
下载PDF
职称材料
轻松收集网页文本
11
作者
树林
《软件》
2005年第8期65-65,共1页
从网页中复制粘贴下来的文章总是会经常有很多空格或者空行需要删除,如果一个一个找到后,然后再删除就显得太麻烦了。现在用 Microsoft OfficeWord"替换"功能就可以很快删除这一切。
关键词
网页
文本
MICROSOFT
收集
OFFICE
“替换”功能
WORD
松
删除
空格
下载PDF
职称材料
用CSS滤镜和蒙古文镜像字体制作蒙古文文本网页的方法
12
作者
海泉
《内蒙古民族大学学报》
2011年第2期11-12,共2页
文章介绍了用CSS滤镜和蒙古文镜像字体实现蒙古文文本网页编辑和显示的一种方法。这种方法克服了用图形方式或逆向输入蒙古文的方法制作蒙古文网页的不足,能够直接从WPS等文本编辑器通过复制和粘贴的方法将蒙古文文本内容复制到网页编...
文章介绍了用CSS滤镜和蒙古文镜像字体实现蒙古文文本网页编辑和显示的一种方法。这种方法克服了用图形方式或逆向输入蒙古文的方法制作蒙古文网页的不足,能够直接从WPS等文本编辑器通过复制和粘贴的方法将蒙古文文本内容复制到网页编辑器中,同样通过复制和粘贴的方法将网页中显示的蒙古文文本内容复制到WPS等文本编辑中,保证文本的内容和顺序不变。这样既提高蒙古文网页编辑速度,又能为广大用户移置网页内容提供了方便。
展开更多
关键词
CSS滤镜
FLIPV
FLIPH
蒙古文镜像字体
网页
对象
文本
网页
下载PDF
职称材料
网页文本特效——面纱效果
13
作者
7star
《电脑知识与技术(经验技巧)》
2003年第12期84-85,共2页
关键词
网页
文本
特效
背景图片
面纱
下载PDF
职称材料
重新语境化视域下能源企业网页文本英译研究
14
作者
韩依格
王晟
《海外英语》
2022年第12期16-18,共3页
由于中西方语境差异,企业网页文本在翻译时需要进行重新语境化改适转换。研究选取五家中国能源企业中英文网页文本,分析了要素删除、要素添加、要素替代、要素重组等四种改适转换形式的具体应用。通过改适转换,信息要素能够摆脱原语境...
由于中西方语境差异,企业网页文本在翻译时需要进行重新语境化改适转换。研究选取五家中国能源企业中英文网页文本,分析了要素删除、要素添加、要素替代、要素重组等四种改适转换形式的具体应用。通过改适转换,信息要素能够摆脱原语境的束缚,满足新语境的要求,传递有效信息,从而提高企业对外交流的有效性。
展开更多
关键词
重新语境化
能源企业
网页
文本
汉译英
改适转换
下载PDF
职称材料
网页文本,获取排版多步合成一步走
15
作者
杯中水
《网友世界》
2010年第3期65-65,共1页
需要保存网页上的文本信息时,通常情况下会选择另存为文本文件或者复制粘贴到其他文字处理软件中,然后再编辑处理的方法,但整个过程非常繁琐,需要经过多步操作,排版时也比较困难,
关键词
网页
文本
多步合成
排版
文字处理软件
文本
信息
文本
文件
编辑处理
下载PDF
职称材料
从文本中获取植物知识方法的研究
被引量:
13
16
作者
罗贝
吴洁
+1 位作者
曹存根
邵志清
《计算机科学》
CSCD
北大核心
2005年第10期6-13,共8页
知识获取一直是人工智能中的一个关键问题。当前,知识的文本挖掘(KAT)已经成为计算机领域的一个重要的研究课题。本文中,给出了基于植物本体的从海量网页文本库中自动获取植物领域知识的方法。该方法包括两个部分,一是植物本体(Botanica...
知识获取一直是人工智能中的一个关键问题。当前,知识的文本挖掘(KAT)已经成为计算机领域的一个重要的研究课题。本文中,给出了基于植物本体的从海量网页文本库中自动获取植物领域知识的方法。该方法包括两个部分,一是植物本体(BotanicalOntology),它是顾芳博士等建立的生物本体的扩展。第二部分是以植物本体为基础,在网络文本库中进行文本挖掘(TextMining),自动获取植物知识。实验证明,基于本体的文本挖掘是一种有效的知识获取方法。
展开更多
关键词
植物本体
植物知识
基于本体的知识获取与分析
知识获取
文本
挖掘
植物
自动获取
人工智能
领域知识
网页
文本
实验证明
获取方法
下载PDF
职称材料
国外大数据硕士人才培养的经验与启示——基于大数据文本挖掘
被引量:
9
17
作者
阮敬
刘宏晶
纪宏
《统计与信息论坛》
CSSCI
北大核心
2017年第9期29-36,共8页
利用半结构化文本数据分析方法,从国外高校387个大数据硕士相关项目及国内22个相关硕士项目人才培养方案中提取出大数据高端人才培养的七大方向,并对不同方向的培养目标、课程、学分、学制等设置及其对应的人才市场需求匹配情况等相关...
利用半结构化文本数据分析方法,从国外高校387个大数据硕士相关项目及国内22个相关硕士项目人才培养方案中提取出大数据高端人才培养的七大方向,并对不同方向的培养目标、课程、学分、学制等设置及其对应的人才市场需求匹配情况等相关内容进行剖析,为改革中国大数据高端人才的供给提出一定建议。
展开更多
关键词
大数据
大数据人才
人才培养
网页
文本
挖掘
下载PDF
职称材料
基于NB和CHI值的农业文本分类方法
被引量:
4
18
作者
周云成
许童羽
邓寒冰
《江苏农业科学》
2018年第17期219-223,共5页
对采集自网络的农业文本进行自动化分类是进一步利用的前提。拟提出1种结合朴素贝叶斯(naive Bayes,简称NB)和χ2(Chi-square,简称CHI)特征词选取的农业文本分类方法,并用Python语言实现相应的文本分类程序和特征词选择程序。通过从农...
对采集自网络的农业文本进行自动化分类是进一步利用的前提。拟提出1种结合朴素贝叶斯(naive Bayes,简称NB)和χ2(Chi-square,简称CHI)特征词选取的农业文本分类方法,并用Python语言实现相应的文本分类程序和特征词选择程序。通过从农业信息网站获取已经过良好分类的文档,并对其进行净化、分词等预处理,构建含有4种文本的农业语料库。针对特征词选择数量、训练样本数等对分类识别率的影响及用标题进行网页文本分类的可行性问题开展研究。结果表明,文本分类的正确率主要由CHI值较高的少量特征词条决定,但是按CHI值降序增加特征词条的数量不会对文本识别率造成负面影响;训练样本数量对文本分类的正确率具有一定影响,为了达到较高的识别率,训练样本需要达到一定的数量,然后持续增加样本量,对识别率没有明显贡献;利用网页标题对采集自网络的农业文本进行分类是可行的。通过结合朴素贝叶斯和基于CHI值的特征词选取方法能够很好地对农业文本进行分类,识别率较高。
展开更多
关键词
文本
分类
农业
文本
朴素贝叶斯
CHI值
特征词选取
标题
网页
文本
分类
下载PDF
职称材料
基于文本特征的Deep Web分类研究
19
作者
罗国涛
马在强
《计算机与现代化》
2012年第10期58-61,64,共5页
讨论若干Deep Web数据库分类准确性的前沿技术,建立基于词频和DOM树的文本特征提取方法模型,提出计算Deep Web数据库的基于权值的K-NN(K Nearest Neighbors)分类优化算法。利用UIUC提供的TEL-8数据集和WEKA平台的各类算法进行实验,并对...
讨论若干Deep Web数据库分类准确性的前沿技术,建立基于词频和DOM树的文本特征提取方法模型,提出计算Deep Web数据库的基于权值的K-NN(K Nearest Neighbors)分类优化算法。利用UIUC提供的TEL-8数据集和WEKA平台的各类算法进行实验,并对分类精度、召回率和综合F-measure等测度上的分类结果进行比较。实验结果表明,该方法模型在3个指标上表现都较为突出。
展开更多
关键词
DEEP
Web
网页
文本
词频
K-NN分类算法
DOM树
下载PDF
职称材料
目的论视角下西安博物馆网页英译策略探析
20
作者
雷蕾
陈柯
《西安石油大学学报(社会科学版)》
2017年第4期104-107,共4页
以功能目的论为理论指导,以西安各博物馆英文网页文本为研究对象,针对其特点进行系统分析,提出博物馆英文网页翻译中应采取的变通翻译策略,以期达到使博物馆英文网页文本能够如实贴切地传递文化信息的目的,为西安历史文化的对外传播奠...
以功能目的论为理论指导,以西安各博物馆英文网页文本为研究对象,针对其特点进行系统分析,提出博物馆英文网页翻译中应采取的变通翻译策略,以期达到使博物馆英文网页文本能够如实贴切地传递文化信息的目的,为西安历史文化的对外传播奠定良好基础。
展开更多
关键词
博物馆
网页
文本
功能目的论
翻译策略
下载PDF
职称材料
题名
中美政府网站的网页文本对比及编译
1
作者
冯琰
机构
江苏理工学院外国语学院
出处
《江苏理工学院学报》
2016年第3期10-15,共6页
基金
教育部人文社会科学基金项目(13YJC740136)
江苏高校哲学社会科学研究基金资助项目(2014SJB438)
文摘
以中国中央人民政府英文网站和美国联邦政府网站的网页文本为研究语料,以德国学者Werlich的文本语法为理论框架,构建适用于政府网站编译的文本比较模式,并将其运用于中国政府网站英文版的编译,编译了其首页文本的新模板,既突出中国集体主义精神,又展示中国民众生活,同时,照顾目标读者的期待视野和阅读习惯。
关键词
中美政府英文网站
网页文本对比
编译
Keywords
China and U.S.government web pages
textual comparison
adaptation
分类号
H315.9 [语言文字—英语]
下载PDF
职称材料
题名
一种改进的文本网页分类特征选择方法
被引量:
8
2
作者
李粤
李星
刘辉
许静芳
机构
清华大学电子工程系
出处
《计算机应用》
CSCD
北大核心
2004年第7期119-121,共3页
基金
国家自然科学基金资助项目 (90 1 0 4 0 0 2 )
文摘
网页分类是网络信息检索研究的关键技术之一。文中针对分类技术中的特征选择方法展开研究。在分析、比较常用的文本分类特征选择方法基础上 ,提出了一种联合特征选择方法。该方法将已有的X2 统计方法和互信息方法综合起来 ,在标准文本网页数据集分类实验中 ,综合查全率和查准率得到明显的提高。该选择方法已应用于“网络指南针”
关键词
文本
网页
分类
特征选择
X^2统计量
互信息量
联合特征选择
Keywords
Web pages categorization
feature selection
X 2 statistics
mutual information
combined X 2 feature selection
分类号
TP391.07 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合LSI和支持向量聚类的网页文本分类算法
被引量:
1
3
作者
史长琼
黄辉
王大卫
姜腊林
扶宗文
机构
长沙理工大学计算机与通信工程学院
湖南大学计算机与通信学院
出处
《计算机应用研究》
CSCD
北大核心
2009年第12期4523-4525,共3页
基金
湖南省教育厅自然科学基金资助项目(06C111)
文摘
特征选择和分类算法是网页文本聚类中最关键的技术。提出对网页文本提取特征值后,利用潜在语义索引对网页文本降维,采用支持向量聚类(SVC)算法对降维后的特征向量进行聚类,以此进行文本分类。实验结果显示具有较好的效果。
关键词
特征提取
潜在语义索引
网页
文本
语义聚类
支持向量聚类
Keywords
feature extraction
latent semantic indexing(LSI)
Web text
semantic clustering
support vector clustering(SVC)
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于混合智能算法的网页文本分类仿真研究
被引量:
5
4
作者
李建军
宋志章
机构
齐齐哈尔大学
出处
《科技通报》
北大核心
2012年第6期152-154,共3页
基金
齐齐哈尔大学青年教师科学技术类科研启动支持计划项目(2011k-ZX01)
文摘
网页文本特征数常高达上万个,无用和冗余特征相当多,为提高网页文本分类精度,提出一种混合智能算法的网页文本分类方法。首先采用遗传算法对网页文本特征初步选择,然后采用蚁群算法对初步选择特征进行精细选择,最后采用K近邻算法建立文本分类器。结果表明,混合智能算法很好消除无用和冗余特征,提高了网页文本分类的精度,加快分类速度。
关键词
网页
文本
智能算法
分类方法
文本
特征
Keywords
web text
intelligence algorithm
categorization method
web feature
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于网页结构特征的网页主要文本信息抽取策略
被引量:
4
5
作者
火善栋
机构
重庆三峡学院
出处
《现代计算机》
2008年第4期73-75,共3页
文摘
根据网页文本信息的存储特点,提出一种网页文本信息抽取策略,有效地实现了对文本丰富型网页中主要文本信息的抽取工作,该抽取方法具有较强的空间适应性和时间适应性。
关键词
表格
网页
文本
信息抽取
Keywords
Table
Web Page Text
Information Extraction
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
绍兴旅游网页文本翻译中的中英思维模式转换
被引量:
2
6
作者
王鉴莺
机构
绍兴文理学院元培学院
出处
《佳木斯职业学院学报》
2014年第4期406-407,共2页
文摘
本文通过对比分析中英思维模式在句子结构、表达风格、语篇构成三方面的差异,试图获得英译绍兴旅游网页文本的有益借鉴。
关键词
中英思维模式
绍兴旅游
网页
文本
Keywords
thinking mode of Chinese and English
Shaoxing tourism
Webpage text
分类号
H315.9 [语言文字—英语]
下载PDF
职称材料
题名
面向网页文本的地理要素变化发现
被引量:
4
7
作者
郭俊枫
赵仁亮
郑娇龙
机构
中国矿业大学(北京)地球科学与测绘工程学院
国家基础地理信息中心
出处
《地理信息世界》
2015年第1期52-56,共5页
文摘
地理要素变化发现是地理信息数据库动态更新的重要组成部分。互联网在信息传播中扮演着越来越重要的角色,网页文本中蕴含着一些现势性很强的地理要素信息,可作为地理要素变化发现的数据源。本文结合网络爬虫和朴素贝叶斯分类模型,提出并实现了一种面向网页文本的地理要素变化发现方法。首先,本文在收集分析地理要素变化新闻锚文本的基础上,构建了网络地理要素变化新闻关键词库,并基于关键词库设计了适于地理要素变化发现的网络爬虫,实现了候选网页文本的主动获取;接着为了提取地理要素变化新闻,本文训练构造了适于地理要素变化发现的朴素贝叶斯分类器,对候选网页文本进行筛选。最后通过实验对比了本文方法与现有方法在准确性和全面性上的表现。
关键词
地理要素
动态更新
变化发现
网页
文本
贝叶斯分类
Keywords
dynamic udpdating
geographic features
changed detecting
internet web page text
bayes classification
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
P208 [天文地球—地图制图学与地理信息工程]
下载PDF
职称材料
题名
基于潜在语义分析的网页文本分类研究
被引量:
2
8
作者
王剑锋
乔冬
麻丽娜
李新叶
机构
华北电力大学科技学院信息工程系
出处
《应用能源技术》
2009年第11期41-44,共4页
基金
华北电力大学青年教师科研基金项目(200811036)
文摘
传统的基于词空间的文本分类方法很难处理文本的高维特性,提出基于潜在语义空间的网页文本分类方法,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间。在潜在语义空间中利用支持向量机方法实现文本分类;实验表明该方法对于改进文本分类的性能具有较好的效果。
关键词
潜在语义分析
网页
文本
分类
支持向量机
Keywords
Latent semantic analysis
Web text categorization
Support vector machine
分类号
TP334.2 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于网页文本的数据处理类岗位需求分析
被引量:
3
9
作者
陈伟龙
邱梁泉
张小华
机构
仲恺农业工程学院
出处
《信息记录材料》
2018年第11期219-220,共2页
文摘
大数据背景下,数据处理类岗位需求激增,本文通过网页爬虫获取拉勾网一年的网页数据,分析数据处理类岗位的行业分布和地域分布。将数据处理类岗位分位三类:数据分析师、数据工程师、数据科学家。从薪资水平、岗位职责和要求、就业技能三个方面分析三类岗位的差异,选取公司规模、融资阶段、经验和学历要求四个指标,使用Kruskal-Wallis检验分析不同岗位的薪资影响因素,为数据人才就业和职业发提供参考。
关键词
数据处理岗
网页
文本
爬虫
Kruskal-Wallis检验
分类号
F713.364 [经济管理—产业经济]
C964.2 [经济管理—人力资源管理]
下载PDF
职称材料
题名
Word格式化网页文本全攻略
10
作者
温仁凤
机构
广东省江门市高级技工学校
出处
《教育信息技术》
2007年第9期48-48,F0003,共2页
文摘
一、通过实例掌握操作技巧 网上复制下来的文字材料,在Word中进行排版时,如何进行快速格式化?查看过不少这方面的资料,都谈到了一些有用的操作方法,但用起来总是稍有欠缺,不能够尽如人意。笔者在参考这些资料的同时,经过反复的试验、摸索、总结得出了一个较全面的方案,下面以一实例进行说明:
关键词
快速格式化
WORD
网页
文本
全攻略
操作技巧
操作方法
实例
分类号
TP311.11 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
轻松收集网页文本
11
作者
树林
出处
《软件》
2005年第8期65-65,共1页
文摘
从网页中复制粘贴下来的文章总是会经常有很多空格或者空行需要删除,如果一个一个找到后,然后再删除就显得太麻烦了。现在用 Microsoft OfficeWord"替换"功能就可以很快删除这一切。
关键词
网页
文本
MICROSOFT
收集
OFFICE
“替换”功能
WORD
松
删除
空格
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
TP317.1 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
用CSS滤镜和蒙古文镜像字体制作蒙古文文本网页的方法
12
作者
海泉
机构
呼和浩特民族学院计算机系
出处
《内蒙古民族大学学报》
2011年第2期11-12,共2页
文摘
文章介绍了用CSS滤镜和蒙古文镜像字体实现蒙古文文本网页编辑和显示的一种方法。这种方法克服了用图形方式或逆向输入蒙古文的方法制作蒙古文网页的不足,能够直接从WPS等文本编辑器通过复制和粘贴的方法将蒙古文文本内容复制到网页编辑器中,同样通过复制和粘贴的方法将网页中显示的蒙古文文本内容复制到WPS等文本编辑中,保证文本的内容和顺序不变。这样既提高蒙古文网页编辑速度,又能为广大用户移置网页内容提供了方便。
关键词
CSS滤镜
FLIPV
FLIPH
蒙古文镜像字体
网页
对象
文本
网页
分类号
TP313 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
网页文本特效——面纱效果
13
作者
7star
出处
《电脑知识与技术(经验技巧)》
2003年第12期84-85,共2页
关键词
网页
文本
特效
背景图片
面纱
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
重新语境化视域下能源企业网页文本英译研究
14
作者
韩依格
王晟
机构
中国矿业大学(北京)文法学院
出处
《海外英语》
2022年第12期16-18,共3页
基金
2020年北京市大学生创新训练项目“中国能源企业中英文网页文本的对照研究”(C202008804)。
文摘
由于中西方语境差异,企业网页文本在翻译时需要进行重新语境化改适转换。研究选取五家中国能源企业中英文网页文本,分析了要素删除、要素添加、要素替代、要素重组等四种改适转换形式的具体应用。通过改适转换,信息要素能够摆脱原语境的束缚,满足新语境的要求,传递有效信息,从而提高企业对外交流的有效性。
关键词
重新语境化
能源企业
网页
文本
汉译英
改适转换
分类号
H315.9 [语言文字—英语]
下载PDF
职称材料
题名
网页文本,获取排版多步合成一步走
15
作者
杯中水
出处
《网友世界》
2010年第3期65-65,共1页
文摘
需要保存网页上的文本信息时,通常情况下会选择另存为文本文件或者复制粘贴到其他文字处理软件中,然后再编辑处理的方法,但整个过程非常繁琐,需要经过多步操作,排版时也比较困难,
关键词
网页
文本
多步合成
排版
文字处理软件
文本
信息
文本
文件
编辑处理
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
TQ253.2 [化学工程—有机化工]
下载PDF
职称材料
题名
从文本中获取植物知识方法的研究
被引量:
13
16
作者
罗贝
吴洁
曹存根
邵志清
机构
华东理工大学计算机科学与技术专业
中国科学院计算技术研究所
出处
《计算机科学》
CSCD
北大核心
2005年第10期6-13,共8页
基金
自然科学基金(#60273019
#60373075
+1 种基金
#60496326)
科技部重大基础项目基金(#2002DEA30036)
文摘
知识获取一直是人工智能中的一个关键问题。当前,知识的文本挖掘(KAT)已经成为计算机领域的一个重要的研究课题。本文中,给出了基于植物本体的从海量网页文本库中自动获取植物领域知识的方法。该方法包括两个部分,一是植物本体(BotanicalOntology),它是顾芳博士等建立的生物本体的扩展。第二部分是以植物本体为基础,在网络文本库中进行文本挖掘(TextMining),自动获取植物知识。实验证明,基于本体的文本挖掘是一种有效的知识获取方法。
关键词
植物本体
植物知识
基于本体的知识获取与分析
知识获取
文本
挖掘
植物
自动获取
人工智能
领域知识
网页
文本
实验证明
获取方法
Keywords
Ontology of botany, Botanical knowledge, Text mining, Ontology-based knowledge acquisition, Knowledge analysis
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
国外大数据硕士人才培养的经验与启示——基于大数据文本挖掘
被引量:
9
17
作者
阮敬
刘宏晶
纪宏
机构
首都经济贸易大学统计学院
出处
《统计与信息论坛》
CSSCI
北大核心
2017年第9期29-36,共8页
文摘
利用半结构化文本数据分析方法,从国外高校387个大数据硕士相关项目及国内22个相关硕士项目人才培养方案中提取出大数据高端人才培养的七大方向,并对不同方向的培养目标、课程、学分、学制等设置及其对应的人才市场需求匹配情况等相关内容进行剖析,为改革中国大数据高端人才的供给提出一定建议。
关键词
大数据
大数据人才
人才培养
网页
文本
挖掘
Keywords
big data
big data talent
talent development
web text mining
分类号
C82 [社会学—统计学]
C41 [社会学]
下载PDF
职称材料
题名
基于NB和CHI值的农业文本分类方法
被引量:
4
18
作者
周云成
许童羽
邓寒冰
机构
沈阳农业大学信息与电气工程学院
出处
《江苏农业科学》
2018年第17期219-223,共5页
基金
辽宁省科学事业公益研究基金(编号:2016004001)
辽宁省教育厅科学研究一股项目(编号:L2014272)
文摘
对采集自网络的农业文本进行自动化分类是进一步利用的前提。拟提出1种结合朴素贝叶斯(naive Bayes,简称NB)和χ2(Chi-square,简称CHI)特征词选取的农业文本分类方法,并用Python语言实现相应的文本分类程序和特征词选择程序。通过从农业信息网站获取已经过良好分类的文档,并对其进行净化、分词等预处理,构建含有4种文本的农业语料库。针对特征词选择数量、训练样本数等对分类识别率的影响及用标题进行网页文本分类的可行性问题开展研究。结果表明,文本分类的正确率主要由CHI值较高的少量特征词条决定,但是按CHI值降序增加特征词条的数量不会对文本识别率造成负面影响;训练样本数量对文本分类的正确率具有一定影响,为了达到较高的识别率,训练样本需要达到一定的数量,然后持续增加样本量,对识别率没有明显贡献;利用网页标题对采集自网络的农业文本进行分类是可行的。通过结合朴素贝叶斯和基于CHI值的特征词选取方法能够很好地对农业文本进行分类,识别率较高。
关键词
文本
分类
农业
文本
朴素贝叶斯
CHI值
特征词选取
标题
网页
文本
分类
分类号
TP311.1 [自动化与计算机技术—计算机软件与理论]
S126 [农业科学—农业基础科学]
下载PDF
职称材料
题名
基于文本特征的Deep Web分类研究
19
作者
罗国涛
马在强
机构
四川托普信息技术职业学院计算机科学与技术系
出处
《计算机与现代化》
2012年第10期58-61,64,共5页
文摘
讨论若干Deep Web数据库分类准确性的前沿技术,建立基于词频和DOM树的文本特征提取方法模型,提出计算Deep Web数据库的基于权值的K-NN(K Nearest Neighbors)分类优化算法。利用UIUC提供的TEL-8数据集和WEKA平台的各类算法进行实验,并对分类精度、召回率和综合F-measure等测度上的分类结果进行比较。实验结果表明,该方法模型在3个指标上表现都较为突出。
关键词
DEEP
Web
网页
文本
词频
K-NN分类算法
DOM树
Keywords
Deep Web
Web text
term frequency
K-NN classification algorithm
DOM-tree
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
目的论视角下西安博物馆网页英译策略探析
20
作者
雷蕾
陈柯
机构
西安石油大学外国语学院
出处
《西安石油大学学报(社会科学版)》
2017年第4期104-107,共4页
基金
2016西安市社会科学规划基金(16X10)
西安石油大学2016年研究生创新与实践能力培养项目(YCS16241003)
文摘
以功能目的论为理论指导,以西安各博物馆英文网页文本为研究对象,针对其特点进行系统分析,提出博物馆英文网页翻译中应采取的变通翻译策略,以期达到使博物馆英文网页文本能够如实贴切地传递文化信息的目的,为西安历史文化的对外传播奠定良好基础。
关键词
博物馆
网页
文本
功能目的论
翻译策略
Keywords
museum
web text
skopos theory
translation strategies
分类号
H315.9 [语言文字—英语]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
中美政府网站的网页文本对比及编译
冯琰
《江苏理工学院学报》
2016
0
下载PDF
职称材料
2
一种改进的文本网页分类特征选择方法
李粤
李星
刘辉
许静芳
《计算机应用》
CSCD
北大核心
2004
8
下载PDF
职称材料
3
融合LSI和支持向量聚类的网页文本分类算法
史长琼
黄辉
王大卫
姜腊林
扶宗文
《计算机应用研究》
CSCD
北大核心
2009
1
下载PDF
职称材料
4
基于混合智能算法的网页文本分类仿真研究
李建军
宋志章
《科技通报》
北大核心
2012
5
下载PDF
职称材料
5
基于网页结构特征的网页主要文本信息抽取策略
火善栋
《现代计算机》
2008
4
下载PDF
职称材料
6
绍兴旅游网页文本翻译中的中英思维模式转换
王鉴莺
《佳木斯职业学院学报》
2014
2
下载PDF
职称材料
7
面向网页文本的地理要素变化发现
郭俊枫
赵仁亮
郑娇龙
《地理信息世界》
2015
4
下载PDF
职称材料
8
基于潜在语义分析的网页文本分类研究
王剑锋
乔冬
麻丽娜
李新叶
《应用能源技术》
2009
2
下载PDF
职称材料
9
基于网页文本的数据处理类岗位需求分析
陈伟龙
邱梁泉
张小华
《信息记录材料》
2018
3
下载PDF
职称材料
10
Word格式化网页文本全攻略
温仁凤
《教育信息技术》
2007
0
下载PDF
职称材料
11
轻松收集网页文本
树林
《软件》
2005
0
下载PDF
职称材料
12
用CSS滤镜和蒙古文镜像字体制作蒙古文文本网页的方法
海泉
《内蒙古民族大学学报》
2011
0
下载PDF
职称材料
13
网页文本特效——面纱效果
7star
《电脑知识与技术(经验技巧)》
2003
0
下载PDF
职称材料
14
重新语境化视域下能源企业网页文本英译研究
韩依格
王晟
《海外英语》
2022
0
下载PDF
职称材料
15
网页文本,获取排版多步合成一步走
杯中水
《网友世界》
2010
0
下载PDF
职称材料
16
从文本中获取植物知识方法的研究
罗贝
吴洁
曹存根
邵志清
《计算机科学》
CSCD
北大核心
2005
13
下载PDF
职称材料
17
国外大数据硕士人才培养的经验与启示——基于大数据文本挖掘
阮敬
刘宏晶
纪宏
《统计与信息论坛》
CSSCI
北大核心
2017
9
下载PDF
职称材料
18
基于NB和CHI值的农业文本分类方法
周云成
许童羽
邓寒冰
《江苏农业科学》
2018
4
下载PDF
职称材料
19
基于文本特征的Deep Web分类研究
罗国涛
马在强
《计算机与现代化》
2012
0
下载PDF
职称材料
20
目的论视角下西安博物馆网页英译策略探析
雷蕾
陈柯
《西安石油大学学报(社会科学版)》
2017
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
3
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部