期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
“数据噪音”的挑战与高校思想政治教育的应对策略 被引量:9
1
作者 何跃 甘荣丽 《广西社会科学》 CSSCI 2021年第3期166-171,共6页
高校思想政治教育以培养人为目的,在高等教育中担任着塑造与引导青年大学生价值观的重任,在培养时代新人中发挥着关键作用。伴随大数据时代的到来,信息网络的普及革新了高校思想政治教育教学的方法和内容,但其在促进高校思想政治教育现... 高校思想政治教育以培养人为目的,在高等教育中担任着塑造与引导青年大学生价值观的重任,在培养时代新人中发挥着关键作用。伴随大数据时代的到来,信息网络的普及革新了高校思想政治教育教学的方法和内容,但其在促进高校思想政治教育现代化的同时,也由于网络空间的匿名性、自由性与开放性特征,随之产生了大量附加在大数据传达信息上的错误的或偏离期望值的且干扰信息正常传播、减弱信息传递效果的"数据噪音"。夹杂在高校思想政治教育教学过程中的有害与无效的"数据噪音",影响了高校思想政治教育育人功能的有效发挥,它挑战了高校思想政治教育的话语权,降低或弱化了思想政治教育的影响力与吸引力,一定程度上混淆或模糊了部分高校学生的主流意识形态价值观。高校思想政治教育要想有效发挥其育人功能,必须警惕和防范"数据噪音"的干扰,建议从制度、管理、服务等多方面入手,通过弘扬社会主流意识占领意识形态主阵地、推进精品思想政治理论课建设提高思想政治教育吸引力、加强法律法规引导,规范网民网络空间行为;培养提高教师信息素养,建设专业教师队伍、建设数据管理中心加强校园网络安全管理等举措,有效识别、排除、隔离"数据噪音",努力将"数据噪音"排除、隔离于思想政治理论课教学场域之外,不断提升高校思想政治教育的针对性、目的性、有效性。 展开更多
关键词 数据时代 数据噪音 高校思想政治教育 价值观 信息茧房
下载PDF
基于VPRS的决策树算法中处理噪音数据的新方法
2
作者 乔梅 韩文秀 《计算机应用》 CSCD 北大核心 2005年第5期989-991,共3页
噪音数据是影响决策树训练效率和结果集质量的重要因素。目前的树剪枝方法不能消除噪音数据对选择决策树测试节点属性的影响。为改变这种状况,基于变精度Rough集(VPRS)模型,提出了一个在决策树算法中处理噪音数据的新方法———预剪枝法... 噪音数据是影响决策树训练效率和结果集质量的重要因素。目前的树剪枝方法不能消除噪音数据对选择决策树测试节点属性的影响。为改变这种状况,基于变精度Rough集(VPRS)模型,提出了一个在决策树算法中处理噪音数据的新方法———预剪枝法,该方法在进行选择属性的计算之前基于变精度正区域求取属性修正的分类模式,来消除噪音数据的对选择属性以及生成叶节点的影响。利用该方法对基本ID3决策树算法进行了改进。分析和实验表明,与先剪枝方法相比,该方法能进一步减小决策树的规模和训练时间。 展开更多
关键词 决策树 数据噪音 变精度Rough集(VPRS) 预剪枝
下载PDF
基于多方式传输的机场噪音自动监测系统 被引量:6
3
作者 刘玉洁 李国 《自动化与仪表》 2007年第3期55-57,68,共4页
飞机进、离港时会产生较大的噪音,为了控制噪音和制定相关标准,必须对机场及周边的噪音进行长期、稳定的监测,以获得足够多的实时数据。基于多方式数据传输的机场噪声自动监测系统通过对实时数据的不间断采样,为制定控制机场噪音措施、... 飞机进、离港时会产生较大的噪音,为了控制噪音和制定相关标准,必须对机场及周边的噪音进行长期、稳定的监测,以获得足够多的实时数据。基于多方式数据传输的机场噪声自动监测系统通过对实时数据的不间断采样,为制定控制机场噪音措施、方案、提供可靠的数据参考。本系统主要由噪声数据采集、噪声数据传输、噪声数据处理三部分组成,可以对机场及周围半径约十公里的区域进行噪声强度的监测,同时能够判断噪音发生的时间及地点。 展开更多
关键词 噪音监测 机场噪音 噪音数据传输 GPRS系统 嵌入式系统
下载PDF
RFID数据流过滤算法研究 被引量:7
4
作者 邓海生 李军 《计算机技术与发展》 2012年第6期26-29,34,共5页
RFID在实时识别、定位、跟踪以及物理对象监控等方面有着广泛的应用前景。为了实现上述应用的目标,RFID数据必须经过采集、过滤等处理过程。采集的原始RFID数据包括噪音数据和冗余数据,只有将这些噪音数据和冗余数据过滤后,才能应用;另... RFID在实时识别、定位、跟踪以及物理对象监控等方面有着广泛的应用前景。为了实现上述应用的目标,RFID数据必须经过采集、过滤等处理过程。采集的原始RFID数据包括噪音数据和冗余数据,只有将这些噪音数据和冗余数据过滤后,才能应用;另外,保证正确的RFID标签数据采集顺序,对于一些应用也非常关键。针对这些问题,提出了基本噪音过滤算法和基于hashtable的有序噪音过滤算法,以及基本冗余过滤算法和基于hashtable的冗余过滤算法,并通过仿真实验验证了该方法的有效性。 展开更多
关键词 无线射频识别技术 噪音数据 冗余数据 数据过滤
下载PDF
基于属性重要性的WUM数据预处理方式 被引量:1
5
作者 王亚军 王传安 《计算机系统应用》 2011年第5期219-222,247,共5页
为了降低Web日志数据的规模,并能从预处理后的数据中发现更有价值的访问模式,在引入知识的信息量的基础上,给出了单个属性相对于属性集的重要性量化值的概念,并采用了操作系统中LRU页面置换算法的思想,提出了基于属性重要性的WUM数据预... 为了降低Web日志数据的规模,并能从预处理后的数据中发现更有价值的访问模式,在引入知识的信息量的基础上,给出了单个属性相对于属性集的重要性量化值的概念,并采用了操作系统中LRU页面置换算法的思想,提出了基于属性重要性的WUM数据预处理方式。实验证明:该方式可以删除不具有挖掘价值的、因用户短期行为而访问的Web日志记录,剔除掉噪音数据,从而有效减小了日志挖掘的复杂度。 展开更多
关键词 访问模式 LRU页面置换算法 用户短期行为 噪音数据
下载PDF
数据抽取中数据预处理 被引量:1
6
作者 郭东峰 《电子技术与软件工程》 2014年第7期224-224,共1页
在数据抽取中,网页中噪音数据的处理是关键的第一步。针对噪音数据类型以及它们在网页中的位置,对HTML语言中常见不规范问题做出分析。同时分析了在Java开发环境中借助Jtidy开源工具,对待抽取的HTML文档进行语法检测与标记修正。
关键词 噪音数据 HTML Jtidy
下载PDF
从车牌识别数据中提取有效旅行时间算法研究 被引量:3
7
作者 王晰 袁绍欣 《计算机工程与应用》 CSCD 北大核心 2020年第16期241-247,共7页
从车牌识别数据中可以得到车辆在特定道路与特定时间段的旅行时间数据样本,但样本中往往混有不反映通常交通状况的噪音数据,去除这些噪音数据后可得到能够反映通常交通状况的有价值的有效数据。为此提出算法采用对数正态分布混合模型对... 从车牌识别数据中可以得到车辆在特定道路与特定时间段的旅行时间数据样本,但样本中往往混有不反映通常交通状况的噪音数据,去除这些噪音数据后可得到能够反映通常交通状况的有价值的有效数据。为此提出算法采用对数正态分布混合模型对数据样本进行拟合,并利用噪音数据具有右向尾部的分布特点给出确定最优子分布数量的两个判据,使两类数据具有最佳的聚类效果,从而能识别和提取出有效数据。算法对噪音数据特征不明显的少量数据样本也给出了提取方法,将第10百分位和第90百分位之间的数据作为有效数据。该算法针对公交车和非公交车两类车型的车牌识别数据进行实验,对噪音数据的识别取得了良好效果。实验结果表明,有效数据提取前后,非公交车通常状况的旅行时间平均值和标准差以及公交车旅行时间标准差具有明显差异,不滤除噪音数据会对两类车通常交通状况下的运行状态产生误判。 展开更多
关键词 旅行时间 噪音数据 混合模型 对数正态分布 数据聚类
下载PDF
基于含噪音日志的流程挖掘阈值优化设置
8
作者 阮莹 苏强 +5 位作者 张国通 刘大庆 戴红芳 张音赟 朱岩 薛镭 《上海交通大学学报》 EI CAS CSCD 北大核心 2010年第2期276-281,共6页
针对处理日志中噪音数据的启发式流程挖掘算法中阈值设置的不确定性,提出了基于试验设计的阈值优化设置方法.以阈值作为变量,挖掘得到的流程模型与实际日志的符合度作为响应量,通过试验设计分析方法优化阈值的配置,并将该算法应用于医... 针对处理日志中噪音数据的启发式流程挖掘算法中阈值设置的不确定性,提出了基于试验设计的阈值优化设置方法.以阈值作为变量,挖掘得到的流程模型与实际日志的符合度作为响应量,通过试验设计分析方法优化阈值的配置,并将该算法应用于医院某病种诊疗流程的挖掘.结果表明,通过该阈值设置方法能挖掘出正确合理的流程模型. 展开更多
关键词 流程挖掘 噪音数据 阅值 插值法 试验设计
下载PDF
数据预处理在县级社保系统中的运用
9
作者 李隽 《信息与电脑》 2016年第18期137-138,共2页
笔者主要说明通过数据预处理在县级社保系统中的运用提高县级社保系统中原始数据质量,创建更高质量的数据仓库,完成更高质量的数据决策。
关键词 数据预处理 数据挖掘 噪音数据处理
下载PDF
基于数据流聚类算法的入侵检测技术
10
作者 杨志彬 《电脑知识与技术(过刊)》 2012年第12X期8353-8355,共3页
随着网络应用的发展,网络入侵检测技术受到人们的广泛关注,将数据包存储后进行分析的入侵检测技术正面临着海量网络数据与有限的系统资源之间的矛盾。作者提出DcluStream算法,算法基于CluStream算法框架采用在线层和离线层双层结构,该... 随着网络应用的发展,网络入侵检测技术受到人们的广泛关注,将数据包存储后进行分析的入侵检测技术正面临着海量网络数据与有限的系统资源之间的矛盾。作者提出DcluStream算法,算法基于CluStream算法框架采用在线层和离线层双层结构,该算法能在较小的时间和存储开销的情况下高效处理噪音数据。实验表明该算法具有较高的处理效率,算法质量。 展开更多
关键词 入侵检测 数据流聚类 噪音数据
下载PDF
共轭梯度法求解瞬态传热组合边界条件多宗量反问题 被引量:9
11
作者 薛齐文 杨海天 胡国俊 《应用基础与工程科学学报》 EI CSCD 2004年第2期113-120,共8页
提出求解瞬态热传导边界条件反问题的一般数值模式,并导出了相关的敏度计算公式.应用共轭梯度技术进行求解,在单一和组合识别中,探讨了测点数目、数据噪音和初值对反演结果的影响.数值验证给出了令人满意的结果.
关键词 共轭梯度法 瞬态传热组合 边界条件 多宗量 反问题 有限元 热传导 数据噪音
下载PDF
基于HTML标记用途分析的网页正文提取技术 被引量:15
12
作者 常红要 朱征宇 +2 位作者 陈烨 张鹏 曾丽芳 《计算机工程与设计》 CSCD 北大核心 2010年第24期5187-5191,共5页
通过分析噪音数据特点和它所产生的影响,利用HTML的结构特征,提出了一种基于区域分块的HTML元素删除法,可用于网页正文的自动提取。实验结果表明,该方法能有效地得到大多数HTML网页的主体内容部分。针对HTML文件的解析方法不仅可以用于... 通过分析噪音数据特点和它所产生的影响,利用HTML的结构特征,提出了一种基于区域分块的HTML元素删除法,可用于网页正文的自动提取。实验结果表明,该方法能有效地得到大多数HTML网页的主体内容部分。针对HTML文件的解析方法不仅可以用于提取HTML文件的主体文本,也可以用于得到HTML文件中其它HTML元素的内容。 展开更多
关键词 HTML网页 数据挖掘 内容抽取 噪音数据 元素删除法
下载PDF
基于Web挖掘的网页清洗技术 被引量:7
13
作者 李嘉佑 贾自艳 +1 位作者 何清 史忠植 《计算机工程与应用》 CSCD 北大核心 2006年第25期98-101,共4页
随着互联网上信息的大量增多,Web挖掘技术越来越重要。而在Web挖掘过程中,基于Web的信息抽取的主要部分是如何去除网页中的噪音数据,它是Web数据的预处理的过程,这个预处理结果影响了Web挖掘的结果。在文中先分析了噪音数据的特点,然后... 随着互联网上信息的大量增多,Web挖掘技术越来越重要。而在Web挖掘过程中,基于Web的信息抽取的主要部分是如何去除网页中的噪音数据,它是Web数据的预处理的过程,这个预处理结果影响了Web挖掘的结果。在文中先分析了噪音数据的特点,然后根据实际观察提取规则并且用于模型统计的方法,去除噪音数据,抽取相关可利用的信息。 展开更多
关键词 Web数据 信息抽取 噪音数据
下载PDF
面向机器学习的相对变换 被引量:10
14
作者 文贵华 《计算机研究与发展》 EI CSCD 北大核心 2008年第4期612-618,共7页
机器学习常常面临数据稀疏和数据噪音问题.根据认知的相对性规律提出了相对变换方法,证明了相对变换是非线性的放大变换,可提高数据之间的可区分性.同时在一定条件下相对变换还能抑制噪音,并使稀疏的数据变得相对密集.通过相对变换将数... 机器学习常常面临数据稀疏和数据噪音问题.根据认知的相对性规律提出了相对变换方法,证明了相对变换是非线性的放大变换,可提高数据之间的可区分性.同时在一定条件下相对变换还能抑制噪音,并使稀疏的数据变得相对密集.通过相对变换将数据的原始空间变换到相对空间后,在相对空间中度量数据的相似性或距离更加符合人们的直觉,从而提高机器学习的性能.理论分析和实践验证了所提方法的普适性和有效性. 展开更多
关键词 机器学习 认知规律 相对变换 噪音数据 稀疏数据
下载PDF
一种建模的新技术:流程挖掘 被引量:5
15
作者 潘海兰 《上海第二工业大学学报》 2006年第2期127-132,共6页
鉴于当前工作流管理系统、企业资源规划系统、客户关系管理系统、供应链管理系统等都是在定义好的工作流模型顺序下执行任务的。早期工作流模型的构建不仅费时且与真正的流程有很大区别,故流程挖掘的概念便应运而生了。介绍了流程挖掘... 鉴于当前工作流管理系统、企业资源规划系统、客户关系管理系统、供应链管理系统等都是在定义好的工作流模型顺序下执行任务的。早期工作流模型的构建不仅费时且与真正的流程有很大区别,故流程挖掘的概念便应运而生了。介绍了流程挖掘技术的发展,之后从流程挖掘的模型语言着手对流程挖掘算法进行了综合分析和比较,同时分析了目前流程挖掘技术中所存在的不足,最后提出了流程挖掘技术的未来发展趋势。 展开更多
关键词 工作流技术 流程挖掘 PETRI网 噪音数据
下载PDF
基于用户兴趣与隐私保护的网络信息资源个性化推荐技术 被引量:2
16
作者 付达杰 张小波 《景德镇学院学报》 2015年第6期42-45,共4页
在网络信息资源个性化推荐技术当中,协同过滤算法是使用最广泛的,但传统的协同过滤算法在对用户的兴趣数据集的选取上不够有效,而且对于用户的隐私兴趣没有给予相应的保护。针对传统协同过滤算法的不足,本文对其做出了改进,引入公共集... 在网络信息资源个性化推荐技术当中,协同过滤算法是使用最广泛的,但传统的协同过滤算法在对用户的兴趣数据集的选取上不够有效,而且对于用户的隐私兴趣没有给予相应的保护。针对传统协同过滤算法的不足,本文对其做出了改进,引入公共集过滤噪音数据,结合k-匿名方法,隐匿隐私数据。最终的实验数据表明了改进后的算法在提高推荐准确率的基础上,用户的隐私得到了一定的保护。 展开更多
关键词 协同过滤 个性化推荐 隐私保护 噪音数据
下载PDF
Web服务组合的行为推断诊断方法
17
作者 贾志淳 邢星 《计算机科学》 CSCD 北大核心 2015年第4期60-64,共5页
随着Web服务以及Web服务组合应用软件在分布式网络中的广泛应用,Web服务的规模和复杂性也在不断地增加,这使得服务在运行过程中可能产生各种故障,因此对服务系统进行及时的故障诊断与排除越来越重要。为了解决在故障诊断中系统模型不完... 随着Web服务以及Web服务组合应用软件在分布式网络中的广泛应用,Web服务的规模和复杂性也在不断地增加,这使得服务在运行过程中可能产生各种故障,因此对服务系统进行及时的故障诊断与排除越来越重要。为了解决在故障诊断中系统模型不完备和历史数据中存在噪音数据这一实际问题,提出一种基于服务行为模型的行为推断诊断方法。该方法通过加权方式结合多种诊断信息构建服务行为模型,应用隐马尔科夫模型中的解码思想推断出与异常执行序列最匹配的正常执行序列,并与观察序列进行比较,从而发现差异定位服务故障。实验表明,该方法应用包含不同噪音比例的诊断信息进行诊断,其诊断准确性均高于传统的服务故障诊断方法。 展开更多
关键词 WEB服务 基于模型诊断 隐马尔科夫模型 噪音数据 历史数据 服务进程
下载PDF
流程挖掘研究
18
作者 潘海兰 吴翠红 《商场现代化》 北大核心 2007年第09Z期112-114,共3页
流程挖掘是从日志中自动发现流程的模型,自上世纪90年代提出后发展迅速,对流程挖掘进行深入的研究对于实现流程建模的自动化、流程模型的柔性变化,以及流程运行的监控等都有着重要的意义。
关键词 工作流技术 流程挖掘 PETRI网 噪音数据 Delta分析
下载PDF
Seismic data denoising based on learning-type overcomplete dictionaries 被引量:19
19
作者 唐刚 马坚伟 杨慧珠 《Applied Geophysics》 SCIE CSCD 2012年第1期27-32,114,115,共8页
The transform base function method is one of the most commonly used techniques for seismic denoising, which achieves the purpose of removing noise by utilizing the sparseness and separateness of seismic data in the tr... The transform base function method is one of the most commonly used techniques for seismic denoising, which achieves the purpose of removing noise by utilizing the sparseness and separateness of seismic data in the transform base function domain. However, the effect is not satisfactory because it needs to pre-select a set of fixed transform-base functions and process the corresponding transform. In order to find a new approach, we introduce learning-type overcomplete dictionaries, i.e., optimally sparse data representation is achieved through learning and training driven by seismic modeling data, instead of using a single set of fixed transform bases. In this paper, we combine dictionary learning with total variation (TV) minimization to suppress pseudo-Gibbs artifacts and describe the effects of non-uniform dictionary sub-block scale on removing noises. Taking the discrete cosine transform and random noise as an example, we made comparisons between a single transform base, non-learning-type, overcomplete dictionary and a learning-type overcomplete dictionary and also compare the results with uniform and nonuniform size dictionary atoms. The results show that, when seismic data is represented sparsely using the learning-type overcomplete dictionary, noise is also removed and visibility and signal to noise ratio is markedly increased. We also compare the results with uniform and nonuniform size dictionary atoms, which demonstrate that a nonuniform dictionary atom is more suitable for seismic denoising. 展开更多
关键词 learning-type overcomplete dictionary seismic denoising discrete cosine transform DATA-DRIVEN
下载PDF
基于条件随机场模型和文本纠错的微博新词词性识别研究 被引量:7
20
作者 韩彦昭 乔亚男 +2 位作者 范亚平 李孟超 万迪昉 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期353-360,共8页
针对微博数据特点,采用降噪算法和条件随机场模型对微博数据进行词性标注,并对其中比重较大的谐音词使用贝叶斯方法进行词性二次纠正.首先利用新浪平台API和爬虫获取原始微博数据,再根据噪音特点人工制定规则进行降噪.由于条件随机场在... 针对微博数据特点,采用降噪算法和条件随机场模型对微博数据进行词性标注,并对其中比重较大的谐音词使用贝叶斯方法进行词性二次纠正.首先利用新浪平台API和爬虫获取原始微博数据,再根据噪音特点人工制定规则进行降噪.由于条件随机场在中文词性标注中特征提取的优势,使用条件随机场模型对降噪后的微博语料词性标注.在此基础上,利用微博语料中谐音词比重较大的特点,将微博词语转化为拼音,根据贝叶斯方法计算得到谐音词的原生词候选,再根据词语的上下文建立谐音词和原生词映射,并利用原生词的词性已知的性质,对谐音词进行词性纠错.实验结果表明,该方法可以较好地标注微博未登录词,词性标注准确率达到95.23%. 展开更多
关键词 条件随机场 微博 噪音数据 谐音词 词语纠正
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部