期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
利用互信息和聚类抽样的文本情感分类 被引量:2
1
作者 陈智 李鹏 《现代计算机(中旬刊)》 2015年第4期14-20,共7页
为了将文本情感划分更细的类别,提出一种利用互信息和聚类抽样的文本情感分类方法,对文本进行分词和特征提取的预处理,通过聚类抽样得到的情感标签之间的互信息,组合情感标签的互信息得到情感类别,并根据互信息调整特征词库的权重,最后... 为了将文本情感划分更细的类别,提出一种利用互信息和聚类抽样的文本情感分类方法,对文本进行分词和特征提取的预处理,通过聚类抽样得到的情感标签之间的互信息,组合情感标签的互信息得到情感类别,并根据互信息调整特征词库的权重,最后利用中心性度量综合得出该文本情感的类别。实验通过不同的文本情感分类方式对分类结果进行比较,实验表明,该分类方法优于其他分类方法,从而验证该方法的有效性。 展开更多
关键词 互信息 聚类抽样 情感标签 文本情感分
下载PDF
大数据时代基于DBSCAN聚类方法的审计抽样 被引量:9
2
作者 程平 陈珊 《中国注册会计师》 北大核心 2016年第4期76-79,共4页
高度信息化的大数据时代,导致企业的生产经营产生大量、分散、复杂的会计数据,在审计全覆盖无法实现的情况下,审计抽样的质量至关重要。针对现有审计抽样问题,本文提出了在已有的审计领域知识库的基础上,建立审计样本与审计目标的关联规... 高度信息化的大数据时代,导致企业的生产经营产生大量、分散、复杂的会计数据,在审计全覆盖无法实现的情况下,审计抽样的质量至关重要。针对现有审计抽样问题,本文提出了在已有的审计领域知识库的基础上,建立审计样本与审计目标的关联规则,并利用DBSCAN聚类算法对审计抽样关联规则进行聚类,接着对聚类结果进行新颖度评价,筛选出高价值聚类结果存入审计领域知识库,实现审计领域知识的积累和再利用。最后,运用审计实例对实验进行分析。 展开更多
关键词 大数据审计 抽样 联规则
下载PDF
融合过抽样和欠抽样的不平衡数据重抽样方法 被引量:15
3
作者 吴磊 房斌 +2 位作者 刁丽萍 陈静 谢娜娜 《计算机工程与应用》 CSCD 2013年第21期172-176,185,共6页
在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总数远多于另一类的样本总数。常用的不平衡数据的处理方法有很多... 在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总数远多于另一类的样本总数。常用的不平衡数据的处理方法有很多,只探讨利用重抽样方法对不平衡数据进行预处理来提高分类效果的方法。数据抽样算法有很多,但可以归为两大类:过抽样和欠抽样。针对二分类问题提出了四种融合过抽样和欠抽样算法的重抽样方法:BSM+Tomek、BSM+ENN、CBOS+Tomek和CBOS+ENN,并且与另外十种经典的重抽样算法做了大量的对比实验,实验证明提出的四种预处理算法在多种评价指标下提高了不平衡数据的分类效果。 展开更多
关键词 不平衡数据 抽样 基于的过抽样算法(CBOS) 基于边界值的虚拟少数向上采样算法(BSM) 可选择最 近邻算法(ENN) Tomek LINKS 预处理
下载PDF
利用快速无偏分层图抽样算法的MapReduce负载平衡方法 被引量:2
4
作者 杜鹃 张卓 曹建春 《计算机应用与软件》 北大核心 2021年第11期288-294,313,共8页
提出一种基于快速无偏分层图抽样的MapReduce负载平衡方法。将聚类算法融合到MapReduce连接操作中,提出MapReduce并行聚类连接算法的实现方法;根据聚类结果动态调整抽样率的无偏分层图抽样算法,从而实现连接操作目标数据的准确、平衡抽... 提出一种基于快速无偏分层图抽样的MapReduce负载平衡方法。将聚类算法融合到MapReduce连接操作中,提出MapReduce并行聚类连接算法的实现方法;根据聚类结果动态调整抽样率的无偏分层图抽样算法,从而实现连接操作目标数据的准确、平衡抽样。通过合成数据集和真实数据集下的数据处理实验,与Hash连接算法及基于NS抽样的聚类算法进行对比,验证了所提出的算法方案在不同数据倾斜程度下都具有良好的负载平衡性能,其运行效率也没有因为新采样算法的采用而受到影响。 展开更多
关键词 大数据 数据倾斜 负载平衡 无偏分层图抽样 MapReduce平台 Hash连接算法 NS抽样
下载PDF
翻转课堂模式下的基础护理微课教学应用研究
5
作者 侯婷婷 胡蝶 《科学咨询》 2023年第1期135-137,共3页
翻转课堂教学模式运用微课作为辅助工具,在教学环境中突出了学生的主导地位。互联网与教学融合在基础护理学的应用不仅使学生的评判性思维能力和综合素质有所提升,而且也为教学方式提供了新思路。本文主要对翻转课堂模式下的基础护理微... 翻转课堂教学模式运用微课作为辅助工具,在教学环境中突出了学生的主导地位。互联网与教学融合在基础护理学的应用不仅使学生的评判性思维能力和综合素质有所提升,而且也为教学方式提供了新思路。本文主要对翻转课堂模式下的基础护理微课教学应用进行研究。 展开更多
关键词 翻转课堂 基础护理 微课教学 聚类抽样方法
下载PDF
室内环境下基于图优化的视觉惯性SLAM方法 被引量:17
6
作者 徐晓苏 代维 +2 位作者 杨博 李瑶 董亚 《中国惯性技术学报》 EI CSCD 北大核心 2017年第3期313-319,共7页
基于图优化的即时定位与同步构图(SLAM)方法是在视觉里程计运动估计的基础上通过增加一个回环检测,从而对非线性多约束进行优化来提高定位精度。在视觉运动估计中,针对视觉特征点匹配错误率高的问题,提出了一种ORB特征点聚类抽样匹配跟... 基于图优化的即时定位与同步构图(SLAM)方法是在视觉里程计运动估计的基础上通过增加一个回环检测,从而对非线性多约束进行优化来提高定位精度。在视觉运动估计中,针对视觉特征点匹配错误率高的问题,提出了一种ORB特征点聚类抽样匹配跟踪的方法。在位姿图优化上,提出了一种改进型的回环检测方法,减少了两种错误匹配的可能性。最后将视觉SLAM与惯性导航进行组合,提高了系统的稳定性和定位精度。使用公开的室内SLAM测试数据集进行仿真,结果表明,该方法的定位均方根误差在厘米级,生成的点云地图清晰可见。 展开更多
关键词 即时定位与同步构图 图优化 聚类抽样 回环检测 组合定位
下载PDF
基于空间聚类分层抽样的黄骅市县域耕地质量等别监测样点布设 被引量:6
7
作者 杨江燕 殷守强 +2 位作者 张利 门明新 陈影 《资源科学》 CSSCI CSCD 北大核心 2019年第2期257-267,共11页
耕地质量监测是当前国家及时掌握耕地质量和产能变化的重要工作手段。合理布设耕地质量监测样点可以大幅提高耕地质量监测的效率。以河北省黄骅市县域耕地为研究对象,以耕地的质量属性和空间位置属性为耕地质量等别监测区的划定依据,采... 耕地质量监测是当前国家及时掌握耕地质量和产能变化的重要工作手段。合理布设耕地质量监测样点可以大幅提高耕地质量监测的效率。以河北省黄骅市县域耕地为研究对象,以耕地的质量属性和空间位置属性为耕地质量等别监测区的划定依据,采用空间聚类法生成20种备选监测区方案,通过综合比较方差、抽样误差、抽样效率和抽样弹性系数,选出初始监测区方案,并在此基础上局部优化,最终生成耕地质量等别监测区方案,最后以耕地质量等别监测区为分层依据,运用分层抽样法布设了耕地质量等别监测样点。研究表明:(1)在抽样误差为1%的要求下,分区数为65的备选耕地质量等别监测区方案的综合样本容量为77,抽样效率相对较高,被选定为初始监测区方案;(2)随着耕地质量等别监测区数目从5增加到100,相同监测区内耕地单元之间在空间位置和耕地质量等别上的差异程度由快速减少到趋于平稳;(3)在布设相同数量的监测样点时,本文提出的基于空间聚类分层抽样的样点布设方法在表土质地、剖面构型、盐渍化、有机质含量、排水条件、灌溉条件和国家耕地质量自然等指数等因素方面的抽样误差分别为0.37、1.02、1.39、0.91、0.31、1.53和1.27,均明显低于传统的等别分层抽样、简单随机抽样、网格分层抽样,具有较高的抽样效率。研究成果可为耕地质量等别监测样点布设相关工作和研究提供有效指导。 展开更多
关键词 耕地质量等别 监测样点布设 抽样误差 抽样效率 空间分层抽样 黄骅市
原文传递
确定激素分泌峰和制定分泌峰重合的方法
8
作者 张家骅 《石河子大学学报(自然科学版)》 CAS 1993年第2期80-84,共5页
许多激素具有阵发性分泌特点,在一系列间隔时间大致相等的血样中激素测值不衡定。引起变异的原因至少有以下三个方面:放射免疫测定批内变异、激素基础水平波动和基础值在较长时间范围内的变化。目前尚无一种有效分析方法适用于处理各种... 许多激素具有阵发性分泌特点,在一系列间隔时间大致相等的血样中激素测值不衡定。引起变异的原因至少有以下三个方面:放射免疫测定批内变异、激素基础水平波动和基础值在较长时间范围内的变化。目前尚无一种有效分析方法适用于处理各种激素分泌范型。PULSAR程序和聚类抽样分析较之其它粗略估计方法能更有效地排除引起变异的因素。确定分泌峰和制定分泌峰重合还倚重于内分泌知识和经验。 展开更多
关键词 激素分泌峰 分泌峰重合 聚类抽样分析 PULSAR程序
下载PDF
A sampling method based on URL clustering for fast web accessibility evaluation 被引量:2
9
作者 Meng-ni ZHANG Can WANG Jia-jun BU Zhi YU Yu ZHOU Chun CHEN 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2015年第6期449-456,共8页
When evaluating the accessibility of a large website, we rely on sampling methods to reduce the cost of evaluation. This may lead to a biased evaluation when the distribution of checkpoint violations in a website is s... When evaluating the accessibility of a large website, we rely on sampling methods to reduce the cost of evaluation. This may lead to a biased evaluation when the distribution of checkpoint violations in a website is skewed and the selected samples do not provide a good representation of the entire website. To improve sampling quality, stratified sampling methods first cluster web pages in a site and then draw samples from each cluster. In existing stratified sampling methods, however, all the pages in a website need to be analyzed for clustering, causing huge I/O and computation costs. To address this issue, we propose a novel page sampling method based on URL clustering for web accessibility evaluation, namely URLSamp. Using only the URL information for stratified page sampling, URLSamp can efficiently scale to large websites. Meanwhile, by exploiting similarities in URL patterns, URLSamp cluster pages by their generating scripts and can thus effectively detect accessibility problems from web page templates. We use a data set of 45 web sites to validate our method. Experimental results show that our URLSamp method is both effective and efficient for web accessibility evaluation. 展开更多
关键词 Page sampling URL clustering Web accessibility evaluation
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部