期刊文献+
共找到109篇文章
< 1 2 6 >
每页显示 20 50 100
由Logistic回归识别Web社区的垃圾评论 被引量:11
1
作者 何海江 凌云 《计算机工程与应用》 CSCD 北大核心 2009年第23期140-143,共4页
针对Web社区垃圾信息泛滥的问题,采用基于Logistic回归(LR)的分类器区分合法评论和垃圾评论,并和支持向量机(SVM)的性能对比。提出了相关度向量空间模型cVSM作为评论的文档表示模型,讨论了信息增益IG、互信息MI、χ2统计CHI、文档频率D... 针对Web社区垃圾信息泛滥的问题,采用基于Logistic回归(LR)的分类器区分合法评论和垃圾评论,并和支持向量机(SVM)的性能对比。提出了相关度向量空间模型cVSM作为评论的文档表示模型,讨论了信息增益IG、互信息MI、χ2统计CHI、文档频率DF等不同特征抽取方法对模型的影响。实验结果表明,LR的训练时间不到SVM的1/10;DF和IG比MI和CHI表现更好;与传统的向量空间模型相比,使用cVSM显著提高垃圾评论识别能力。 展开更多
关键词 LOGISTIC回归 向量空间模型 博客 垃圾评论 相关度
下载PDF
由排序支持向量机抽取博客文章的摘要 被引量:2
2
作者 何海江 陈姝 《电子科技大学学报》 EI CAS CSCD 北大核心 2010年第4期593-597,共5页
提出了一种用平滑型排序支持向量机(Rank-sSVM)抽取博客文章摘要的方法。使用该排序算法抽取的摘要,反映了评论者的意见和博客文集的特性。自动摘要过程中,首先经人工从文章选择重要句子标记为摘要,作为训练对象;再由机器生成表示文章... 提出了一种用平滑型排序支持向量机(Rank-sSVM)抽取博客文章摘要的方法。使用该排序算法抽取的摘要,反映了评论者的意见和博客文集的特性。自动摘要过程中,首先经人工从文章选择重要句子标记为摘要,作为训练对象;再由机器生成表示文章语句的特征集,共14个特征,包含标签、评论等博客文章独有的信息;最后用Rank-sSVM学习人工摘要后,将文章所有句子排序,选取最靠前的若干语句构成摘要。该方法在一个中文博客数据集上取得良好效果。 展开更多
关键词 博客 评论 信息检索 排序学习 支持向量机 摘要
下载PDF
集成最近邻规则的半监督顺序回归算法 被引量:1
3
作者 何海江 何文德 刘华富 《计算机应用》 CSCD 北大核心 2010年第4期1022-1025,共4页
监督型顺序回归算法需要足够多的有标签样本,而在实践中,标注样本的序数耗时耗力,甚至难以完成。为此,提出一种集成最近邻规则的半监督顺序回归算法。基于最近邻,针对每个有标签样本,在无标签数据集选择与其最近似的若干样本赋以相同序... 监督型顺序回归算法需要足够多的有标签样本,而在实践中,标注样本的序数耗时耗力,甚至难以完成。为此,提出一种集成最近邻规则的半监督顺序回归算法。基于最近邻,针对每个有标签样本,在无标签数据集选择与其最近似的若干样本赋以相同序数;再由监督型顺序回归算法训练有标签样本和新标注样本。多个数据集的实验结果显示,该方法能显著改善顺序回归性能。另外,引入折扣因子λ评估新标注样本的可信度,并讨论了λ和有标签数据集大小对方法的影响。 展开更多
关键词 半监督顺序回归 最近邻 无标签样本 折扣因子
下载PDF
一种适应短文本的相关测度及其应用 被引量:7
4
作者 何海江 《计算机工程》 CAS CSCD 北大核心 2009年第6期88-90,96,共4页
针对博客社区和BBS论坛充斥Web垃圾信息的问题,提出相关度向量空间模型cVSM,并以此作为评论的特征,采用支持向量机分类算法自动识别垃圾评论。cVSM包括一种适合短文本的相关测度,用于衡量评论和文章的语义相关程度。在中文博客测试集和... 针对博客社区和BBS论坛充斥Web垃圾信息的问题,提出相关度向量空间模型cVSM,并以此作为评论的特征,采用支持向量机分类算法自动识别垃圾评论。cVSM包括一种适合短文本的相关测度,用于衡量评论和文章的语义相关程度。在中文博客测试集和中文BBS测试集上的实验结果表明,相比纯粹使用评论文本特征的方法,应用该模型时F1至少提高6%。 展开更多
关键词 博客 垃圾评论 支持向量机 文本挖掘 相关测度
下载PDF
适应文档检索的半监督多样本排序学习算法 被引量:1
5
作者 何海江 龙跃进 《计算机应用》 CSCD 北大核心 2011年第11期3108-3111,共4页
针对标记训练集不足的问题,提出了一种协同训练的多样本排序学习算法,从无标签数据挖掘隐含的排序信息。算法使用了两类多样本排序学习机,从当前已有的标记数据集分别构造两个不同的排序函数。相应地,每一个无标签查询都有两个不同的文... 针对标记训练集不足的问题,提出了一种协同训练的多样本排序学习算法,从无标签数据挖掘隐含的排序信息。算法使用了两类多样本排序学习机,从当前已有的标记数据集分别构造两个不同的排序函数。相应地,每一个无标签查询都有两个不同的文档排列,由似然损失来计算这两个排列的相似性,为那些文档排列相似度低的查询贴上标签,使两个多样本排序学习机新增了训练数据。在排序学习公开数据集LETOR上的实验结果证实,协同训练的排序算法很有效。另外,还讨论了标注比例对算法的影响。 展开更多
关键词 文档检索 半监督 排序学习 似然损失 协同训练
下载PDF
基于GDI+的颜色配置组件 被引量:5
6
作者 何海江 《计算机系统应用》 北大核心 2004年第5期51-54,共4页
介绍了一种基于GDI+的颜色配置组件的开发技术。组件包括模态和非模态两个窗体,其中非模态窗体可同时配置绘图时需要的前景色、背景色、边框色和透明度值。该组件可重用性强。
关键词 GDI+ 颜色 组件 图形编程 模拟按钮 Alpha值
下载PDF
基于排序学习算法的软件错误定位模型研究 被引量:3
7
作者 何海江 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第3期577-582,共6页
基于谱的错误定位(SBFL)是减小软件调试困难的有效方法。SBFL方法将运行特征组合成不同的错误定位模型,可这些模型受特定程序及测试集影响,性能并不稳定。基于此,提出一种排序学习方法LTR-sbfl,针对不同的程序及其测试集,能学习到相应... 基于谱的错误定位(SBFL)是减小软件调试困难的有效方法。SBFL方法将运行特征组合成不同的错误定位模型,可这些模型受特定程序及测试集影响,性能并不稳定。基于此,提出一种排序学习方法LTR-sbfl,针对不同的程序及其测试集,能学习到相应的错误定位模型。LTR-sbfl首先收集已标注错误语句的程序旧版本,采用与SBFL相同的方法,获得程序语句的运行特征。接着,将错误行与正确行代码的运行特征两两相减,确定为训练数据的一个实例。最后,使用分类算法,从训练数据构造排序模型。在3个基准数据集的实验结果证实,LTR-sbfl的定位精度优于其他SBFL方法。 展开更多
关键词 错误定位 排序学习 机器学习 程序谱 语句可疑度
下载PDF
代价与样本相关的简约核支持向量机 被引量:3
8
作者 何海江 《计算机应用》 CSCD 北大核心 2008年第11期2863-2866,2880,共5页
针对机器学习领域中误分类代价与样本相关的情况,提出一种以最小化总代价为目标的样本相关代价敏感的简约核支持向量机sd2sSVM。首先,在GSVM框架下,将优化目标转换为无约束数学规划问题,再引入分段多项式平滑函数逼近正号函数,使用Newto... 针对机器学习领域中误分类代价与样本相关的情况,提出一种以最小化总代价为目标的样本相关代价敏感的简约核支持向量机sd2sSVM。首先,在GSVM框架下,将优化目标转换为无约束数学规划问题,再引入分段多项式平滑函数逼近正号函数,使用Newton-YUAN方法求无约束问题的唯一最优解,最后引入简约核提高解非线性问题的效率。实验结果表明,与传统的样本相关代价敏感支持向量机相比,sd2sSVM的分类精度、误分类代价相当,但训练时间、预测时间则更短。另外,讨论了参数C对sd2sSVM分类性能的影响。 展开更多
关键词 代价敏感 简约核 无约束 支持向量机 分类
下载PDF
由向量空间相关模型识别博客文章的垃圾评论 被引量:4
9
作者 何海江 凌云 《长沙大学学报》 2008年第2期63-66,共4页
博客作者往往允许读者在文章后发表评论,许多评论充斥着形形色色的垃圾信息,破坏了博客社区的和谐.在向量空间的基础上构造了一个相关模型,将博客的文章和评论分别分词后,根据模型计算评论和文章的相关度,来判断是否为垃圾评论.该模型... 博客作者往往允许读者在文章后发表评论,许多评论充斥着形形色色的垃圾信息,破坏了博客社区的和谐.在向量空间的基础上构造了一个相关模型,将博客的文章和评论分别分词后,根据模型计算评论和文章的相关度,来判断是否为垃圾评论.该模型不需要训练样本,在一个中文博客测试集上,召回率和准确率分别达到82%和91%. 展开更多
关键词 向量空间模型 博客 垃圾评论 相关度
下载PDF
带时延的长时间序列线性相关挖掘研究 被引量:3
10
作者 何海江 《计算机工程与应用》 CSCD 北大核心 2006年第16期180-183,共4页
提出了一个带时延的长时间序列线性相关的挖掘算法Mini-Check。先将时间序列变换为Haar小波系数序列,再利用线性相关系数和欧氏距离系数之间的关系过滤,形成两两序列对的结果集,最后只计算这些序列对之间的Pearson相关系数,来判定序列... 提出了一个带时延的长时间序列线性相关的挖掘算法Mini-Check。先将时间序列变换为Haar小波系数序列,再利用线性相关系数和欧氏距离系数之间的关系过滤,形成两两序列对的结果集,最后只计算这些序列对之间的Pearson相关系数,来判定序列对是否线性相关。与传统方法相比,算法的效率很高。 展开更多
关键词 时延 长时间序列 线性相关挖掘
下载PDF
基于线性分类算法的软件错误定位模型 被引量:2
11
作者 何海江 《计算机工程与应用》 CSCD 北大核心 2017年第21期42-48,共7页
基于谱的错误定位(SBFL)方法能帮助程序员减小软件调试的困难。作为一种轻量方法,SBFL只需收集测试用例的覆盖信息和测试结果,计算程序每条语句的运行特征。众多SBFL方法,将四个运行特征组合成不同的可疑度计算公式。然而,这些公式受固... 基于谱的错误定位(SBFL)方法能帮助程序员减小软件调试的困难。作为一种轻量方法,SBFL只需收集测试用例的覆盖信息和测试结果,计算程序每条语句的运行特征。众多SBFL方法,将四个运行特征组合成不同的可疑度计算公式。然而,这些公式受固定参数的影响,无法适应不同的程序集。因此,提出一种机器学习方法,能自动确定特定程序集的可疑度计算公式。首先,收集已标注错误语句的程序旧版本;再将错误语句与正确语句的运行特征两两相减,构造为训练集的一个样本;最后基于Weka的分类算法,学习到线性函数,作为该程序的错误定位模型。在Siemens程序包、space和gzip三个基准数据集上,使用Logistic、SGD、SMO和Lib Linear学习到的模型,性能都要优于SBFL方法。 展开更多
关键词 分类算法 线性模型 错误定位 程序谱 软件测试
下载PDF
COM编排OPC数据存取规范3.0定制接口的研究 被引量:2
12
作者 何海江 《计算机应用与软件》 CSCD 北大核心 2006年第8期74-76,共3页
OPC数据存取规范基于COM,要将其移植到.NET平台,需要解决编排过程中数据类型转换、接口实现、参数传递等问题。研究C#接口属性类.、NET托管和非托管的转换后,解决了OPC数据存取规范3.0定制接口COM编排的问题。
关键词 C# COM编排 OPC数据存取规范3.0 定制接口
下载PDF
基于OPC协议的化工DCS网络 被引量:2
13
作者 何海江 何海平 黄锁彬 《化工自动化及仪表》 CAS 北大核心 2003年第6期33-35,共3页
由于多种原因 ,经常遇到一个企业中多个厂商的DCS共存的情况。介绍使用OPC技术将化工DCS系统连接成网络的方法 。
关键词 OPC DCS DCOM 网络 组态软件
下载PDF
在Chebyshev多项式概要上近似属性分布 被引量:1
14
作者 何海江 《小型微型计算机系统》 CSCD 北大核心 2009年第1期31-36,共6页
在属性分布估计中,给定关系属性的类型为N个,使用B个(BN)数值近似其频度分布.基于直方图和小波的概要数据结构得到深入的研究,然而Chebyshev多项式也适合于近似算法.首先构造基于Chebyshev多项式的概要,再在其上估计原始属性分布,和以... 在属性分布估计中,给定关系属性的类型为N个,使用B个(BN)数值近似其频度分布.基于直方图和小波的概要数据结构得到深入的研究,然而Chebyshev多项式也适合于近似算法.首先构造基于Chebyshev多项式的概要,再在其上估计原始属性分布,和以前的方法相比,算法的优势在于:L1、L2、L∞等误差度量下更高的精度;构造概要的时间复杂度只有O(NB);更易于动态维护.Chebyshev概要的有效性在模拟数据序列和实际数据序列上得到验证. 展开更多
关键词 CHEBYSHEV多项式 近似算法 小波 属性分布估计 Chebyshev概要
下载PDF
OPC客户端关键技术的实现 被引量:35
15
作者 何海江 《微计算机信息》 2003年第7期76-78,共3页
清楚地说明了OPC中关于数据存取接口的技术,并详细介绍如何利用这些接口从DCS系统、SCADA软件和其他OPC服务器读写实时数据。阅读文章后,读者能够掌握OPC客户端应用软件的原理和编写方法。
关键词 OPC 客户端 应用软件 数据存取接口 源代码
下载PDF
使用VB连接OPC数据存取服务器 被引量:15
16
作者 何海江 《工业控制计算机》 2003年第6期31-33,共3页
本文介绍了OPC数据存取服务器的自动化接口,并提供详细的源代码,说明VisualBasic如何实现这些接口。采用文中的技术,可编写软件与DCS、SCADA、PLC等自动化系统交换实时数据。
关键词 VB语言 程序设计 客户端程序 OPC 数据存取服务器
下载PDF
固定香菇(Lentinus edodes)菌柄废弃物吸附Cd和Pb后的解吸试验研究
17
作者 何海江 张丹 +2 位作者 曾雪丹 李伟 李恩霞 《安全与环境学报》 CAS CSCD 北大核心 2011年第5期26-31,共6页
利用6种不同的解吸剂对吸附了Pb^(2+)和Cd^(2+)的固定香菇小球进行解吸。结果表明,HCl溶液做解吸剂最佳,可以分别在90 min和60 min内将大量的Pb^(2+)和Cd^(2+)从聚乙烯醇-海藻酸钠(PVA-SA)固定香菇小球上解吸出来。利用模拟二级动力学... 利用6种不同的解吸剂对吸附了Pb^(2+)和Cd^(2+)的固定香菇小球进行解吸。结果表明,HCl溶液做解吸剂最佳,可以分别在90 min和60 min内将大量的Pb^(2+)和Cd^(2+)从聚乙烯醇-海藻酸钠(PVA-SA)固定香菇小球上解吸出来。利用模拟二级动力学方程描述HCl溶液对PVA-SA固定香菇小球上Pb^(2+)和Cd^(2+)的解吸过程,决定系数R^2分别为0.996 9和0.998 9。Cd^(2+)的解吸率在HCl浓度为0.1 mol·L^(-1)时达到平衡,解吸率为80%;Pb^(2+)的解吸率在HCl浓度为1.0 mol·L^(-1)时达到最大,为99.01%。微观形态研究表明,未吸附重金属的PVA-SA固定香菇小球表面粗糙多孔,小球通过物理性吸附或形成无机沉淀将重金属沉积在细胞壁上后,表面变得密实。经HCl解吸后的PVA-SA固定香菇小球表面粗糙度和孔隙度都恢复到吸附前的状态。PVA-SA固定香菇小球对Pb^(2+)和Cd^(2+)进行吸附后,利用HCl进行解吸,再吸附,如此3次循环使用后,其吸附率略有降低,但仍可达到85.24%和69.07%。 展开更多
关键词 微生物学 固定香菇 PB2+ Cd2+ 解吸 扫描电镜 能谱
下载PDF
C#程序与基于COM的OPC数据存取服务器交换数据研究 被引量:11
18
作者 何海江 《微计算机信息》 2004年第10期112-114,共3页
研究了OPCNETCOM自动化包装器所封装的COM编排技术和OPCNET应用程序接口内的设计模式。在其基础上使用C#语言编写了一个基于.NET的OPC客户程序,与基于COM的OPC数据存取服务器交换数据。有效地实现了将遵循OPC规范的代码从COM平台移植到.... 研究了OPCNETCOM自动化包装器所封装的COM编排技术和OPCNET应用程序接口内的设计模式。在其基础上使用C#语言编写了一个基于.NET的OPC客户程序,与基于COM的OPC数据存取服务器交换数据。有效地实现了将遵循OPC规范的代码从COM平台移植到.NET平台。 展开更多
关键词 C# COM编排 数据存取服务器 设计模式
下载PDF
企业管理控制一体化与组态软件 被引量:2
19
作者 何海江 陈自勇 《湖南经济管理干部学院学报》 2002年第3期93-95,共3页
企业管理控制一体化是工厂自动化和管理现代化的必然趋势。组态软件作为工业自动化软件的新技术 ,在发展企业管控一体化中起着非常重要的作用。
关键词 企业管理控制一体化 组态软件 现代企业 企业信息化
下载PDF
基于组件的工业过程数据仓库
20
作者 何海江 魏善沛 肖杰 《计算机工程与设计》 CSCD 北大核心 2007年第8期1983-1984,F0003,共3页
工业企业自动化系统所产生的过程数据,分散在异构系统上,不能统一的存储、调用和管理,造成数据资源浪费。基于组件和分布式应用技术,设计和实现了工厂级的工业过程数据仓库,包括:集成各类自动化软件的过程数据,数据压缩存储,可视化分析... 工业企业自动化系统所产生的过程数据,分散在异构系统上,不能统一的存储、调用和管理,造成数据资源浪费。基于组件和分布式应用技术,设计和实现了工厂级的工业过程数据仓库,包括:集成各类自动化软件的过程数据,数据压缩存储,可视化分析工具开发。通过该系统,可集成和开发工业过程历史数据资源,从中挖掘对生产有用的知识。 展开更多
关键词 元数据 组件 数据仓库 工业过程 可视化
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部