-
题名关联文本分类的规则修正策略
被引量:6
- 1
-
-
作者
邱江涛
唐常杰
曾涛
刘胤田
-
机构
西南财经大学中国支付体系研究中心
四川大学计算机学院
天津师范大学计算机与信息工程学院
成都信息工程学院智能信息处理实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第4期683-688,共6页
-
基金
"十一五"国家科技支撑计划基金项目(2006BAI05A01)
国家自然科学基金项目(60773169)~~
-
文摘
通过分析基于关联规则的文本分类,发现在保持分类规则对正例样本正确分类的同时减少对反例样本的错误分类可以提高分类的精确度.基于否定选择算法的思想提出了分类规则修正策略,用反例样本集合对分类规则进行耐受,从分类规则错误判别的反例样本中再产生规则,与原来的规则组成新规则,称为增强关联规则.基于修正策略产生的增强关联规则可以大幅度地减少对反例样本的错误分类,从而提高分类的精确度.通过形式化证明和实验,分类规则修正策略的有效性得到验证.
-
关键词
关联规则
增强关联规则
文本分类
否定选择算法
规则修正
-
Keywords
association rule
enhanced association rule
text classification
negative selection algorithm
rule revising
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名最大亚频繁模式挖掘算法研究
被引量:1
- 2
-
-
作者
张海清
刘胤田
-
机构
成都信息工程学院智能信息处理实验室
四川大学数学学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第14期62-64,共3页
-
基金
国家自然科学基金资助项目(60773169
60702075)
-
文摘
为解决传统最大频繁模式在项集频繁度与项集长度规模之间的制约关系,提出最大亚频繁模式概念及其挖掘算法MSFP-mining,包括最大亚频繁模式概念并分析其要素特点,基于AFP-tree、CMP-tree、SFP-tree、SFP-growth的候选MSFP挖掘方法,基于MSFP-tree的最大亚频繁模式超集检测和剪枝策略及对MSFP-mining挖掘性能的实验验证。实验结果表明,该算法利用差别频繁度实现核心项集、附加频繁项集、补充频繁项集的阶段性求取和组合,在保证项集频繁度基础上实现最大亚频繁模式挖掘,扩展频繁模式规模。
-
关键词
模式挖掘
最大亚频繁模式
数据集
超集检测
MSFP-tree结构
-
Keywords
pattern mining
Maximal Sub-Frequent Pattern(MSFP)
data set
superset check
MSFP-tree structure
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于任务的复杂生产自动化控制模型研究
- 3
-
-
作者
刘胤田
兰余
赵小波
曾梦林
冯世伟
李惠军
-
机构
成都信息工程学院智能信息处理实验室
四川大学数学学院
海南椰岛(集团)股份有限公司
-
出处
《酿酒科技》
2011年第9期92-96,共5页
-
文摘
酒类行业生产需解决厂区复杂设备管网拓扑结构下的多业务并发控制和设备手动操作,基于PLC编程的DCS模型不能有效支持非现场数据的逻辑处理、跨业务边界的任务泛型调度、非数控的手动操作。提出基于任务的复杂生产自动化控制模型,模型提出系统任务调度引擎解决并发业务控制中任务逻辑关系的泛型运算和组合运算,提出任务执行条件的形式化描述与实现,提出基于任务的复杂工艺流程设计和业务定义。基于任务的复杂生产自动化控制技术架构,实现了并发工艺和复杂工艺的任务集中调度和业务任务执行的分散控制,提高了自动化控制的适应性、稳定性、安全性和高效性。
-
关键词
复杂生产
工艺流程
自动控制
任务调度
-
Keywords
complex production
process technology
automatic control
task scheduling
-
分类号
TS261.8
[轻工技术与工程—发酵工程]
-
-
题名基于累积偏移算法的线路矢量数据实时压缩
被引量:1
- 4
-
-
作者
王飞
曾燕
赵小波
刘胤田
-
机构
成都信息工程学院智能信息处理实验室
海南椰岛(集团)股份有限公司
-
出处
《地球信息科学学报》
CSCD
北大核心
2014年第2期173-181,共9页
-
基金
国家自然科学基金项目(31071700)
国家公益性行业(气象)科研项目(GYHY201306044
+1 种基金
GYHY201306059)
海口市重点科技计划项目(2012-027)
-
文摘
针对线路矢量数据实时采集和同步压缩应用需求,本文提出具有高压缩率、低失真度特点的累积偏移实时压缩算法(CORC Algorithm)。算法突出对弯曲极值点和距离偏移的感知,创新性地提出累积变向点和累积变向拐点的弯曲极值点探测方法,提出距离累积偏移临界点的线路偏移快速判断方法,从而有效提高算法对方向连续偏移的敏感度和对摇摆偏移的高压缩率,提高线路矢量数据实时压缩的高保真性。累积偏移实时压缩算法在高限差阈值情况下仍能有效发现各类弯曲极值点和距离累积偏移临界点,在O(N)时间复杂性和O(1)空间复杂性下取得高压缩率、低失真度的理想压缩效果,实现了线路采集的零延时同步压缩。应用定时、定距两种采集策略生成的线路矢量数据集,与垂距法(VD Algorithm)、分段道格拉斯-普克法(Subsection DP Algorithm)进行实时压缩性能实验对比,结果表明,累积偏移法作为实时压缩方法,与上述两种主流实时压缩算法相比,在压缩实时性、压缩率失真度平衡、限差阈值可控性3方面都具有明显的优越性。在同等压缩率情况下,累积偏移压缩算法失真度普遍降低达10%,且压缩率与失真度的平衡性受限差阈值取值和线路轨迹特征影响最小,可实现线路的定位采集、实时压缩、同步网络上传,在交通、旅游、探险搜救等领域的实时定位监控中具有广阔的应用前景。
-
关键词
线路矢量数据压缩
累积偏移实时压缩
弯曲极值点
移动定位
-
Keywords
GPS
line vector data compression
cumulative offset real-time compression
bending extreme points
run-ning fix
GPS
-
分类号
P228
[天文地球—大地测量学与测量工程]
-