期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于仿真机理和改进回归决策树的二噁英排放建模
1
作者 夏恒 汤健 +1 位作者 余文 乔俊飞 《自动化学报》 EI CAS CSCD 北大核心 2024年第8期1601-1619,共19页
城市固废焚烧(Municipal solid waste incineration,MSWI)过程是“世纪之毒”二噁英(Dioxin,DXN)的重要排放源之一.截止目前为止,DXN的演化机理和实时检测仍是尚未解决的难题.现有研究主要基于离线化验数据构建数据驱动模型,DXN的检测... 城市固废焚烧(Municipal solid waste incineration,MSWI)过程是“世纪之毒”二噁英(Dioxin,DXN)的重要排放源之一.截止目前为止,DXN的演化机理和实时检测仍是尚未解决的难题.现有研究主要基于离线化验数据构建数据驱动模型,DXN的检测未有效结合燃烧过程机理.针对该问题,本文提出基于仿真机理和改进线性回归决策树(Linear regression decision tree,LRDT)的DXN排放建模.首先,采用基于床层固废燃烧模拟软件FLIC(Fluid dynamic incinerator code)和过程工程先进系统软件(Advanced system for process engineering Plus,Aspen Plus)耦合的数值仿真模型,获取蕴含多运行工况的虚拟机理数据;接着,利用虚拟机理数据构建基于改进LRDT的CO_(2)、CO和O_(2)燃烧状态表征变量模型;然后,以真实CO_(2)、CO、O_(2)作为输入和以DXN真值作为输出,构建多入单出LRDT的过程映射模型(Process mapping model,PMM),再利用该模型进行半监督学习和结构迁移得到机理映射模型1(Mechanism mapping models1,MMM1);最后,通过结构增量学习获得基于半监督迁移学习的MMM2模型.在实验室的半实物平台和北京某MSWI厂的边侧验证平台对所提方法进行了工业应用验证.实验结果证明了所提方法与研发的软测量系统可有效实现二噁英排放浓度在线检测. 展开更多
关键词 城市固废焚烧 二噁英 燃烧状态 数值仿真机理 线性回归决策树 半监督迁移学习
下载PDF
A Recursive Binary Tree Model for the Analysis of the Response to Antiretroviral Therapy of HIV Infected Adults in Burkina Faso
2
作者 Simon Tiendrébéogo Séni Kouanda +1 位作者 Blaise Somé Simplice Dossou-Gbeté 《Open Journal of Statistics》 2019年第6期643-656,共14页
In this paper we aim to analyse temporal variation of CD4 cell counts for HIV-infected individuals under antiretroviral therapy by using statistical methods. This is achieved by resorting to recursive binary regressio... In this paper we aim to analyse temporal variation of CD4 cell counts for HIV-infected individuals under antiretroviral therapy by using statistical methods. This is achieved by resorting to recursive binary regression tree approach [1]?[2]. This approach has made it possible to highlight the existence of several segments of the population of interest described by the interactions between the predictive covariates of the response to the treatment regimen. 展开更多
关键词 model-based conditional regression tree CD4 Cell COUNT Prediction Linear Mixed Model Stability ANALYSIS ANTIRETROVIRAL Therapy
下载PDF
基于声学相关特征与词典语法相关特征的汉语重音检测 被引量:8
3
作者 倪崇嘉 张爱英 刘文举 《计算机学报》 EI CSCD 北大核心 2011年第9期1638-1649,共12页
重音对提高语音合成系统的自然度、可懂度以及语音识别系统的正确率等方面扮演着非常重要的作用.该文基于大规模韵律标注的语料库,利用声学相关特征及词典语法相关特征对汉语重音进行检测.采用Boosting集成分类回归树对当前音节的声学... 重音对提高语音合成系统的自然度、可懂度以及语音识别系统的正确率等方面扮演着非常重要的作用.该文基于大规模韵律标注的语料库,利用声学相关特征及词典语法相关特征对汉语重音进行检测.采用Boosting集成分类回归树对当前音节的声学相关特征以及词典语法相关特征进行建模,Boosting集成分类回归树充分利用了当前音节的特性.同时还对词典语法相关特征采用条件随机场方法建模,条件随机场很好地利用了当前音节的上下文特性.最后,将Boosting集成分类回归树模型和条件随机场模型加权组合获得识别率更高的混合模型.该混合模型克服了Boosting集成分类回归树模型的不足,实现了Boosting集成分类回归树和条件随机场的优势互补.实验结果表明该方法具有较好的分类效果,在ASCCD语料库上能够获得84.82%重音检测正确率.同时,与之前其他人的工作在相同的条件下(相同的训练集和测试集)对比,在正确率方面,该方法分别有4.01%和1.67%的提高.另外,该文中,对英语的重音检测和汉语的重音检测做了对比,并通过特征分析方法从另一个层面验证了一些语言学上的结论. 展开更多
关键词 重音 Boosting集成分类回归树 条件随机场 神经网络 分类回归树
下载PDF
采用M5'模型树和测量数据识别抽汽式机组汽耗量特性 被引量:7
4
作者 章坚民 刘登涛 +1 位作者 吴光中 张云雷 《中国电机工程学报》 EI CSCD 北大核心 2011年第23期21-26,共6页
汽轮机组特性随着机组老化而变化,传统上采用定期现场实测,需停机和采用专门的设备与系统,费用很高,因此基于现有自动化系统历史测量数据的特性曲线识别方法十分必要。一般汽轮机组汽耗量特性具有非凸和非连续等特点,常规的多元线性回... 汽轮机组特性随着机组老化而变化,传统上采用定期现场实测,需停机和采用专门的设备与系统,费用很高,因此基于现有自动化系统历史测量数据的特性曲线识别方法十分必要。一般汽轮机组汽耗量特性具有非凸和非连续等特点,常规的多元线性回归拟合不能适应。M5’模型树算法是一种多输入单输出系统的分段线性化的数据挖掘算法。提出采用M5’模型树的抽汽式机组汽耗量特性模型和其模型结构及参数识别算法,用于滚动利用最新的电厂测量历史数据获取最新的汽耗量特性。该方法简单、有效,逼近能力强,自动化程度高,在处理非凸形和非连续性的特性方程具有优势。通过多个热电厂的实时数据进行验证,具有很高的预测精度,效果优于多元线性回归拟合方程。 展开更多
关键词 抽汽式机组 汽耗量特性 M5’模型树 非凸性函数 非连续性函数 多元线性回归模型
下载PDF
利用决策树分类方法的南京江宁水稻面积变化研究 被引量:6
5
作者 余超 李明阳 何隆华 《遥感信息》 CSCD 北大核心 2015年第2期80-84,共5页
自从2000年12月江宁撤县设为南京市江宁区以来,2002年~2010年期间许多农田现在变成了高楼大厦。该文以南京市江宁区水稻田为研究对象,以江宁区2002年、2006年以及2010年的遥感影像为主要信息源,利用决策树分类的方法,通过坡度、湿度、N... 自从2000年12月江宁撤县设为南京市江宁区以来,2002年~2010年期间许多农田现在变成了高楼大厦。该文以南京市江宁区水稻田为研究对象,以江宁区2002年、2006年以及2010年的遥感影像为主要信息源,利用决策树分类的方法,通过坡度、湿度、NDVI等决策因子,根据野外实地勘测调查数据对比,提取出江宁区的水稻田,再通过驱动因子分析,用地理加权回归方法找出主要影响因子,加上空间分布格局的动态分析,从而比较出在这段时间内南京江宁区水稻田的变化情况。研究表明:1江宁区在2002年~2010年内水稻田面积减少了约690km2,约70%的稻田变为其他用地,变化非常明显;2主要影响面积变化的驱动因子是人类居住活动范围的变化;3水稻田的空间格局在2002年~2010年间聚集性减弱,破碎化趋势加强。 展开更多
关键词 水稻 决策树 地理加权回归 空间格局 面积变化 地理国情监测
下载PDF
基于互补模型的汉语重音检测 被引量:3
6
作者 倪崇嘉 刘文举 徐波 《计算机工程》 CAS CSCD 北大核心 2011年第23期20-23,共4页
针对现有汉语重音检测方法正确率较低的问题,利用声学、词典和语法相关特征的不同分类器组合,基于Boosting分类回归树+条件随机场的互补模型,提出一种改进的汉语重音检测方法。在ASCCD语料库上的实验结果表明,该方法能获得84.9%的重音... 针对现有汉语重音检测方法正确率较低的问题,利用声学、词典和语法相关特征的不同分类器组合,基于Boosting分类回归树+条件随机场的互补模型,提出一种改进的汉语重音检测方法。在ASCCD语料库上的实验结果表明,该方法能获得84.9%的重音检测正确率,相比基于神经网络+决策树的基线系统提高2.7%。 展开更多
关键词 重音 互补模型 Boosting分类回归树 条件随机场 神经网络 支持向量机
下载PDF
基于CART算法的多联机压缩机回液故障检测 被引量:10
7
作者 王江宇 陈焕新 +4 位作者 李冠男 刘江岩 胡云鹏 郭梦茹 胡文举 《制冷与空调》 2017年第4期55-60,共6页
近年来,多联机在各类建筑上得到广泛应用。一旦压缩机发生回液故障,将会导致多联机偏离正常工况,能效降低,同时无法保障室内环境的舒适性。长久的回液故障还会导致压缩机部件的机械故障,造成高额的维修费用。因此,本文提出决策树模型检... 近年来,多联机在各类建筑上得到广泛应用。一旦压缩机发生回液故障,将会导致多联机偏离正常工况,能效降低,同时无法保障室内环境的舒适性。长久的回液故障还会导致压缩机部件的机械故障,造成高额的维修费用。因此,本文提出决策树模型检测多联机压缩机回液故障。首先,通过数据集成和剔除缺失值得到齐整数据;其次,通过专家知识和线性相关分析分别选取变量和剔除冗余变量;最后,建立决策树模型检测回液故障。结果表明,决策树模型能够有效地检测出回液故障,而且与专业知识吻合得较好。 展开更多
关键词 多联机 压缩机回液 决策树 故障检测与诊断
下载PDF
基于互补模型的汉语韵律间断自动检测
8
作者 倪崇嘉 刘文举 徐波 《计算机科学》 CSCD 北大核心 2011年第12期242-246,共5页
自动韵律间断检测和标注对语音理解和语音合成有十分重要的作用。提出了利用声学、词典和语法相关特征的互补模型方法检测汉语韵律间断。该方法具有下列优点:(1)摒弃了声学相关特征和词典、语法相关特征的独立性假设;(2)互补模型方法不... 自动韵律间断检测和标注对语音理解和语音合成有十分重要的作用。提出了利用声学、词典和语法相关特征的互补模型方法检测汉语韵律间断。该方法具有下列优点:(1)摒弃了声学相关特征和词典、语法相关特征的独立性假设;(2)互补模型方法不仅在特征层上利用当前音节的上下文信息,而且在模型层次上利用了当前音节的上下文信息。在ASCCD语料库上验证了该方法能够获得90.34%的韵律间断的检测准确率,较基线系统有6.09%的提高。 展开更多
关键词 韵律间断 互补模型 Boosting分类回归树 条件随机场 神经网络 支持向量机
下载PDF
十万大山北坡土壤条件对马尾松高生长影响的初步分析 被引量:1
9
作者 李大南 杨炳强 《基因组学与应用生物学》 CAS CSCD 1991年第3期69-75,共7页
回归分析结果表明,广西十万大山北坡土壤条件与马尾松高生长间的关系属非线性关系。母岩(母质)、海拔、土壤有机质、土壤质地与马尾松高生长间正相关显著;土壤紧实度与马尾松高生长间负相关显著;而土壤全氮、碱解氮、速效磷、速效钾与... 回归分析结果表明,广西十万大山北坡土壤条件与马尾松高生长间的关系属非线性关系。母岩(母质)、海拔、土壤有机质、土壤质地与马尾松高生长间正相关显著;土壤紧实度与马尾松高生长间负相关显著;而土壤全氮、碱解氮、速效磷、速效钾与马尾松高生长间相关未达到显著水平。各土壤条件对马尾松高生长相关程度的大小顺序为:母岩(母质)>海拔>土壤质地>土壤紧实度>土壤有机质>土壤全氮>土壤速效磷>土壤速效钾>土壤碱解氮。以母岩(母质)、海拔、紧实度、有机质、质地与马尾松平均高所建立的相应一元非线性回归方程,X^2检验无显著差异,对该地区马尾松高生长有较高的预测精度。 展开更多
关键词 马尾松 树高 土壤条件 非线性回归
下载PDF
Building a model-based personalised recommendation approach for tourist attractions from geotagged social media data 被引量:7
10
作者 Xiaoyu Sun Zhou Huang +2 位作者 Xia Peng Yiran Chen Yu Liu 《International Journal of Digital Earth》 SCIE EI 2019年第6期661-678,共18页
When travelling,people are accustomed to taking and uploading photos on social media websites,which has led to the accumulation of huge numbers of geotagged photos.Combined with multisource information(e.g.weather,tra... When travelling,people are accustomed to taking and uploading photos on social media websites,which has led to the accumulation of huge numbers of geotagged photos.Combined with multisource information(e.g.weather,transportation,or textual information),these geotagged photos could help us in constructing user preference profiles at a high level of detail.Therefore,using these geotagged photos,we built a personalised recommendation system to provide attraction recommendations that match a user’s preferences.Specifically,we retrieved a geotagged photo collection from the public API for Flickr(Flickr.com)and fetched a large amount of other contextual information to rebuild a user’s travel history.We then created a model-based recommendation method with a two-stage architecture that consists of candidate generation(the matching process)and candidate ranking.In the matching process,we used a support vector machine model that was modified for multiclass classification to generate the candidate list.In addition,we used a gradient boosting regression tree to score each candidate and rerank the list.Finally,we evaluated our recommendation results with respect to accuracy and ranking ability.Compared with widely used memory-based methods,our proposed method performs significantly better in the cold-start situation and when mining‘long-tail’data. 展开更多
关键词 Recommendation system geotagged photos social media model-based approach support vector machine(SVM) gradient boosting regression tree(GBRT)
原文传递
“X不比/没有/不如Y Z”变体选择的多变量分析
11
作者 张进凯 《当代语言学》 CSSCI 北大核心 2024年第1期84-98,共15页
本研究基于语料库标注数据,首先探讨制约“X不比/没有/不如YZ”变体选择的显著因素及其影响效应,发现当语域偏向书面语、比较项和被比项为无生、结论项极性体现为积极义、比较点出现时,结构选择上倾向于“X没有YZ”“X不如YZ”,但是当... 本研究基于语料库标注数据,首先探讨制约“X不比/没有/不如YZ”变体选择的显著因素及其影响效应,发现当语域偏向书面语、比较项和被比项为无生、结论项极性体现为积极义、比较点出现时,结构选择上倾向于“X没有YZ”“X不如YZ”,但是当比较项和被比项词长不等时,结构选择上倾向于“X不比YZ”。本研究发现“X不比/没有/不如YZ”变体选择是多个因素互相作用的结果,而且不同因素之间常常呈现出复杂的多重交互效应。最后发现对“X不比/没有/不如YZ”变体选择具有显著影响的预测变量,按照其相对重要性由高到低依次是:结论项极性、语域、比较点的位置、被比项的生命度、比较项和被比项的词长、比较项的生命度。 展开更多
关键词 逻辑回归 对数优势比 条件推断决策树 随机森林 多变量分析
原文传递
非综合征性唇腭裂高危因素条件Logistic回归与数据挖掘相结合的临床研究 被引量:4
12
作者 刘长云 丁艳 +3 位作者 王永芹 曹顺利 陈景武 季加芬 《中华口腔医学研究杂志(电子版)》 CAS 2009年第3期21-24,共4页
目的探讨非综合征性唇腭裂(NSCL/P)发病的主要危险因素;确立NSCL/P发病概率的预测模型,为优生网络的构建奠定基础。方法采用1∶1配对病例对照研究,病例组为年龄在0~12岁之间的NSCL/P患儿126例;对照组来源于同一机构门诊或病房或同一居... 目的探讨非综合征性唇腭裂(NSCL/P)发病的主要危险因素;确立NSCL/P发病概率的预测模型,为优生网络的构建奠定基础。方法采用1∶1配对病例对照研究,病例组为年龄在0~12岁之间的NSCL/P患儿126例;对照组来源于同一机构门诊或病房或同一居住区符合配对条件的非唇腭裂患儿。根据危险因素编制调查表,对病例组与对照组患儿父母进行调查,数据经审核后录入Excel2003建立数据库。首先使用条件Logistic回归对资料进行单因素分析,再对单因素筛选的变量结合专业知识进行多因素分析,筛选主要危险因素并建立回归模型,根据危险因素分别建立分类树与LogitBoost算法的发病概率预测模型,采用ROC曲线对两模型进行评价,从而确立本研究中NSCL/P发病概率的预测模型。结果病例组与对照组作对照分析,进入条件Logistic回归模型的变量有:母亲孕期感染史(P=0.011)、家族遗传史(P=0.008)、母孕期饮食是否规律(P=0.005)、胎次(P=0.003)、母亲孕期异常情绪史(P=0.001)、父亲学历(P=0.000)。经ROC曲线评价,确立分类树模型可用来预测NSCL/P的发病概率。结论母亲孕期感染、家族遗传、母亲孕期饮食不规律、胎次、母亲孕期异常情绪是NSCL/P发病的促进因素;父亲学历是该病的保护因素。经ROC曲线评价,最终确立分类树模型为NSCL/P发病概率的预测模型。 展开更多
关键词 非综合征性唇腭裂 高危因素 条件LOGISTIC回归 分类树 Logitboost ROC曲线
原文传递
非综合征性唇腭裂高危因素与发病预测模型研究 被引量:1
13
作者 刘长云 丁艳 +2 位作者 王永芹 季加芬 陈景武 《中国实用口腔科杂志》 CAS 2009年第8期465-468,共4页
目的探讨非综合征性唇腭裂(nonsyndromic cleft lip and palate,NSCL/P)发病的主要危险因素;评估这些主要危险因素在NSCL/P发病中的相对重要性,最终确立NSCL/P发病概率的预测模型,为优生网络的构建奠定基础。方法采用1∶1配对病例对照研... 目的探讨非综合征性唇腭裂(nonsyndromic cleft lip and palate,NSCL/P)发病的主要危险因素;评估这些主要危险因素在NSCL/P发病中的相对重要性,最终确立NSCL/P发病概率的预测模型,为优生网络的构建奠定基础。方法采用1∶1配对病例对照研究,病例组来源于2006年9月至2007年9月在潍坊医学院附属医院、潍坊市人民医院、菏泽市立医院、烟台毓璜顶医院口腔科住院,年龄在12岁以下患有NSCL/P的儿童76例;对照组为来源于同一机构门诊或病房或同一居住区符合配对条件的非唇腭裂儿童76名。根据拟定的42项危险因素编制调查表,对病例组患儿与对照组儿童的父母进行调查,数据经审核后录入Excel 2003建立数据库。首先使用条件Logistic回归对资料进行单因素分析,再对单因素筛选的变量结合专业知识进行多因素分析,筛选主要危险因素并建立回归模型,根据危险因素分别建立分类树与LogitBoost算法的发病概率预测模型,采用受试者工作特征曲线(ROC曲线)对两模型进行评价,从而确立本研究中NSCL/P发病概率的预测模型。结果病例组与对照组作对比分析,进入条件Logistic回归模型的变量有:母亲孕期感染史(P=0.010)、家族遗传史(P=0.009)、母孕期饮食是否规律(P=0.007)、胎次(P=0.004)、母亲孕期异常情绪史(P<0.001)、父亲学历(P<0.001)。经ROC曲线评价,确立分类树模型可用来预测NSCL/P的发病概率。结论母亲孕期感染、家族遗传、母亲孕期饮食不规律、胎次、母亲孕期异常情绪是NSCL/P发病的促进因素,且其对NSCL/P发病的影响作用依次增强;父亲学历是该病的保护因素。经ROC曲线评价,最终确立分类树模型为NSCL/P发病概率的预测模型。 展开更多
关键词 非综合征性唇腭裂 高危因素 条件LOGISTIC回归 分类树 Logitboost ROC曲线
原文传递
降雨特征对合流制管网溢流污染的影响 被引量:11
14
作者 海永龙 佃柳 +2 位作者 郁达伟 魏源送 柳蒙蒙 《环境工程学报》 CAS CSCD 北大核心 2020年第11期3082-3091,共10页
为明确北运河流域合流制管网溢流污染特性的影响因素,选取上游城乡结合部的合流制溢流口为对象,基于现场连续监测和采样调查结果,采用条件回归树方法分析了合流制管网溢流污染的水质水量等参数与降雨特征之间的响应关系,并通过分析典型... 为明确北运河流域合流制管网溢流污染特性的影响因素,选取上游城乡结合部的合流制溢流口为对象,基于现场连续监测和采样调查结果,采用条件回归树方法分析了合流制管网溢流污染的水质水量等参数与降雨特征之间的响应关系,并通过分析典型强降雨形成的溢流污染过程,验证了条件回归树预测的阈值。结果表明:沙河库区合流制管网溢流的污水流量与降雨特征密切相关,次降雨量在15~19 mm时发生溢流,溢流事件和溢流量高峰滞后于降雨强度高峰15~60 min,初期溢流污染物浓度高峰在持续(45±5) min后达到稳定水平;次降雨量显著影响溢流的流量和浊度(P<0.001),次降雨量(P=0.029)、平均降雨强度(P<0.001)均显著影响溢流COD。研究结果可为北运河消减合流制管网溢流污染提供参考。 展开更多
关键词 合流制管网溢流 条件回归树 降雨特征 COD 浊度
原文传递
利用CART分类树分类检测交通拥堵点 被引量:6
15
作者 孙梦婷 魏海平 +1 位作者 李星滢 徐立 《武汉大学学报(信息科学版)》 EI CAS CSCD 北大核心 2022年第5期683-692,共10页
交通拥堵检测是城市交通管理工作的重点和难点之一,现有的拥堵检测以路段为单位,不利于拥堵时空演变规律信息的提取,且检测内容大多只涉及拥堵程度,缺少对拥堵类型的识别。基于CART(classification and regression tree)分类树算法,提... 交通拥堵检测是城市交通管理工作的重点和难点之一,现有的拥堵检测以路段为单位,不利于拥堵时空演变规律信息的提取,且检测内容大多只涉及拥堵程度,缺少对拥堵类型的识别。基于CART(classification and regression tree)分类树算法,提出一种以路段点为检测单元的拥堵点分类检测方法,该方法可根据路段平均行驶速度实时检测拥堵点及其类型。首先,将路段等距离划分后映射为路段点,根据时空维路况异常规则和异常模式,以路段点为单元分析了4种拥堵类型的时空演变模式;其次,在路段路况检测的基础上,提取路段点路况时空序列,根据不同类型的拥堵模式对路况时空序列进行分类标记;然后,选取4种速度指标作为样本属性集合,按照属性集合提取各路段点在各时段的速度,以此作为决策树学习的数据集;最后,基于CART分类树算法,采用交叉验证的方式训练出最优模型,使其达到最佳的泛化能力。与支持向量机(support vector machine,SVM)分类模型进行比较,实验结果表明,该方法在分类检测交通拥堵点时具有较高的正确率和召回率,且分类检测时效性较好。 展开更多
关键词 交通拥堵点 拥堵时空演变模式 拥堵点分类检测 路况时空序列 CART
原文传递
Automatic Prosodic Break Detection and Feature Analysis 被引量:1
16
作者 倪崇嘉 张爱英 +1 位作者 刘文举 徐波 《Journal of Computer Science & Technology》 SCIE EI CSCD 2012年第6期1184-1196,共13页
Automatic prosodic break detection and annotation are important for both speech understanding and natural speech synthesis. In this paper, we discuss automatic prosodic break detection and feature analysis. The contri... Automatic prosodic break detection and annotation are important for both speech understanding and natural speech synthesis. In this paper, we discuss automatic prosodic break detection and feature analysis. The contributions of the paper are two aspects. One is that we use classifier combination method to detect Mandarin and English prosodic break using acoustic, lexical and syntactic evidence. Our proposed method achieves better performance on both the Mandarin prosodic annotation corpus Annotated Speech Corpus of Chinese Discourse and the English prosodic annotation corpus -- Boston University Radio News Corpus when compared with the baseline system and other researches' experimental results. The other is the feature analysis for prosodic break detection. The functions of different features, such as duration, pitch, energy, and intensity, are analyzed and compared in Mandarin and English prosodic break detection. Based on the feature analysis, we also verify some linguistic conclusions. 展开更多
关键词 prosodic break intonational phrase boundary classifier combination boosting classification and regression tree conditional random field
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部