不同环境因子组合和负样本选取策略对崩岗易发性评价结果存在较多不确定性。为探究其对评价结果的影响,该研究以江西省兴国县花岗岩区为例,利用地理探测器探测17个环境因子的统计量q值,根据累计q值百分比大小依次选择4、7、10和17个环...不同环境因子组合和负样本选取策略对崩岗易发性评价结果存在较多不确定性。为探究其对评价结果的影响,该研究以江西省兴国县花岗岩区为例,利用地理探测器探测17个环境因子的统计量q值,根据累计q值百分比大小依次选择4、7、10和17个环境因子进行组合;利用单随机欠采样、频率比法及改进频率比法等负样本选取策略构建与正样本等量的负样本数据集;采用随机森林模型进行易发性评价,并对评价结果进行对比分析。结果表明:1)3种负样本选取策略下的模型精度随着因子数量的增加先下降再上升,考虑4个环境因子的模型AUC(area under curve)值分别为0.729、0.909和0.909,较最优环境因子组合仅相差0.020~0.038,说明考虑主控环境因子,即可得到较为理想的精度;2)通过频率比法选取的负样本数据集更具合理性;3)研究区内高和极高易发区主要分布在兴国县西南部,而极低易发区主要分布在兴国县北部及东部,这与实际情况较吻合。该研究通过探究不同环境因子组合和负样本选取策略对崩岗易发性评价的影响,可为花岗岩区崩岗的防灾减灾提供科学依据。展开更多
抗生素的滥用导致细菌出现耐药性并严重阻碍了细菌感染治疗的发展,然而噬菌体的出现使得细菌耐药性的肆虐得到了缓解,噬菌体疗法逐步成为治疗细菌感染的重要手段.为了更高效地筛选用于治疗的噬菌体,需要采用比传统湿实验更快捷有效的筛...抗生素的滥用导致细菌出现耐药性并严重阻碍了细菌感染治疗的发展,然而噬菌体的出现使得细菌耐药性的肆虐得到了缓解,噬菌体疗法逐步成为治疗细菌感染的重要手段.为了更高效地筛选用于治疗的噬菌体,需要采用比传统湿实验更快捷有效的筛选方法 .传统的计算方法往往以宿主作为预测标签,忽视了两者序列间相互作用的本质.此外,现有的方法通常仅限于种和属的水平,种内预测方法非常少见.由于物种的完整基因组信息往往难以获取,现有数据库中大多数菌株仅包含部分基因组信息.在此背景下,提出一种新的噬菌体-宿主互作预测方法,通过K-means负采样,构建差值特征向量,用于筛选代表性的负样本进行模型训练,最终本研究开发了基于差值特征向量和XGBoost的预测工具DiffXGPBI.实验结果显示,各菌种的平均预测AUC(Area Under the Curve)达到0.92,外部验证集的总体预测AUC和AUPR(Area Under the Precision-Recall curve)达到0.91和0.88,优于其他预测工具.关于特征和模型的消融实验表明,DiffXGPBI的每个模块是必要的,并且的确对预测性能起到提升作用,证实了模型的合理性.此外,基于新的未知PHI(phage host interaction)和种内案例的预测实验,验证了DiffXGPBI的泛化性和种内预测的潜力.综上,本研究提出的特征工程和预测思路提高了互作预测的鲁棒性和稳定性,具有较高的泛化性,为噬菌体治疗的快速筛选提供了新方向和见解.展开更多
目的利用数据挖掘分析穴位按摩治疗负性情绪的选穴配伍规律,为负性情绪患者的穴位按摩提供参考依据。方法以“穴位按摩”“负性情绪”“焦虑”“抑郁”等为关键词,检索PubMed、Web of Science、中国知网、万方数据知识服务平台、中国生...目的利用数据挖掘分析穴位按摩治疗负性情绪的选穴配伍规律,为负性情绪患者的穴位按摩提供参考依据。方法以“穴位按摩”“负性情绪”“焦虑”“抑郁”等为关键词,检索PubMed、Web of Science、中国知网、万方数据知识服务平台、中国生物医学文献数据库等数据库中相关的文献,建立穴位按摩治疗负性情绪的腧穴数据库,进行穴位频次描述性分析和配伍规律关联规则、复杂网络以及聚类分析。结果最终纳入文献103篇,共含腧穴78个,针对人群多为神经科、心血管科的患者;最常用腧穴依次为百会、内关、合谷、太冲,多数腧穴分布在头项部及四肢,经络以督脉、足太阳膀胱经为主,特定穴以五输穴、原穴居多;关联规则表明,太冲、肝俞、合谷关联组合置信度最高,神经科负性情绪患者中百会、太冲、合谷配伍置信度最高,心血管科负性情绪患者,膻中、至阳配伍置信度最高;复杂网络显示核心处方为太冲、合谷、内关、太阳、百会;聚类分析得到腧穴聚类组合4组。结论太冲、合谷、内关、太阳、百会是治疗负性情绪核心腧穴,穴位配伍治疗效果更好,数据挖掘所得结果对临床具有一定的参考价值。展开更多
文摘不同环境因子组合和负样本选取策略对崩岗易发性评价结果存在较多不确定性。为探究其对评价结果的影响,该研究以江西省兴国县花岗岩区为例,利用地理探测器探测17个环境因子的统计量q值,根据累计q值百分比大小依次选择4、7、10和17个环境因子进行组合;利用单随机欠采样、频率比法及改进频率比法等负样本选取策略构建与正样本等量的负样本数据集;采用随机森林模型进行易发性评价,并对评价结果进行对比分析。结果表明:1)3种负样本选取策略下的模型精度随着因子数量的增加先下降再上升,考虑4个环境因子的模型AUC(area under curve)值分别为0.729、0.909和0.909,较最优环境因子组合仅相差0.020~0.038,说明考虑主控环境因子,即可得到较为理想的精度;2)通过频率比法选取的负样本数据集更具合理性;3)研究区内高和极高易发区主要分布在兴国县西南部,而极低易发区主要分布在兴国县北部及东部,这与实际情况较吻合。该研究通过探究不同环境因子组合和负样本选取策略对崩岗易发性评价的影响,可为花岗岩区崩岗的防灾减灾提供科学依据。
文摘抗生素的滥用导致细菌出现耐药性并严重阻碍了细菌感染治疗的发展,然而噬菌体的出现使得细菌耐药性的肆虐得到了缓解,噬菌体疗法逐步成为治疗细菌感染的重要手段.为了更高效地筛选用于治疗的噬菌体,需要采用比传统湿实验更快捷有效的筛选方法 .传统的计算方法往往以宿主作为预测标签,忽视了两者序列间相互作用的本质.此外,现有的方法通常仅限于种和属的水平,种内预测方法非常少见.由于物种的完整基因组信息往往难以获取,现有数据库中大多数菌株仅包含部分基因组信息.在此背景下,提出一种新的噬菌体-宿主互作预测方法,通过K-means负采样,构建差值特征向量,用于筛选代表性的负样本进行模型训练,最终本研究开发了基于差值特征向量和XGBoost的预测工具DiffXGPBI.实验结果显示,各菌种的平均预测AUC(Area Under the Curve)达到0.92,外部验证集的总体预测AUC和AUPR(Area Under the Precision-Recall curve)达到0.91和0.88,优于其他预测工具.关于特征和模型的消融实验表明,DiffXGPBI的每个模块是必要的,并且的确对预测性能起到提升作用,证实了模型的合理性.此外,基于新的未知PHI(phage host interaction)和种内案例的预测实验,验证了DiffXGPBI的泛化性和种内预测的潜力.综上,本研究提出的特征工程和预测思路提高了互作预测的鲁棒性和稳定性,具有较高的泛化性,为噬菌体治疗的快速筛选提供了新方向和见解.
文摘目的利用数据挖掘分析穴位按摩治疗负性情绪的选穴配伍规律,为负性情绪患者的穴位按摩提供参考依据。方法以“穴位按摩”“负性情绪”“焦虑”“抑郁”等为关键词,检索PubMed、Web of Science、中国知网、万方数据知识服务平台、中国生物医学文献数据库等数据库中相关的文献,建立穴位按摩治疗负性情绪的腧穴数据库,进行穴位频次描述性分析和配伍规律关联规则、复杂网络以及聚类分析。结果最终纳入文献103篇,共含腧穴78个,针对人群多为神经科、心血管科的患者;最常用腧穴依次为百会、内关、合谷、太冲,多数腧穴分布在头项部及四肢,经络以督脉、足太阳膀胱经为主,特定穴以五输穴、原穴居多;关联规则表明,太冲、肝俞、合谷关联组合置信度最高,神经科负性情绪患者中百会、太冲、合谷配伍置信度最高,心血管科负性情绪患者,膻中、至阳配伍置信度最高;复杂网络显示核心处方为太冲、合谷、内关、太阳、百会;聚类分析得到腧穴聚类组合4组。结论太冲、合谷、内关、太阳、百会是治疗负性情绪核心腧穴,穴位配伍治疗效果更好,数据挖掘所得结果对临床具有一定的参考价值。