随着自然语言处理(NLP,natural language processing)技术的快速发展,语言模型在文本分类和情感分析中的应用不断增加。然而,语言模型容易遭到盗版再分发,对模型所有者的知识产权造成严重威胁。因此,研究者着手设计保护机制来识别语言...随着自然语言处理(NLP,natural language processing)技术的快速发展,语言模型在文本分类和情感分析中的应用不断增加。然而,语言模型容易遭到盗版再分发,对模型所有者的知识产权造成严重威胁。因此,研究者着手设计保护机制来识别语言模型的版权信息。现有的适用于文本分类任务的语言模型水印无法与所有者身份相关联,且鲁棒性不足以及无法再生成触发集。为了解决这些问题,提出一种新的适用于文本分类任务模型的黑盒水印方案,可以远程快速验证模型所有权。将模型所有者的版权消息和密钥通过密钥相关的哈希运算消息认证码(HMAC,hash-based message authentication code)得到版权消息摘要,由HMAC得到的消息摘要可以防止被伪造,具有很强的安全性。从原始训练集各个类别中随机挑选一定的文本数据,将摘要与文本数据结合构建触发集,并在训练过程中对语言模型嵌入水印。为了评估水印的性能,在IMDB电影评论、CNEWS中文新闻文本分类数据集上对3种常见的语言模型嵌入水印。实验结果表明,在不影响原始模型测试精度的情况下,所提出的水印验证方案的准确率可以达到100%。即使在模型微调和剪枝等常见攻击下,也能表现出较强的鲁棒性,并且具有抗伪造攻击的能力。同时,水印的嵌入不会影响模型的收敛时间,具有较高的嵌入效率。展开更多
文摘目的采用网络药理学方法和分子对接技术探讨经典名方泻白散治疗肺炎潜在作用机制。方法通过检索TCMSP、BATMAN-TCM数据库获取泻白散活性成分及作用靶点,通过DisGeNET、Gene Cards数据库获取肺炎的相关靶点,筛选得到泻白散治疗肺炎的活性成分及作用靶点,采用Cytoscape 3.6.0构建药物-成分-靶点-疾病作用网络。利用STRING数据库和Cytoscape 3.6.0软件构建泻白散治疗肺炎靶点间蛋白质-蛋白质互作关系(PPI)网络并筛选得到关键靶点及其PPI网络。利用DAVID数据库对关键靶点进行基因本体(gene ontology,GO)富集分析与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析。最后利用AutoDock工具对泻白散成分和靶点进行分子对接。结果本研究通过构建药物-靶点-疾病网络,发现泻白散中74个活性成分可以作用于与肺炎相关的53个靶点,其中槲皮素、血根碱、山柰酚、β-谷甾醇等成分是潜在药效成分。利用拓扑学筛选得到关键靶点9个,包括白细胞介素8(IL8)、白细胞介素6(IL6)、白细胞介素1β(IL1B)、肿瘤坏死因子(TNF)等;GO分析获得90个条目,泻白散治疗肺炎可能涉及炎症反应、免疫应答、细胞因子活性等过程,KEGG分析获得41个条目,炎症性肠病、百日咳等通路可能是泻白散治疗肺炎的潜在通路,分子对接结果显示方中主要活性成分槲皮素、血根碱、山奈酚、β-谷甾醇等与核心靶点IL8,IL6,IL4和TNF等均能实现自发结合。结论中医经典名方泻白散中槲皮素、血根碱、山奈酚等活性成分可能通过炎症性肠病、百日咳等通路实现对肺炎的防治。