期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于PAT-tree的中文关键词自动检索模式的研究 被引量:4
1
作者 柳佳刚 陈山 《计算技术与自动化》 2009年第2期119-123,共5页
利用可变长语言模型对中文文档的关键词进行准确识别是中文信息处理中的一个重要问题。由于不存在n元语言模型的截断效应,对关键词检索的长度没有限制,因此增加了关键词识别的难度。利用PAT-tree技术设计了一个改进的可变长统计语言模... 利用可变长语言模型对中文文档的关键词进行准确识别是中文信息处理中的一个重要问题。由于不存在n元语言模型的截断效应,对关键词检索的长度没有限制,因此增加了关键词识别的难度。利用PAT-tree技术设计了一个改进的可变长统计语言模型对中文文档中的关键词进行识别。在该模型基础上进行相关性检测实验。实验结果表明基于PAT-tree的改进语言模型能更好的识别关键词。 展开更多
关键词 pattree 信息检索 语言模型 交互信息
下载PDF
基于PAT TREE统计语言模型与关键词自动提取 被引量:12
2
作者 杨文峰 李星 《计算机工程与应用》 CSCD 北大核心 2001年第15期17-19,35,共4页
未登录关键词的识别是中文信息处理中的一个关键问题。文章利用PAT TREE实现了一种可变长统计语言模型,由于不存在n元统计语言模型的截断效应,从而对待提取的关键词的长度没有限制。在该模型的基础上,通过相关性检测,从540M汉语语... 未登录关键词的识别是中文信息处理中的一个关键问题。文章利用PAT TREE实现了一种可变长统计语言模型,由于不存在n元统计语言模型的截断效应,从而对待提取的关键词的长度没有限制。在该模型的基础上,通过相关性检测,从540M汉语语料中自动提取出了12万个关键词候选字串。最后,经过分析和筛选,候选字串的准确度由82.3%上升到96.1%。实验表明,基于PAT TREE的统计语言模型是实现未登录词提取的有力工具。 展开更多
关键词 信息检索 统计语言模型 关键词 自动提取 pattree INTERNET
下载PDF
用PAT Tree构建Internet搜索引擎分布式数据库 被引量:2
3
作者 杜可亮 李星 杨文峰 《计算机应用》 CSCD 北大核心 2002年第9期4-6,共3页
文中根据Internet搜索引擎的特点 ,提出了用PATTree作为搜索引擎索引数据库的思想 ,在理论上对其可行性进行了分析 ,用它实现了一个能够对FTP站点进行检索的实验性搜索引擎。
关键词 pat-tree Internet 搜索引擎 分布式数据库
下载PDF
红树林共生真菌Paecilomyces sp· Tree 1-7代谢产物的研究 被引量:3
4
作者 温露 林永成 +3 位作者 赵丽冰 佘志刚 蔡小铃 郑忠辉 《中药材》 CAS CSCD 北大核心 2006年第8期782-785,共4页
用硅胶柱色谱及重结晶等方法,并根据理化性质和光谱数据从一株红树林共生真菌Paecilomycessp.Tree 1-7中分离鉴定了四个化合物,分别为secalon ic ac id A(1),tenellic ac id A(2),大黄素(3),大黄酚(4)。并首次对化合物1和2进行了抗人的... 用硅胶柱色谱及重结晶等方法,并根据理化性质和光谱数据从一株红树林共生真菌Paecilomycessp.Tree 1-7中分离鉴定了四个化合物,分别为secalon ic ac id A(1),tenellic ac id A(2),大黄素(3),大黄酚(4)。并首次对化合物1和2进行了抗人的肝癌细胞hepG2的活性测试。结果显示,化合物1有很强的抗肿瘤活性,IC50=2.0μg/m l,化合物2的抗肿瘤活性IC50=62.1μg/m l。 展开更多
关键词 红树林 PAECILOMYCES sp.tree 1-7 代谢产物
下载PDF
基于PATTree的半结构化文本信息抽取范式研究 被引量:2
5
作者 曹进军 《情报杂志》 CSSCI 北大核心 2007年第7期55-58,共4页
信息抽取器在信息抽取领域是一个很重要的部分,而抽取器的研制通常要依靠抽取规则来实现。以前是利用使用者的使用模式或记录,找出相关的抽取规则。而利用PAT Tree可以直接从半结构化的Web的资料中,找出抽取规则。
关键词 pat tree 半结构化文本 信息抽取 范式
下载PDF
Chinese Term Extraction Based on PAT Tree 被引量:2
6
作者 张锋 樊孝忠 许云 《Journal of Beijing Institute of Technology》 EI CAS 2006年第2期162-166,共5页
A new method of automatic Chinese term extraction is proposed based on Patricia (PAT) tree. Mutual information is calculated based on prefix searching in PAT tree of domain corpus to estimate the internal associativ... A new method of automatic Chinese term extraction is proposed based on Patricia (PAT) tree. Mutual information is calculated based on prefix searching in PAT tree of domain corpus to estimate the internal associative strength between Chinese characters in a string. It can improve the speed of term candidate extraction largely compared with methods based on domain corpus directly. Common collocation suffix, prefix bank are constructed and term part of speech (POS) composing rules are summarized to improve the precision of term extraction. Experiment results show that the F-measure is 74.97%. 展开更多
关键词 term extraction pat tree mutual information CORPUS
下载PDF
基于HowNet和PAT树的网购评语情感分析 被引量:4
7
作者 李永忠 胡思琪 《图书情报研究》 2016年第3期66-70,65,共6页
在对相关研究情况进行总结与分析的基础上,通过对How Net情感词典进行扩展并利用基于PAT树和统计相结合的分词方法,对从淘宝网站中获取的评论内容进行分析,结果表明,基于How Net和PAT树的情感分析方法对分析网购评论的情感倾向性行之有... 在对相关研究情况进行总结与分析的基础上,通过对How Net情感词典进行扩展并利用基于PAT树和统计相结合的分词方法,对从淘宝网站中获取的评论内容进行分析,结果表明,基于How Net和PAT树的情感分析方法对分析网购评论的情感倾向性行之有效,并以淘宝一女装商家为例进行实证研究,最后指出进一步探索情感倾向性分析的几个方向。 展开更多
关键词 HowNet情感词典 pat 网购评语 情感分析
下载PDF
一种基于分类-回归决策树的烤烟产区识别模型 被引量:3
8
作者 张毅 李强 +2 位作者 王政 张一扬 周冀衡 《中国烟草学报》 EI CAS CSCD 北大核心 2014年第6期28-33,共6页
为建立不同产区及风格烤烟烟叶与化学指标之间的关系,对2005~2009年湖南省、河南省、福建省和云南省等4省份共计1040份烟叶样品的21种化学成分进行检测,并利用Mining Tree模型进行分类-回归决策树(C&RT analysis)数据分析。结果表明... 为建立不同产区及风格烤烟烟叶与化学指标之间的关系,对2005~2009年湖南省、河南省、福建省和云南省等4省份共计1040份烟叶样品的21种化学成分进行检测,并利用Mining Tree模型进行分类-回归决策树(C&RT analysis)数据分析。结果表明:(1)从21个烟叶化学成分中,共筛选出14个特征化学指标,其中钾和硝酸根为4省烟叶共有特征化学指标;(2)湖南、河南、福建和云南4省份识别概率最高的特征化学指标分段组合(Segment)分别为:还原糖(≤24.93%)、钾(〉1.98%)、p H值(≤5.37)(p=0.658);钾(≤1.98%)、灰分(〉11.03%)、水溶性灰份碱度(≤0.49)、硝酸根(≤0.06%)(p=0.776);还原糖(〉24.93%)、钾(〉1.98%)、硝酸根(≤0.06%)、蛋白质(〉5.01%)(p=0.914);钾(≤1.98%)、灰分(≤11.03%)、水溶性总糖(〉28.94%)、硫酸根(≤1.43%)(p=0.957)。分类-回归决策树方法在建立烤烟化学成分识别模型中具有重要的应用价值。 展开更多
关键词 烤烟 产区 化学指标 识别 分类-回归决策树分析 MINING tree模型
下载PDF
热处理对转基因秸秆中重组蛋白和重组DNA的降解作用
9
作者 颜晶莹 倪亮 +1 位作者 沈星宇 李玉 《浙江农业学报》 CSCD 北大核心 2024年第9期2079-2088,共10页
随着转基因作物种植面积的不断扩大,如何高效处理转基因秸秆成为了一个重要的科学问题。未经处理的转基因秸秆中的重组蛋白和重组DNA可以在土壤中存在很长时间,并对土壤生物多样性产生潜在负面影响。因此寻找一个既节约成本又对环境无... 随着转基因作物种植面积的不断扩大,如何高效处理转基因秸秆成为了一个重要的科学问题。未经处理的转基因秸秆中的重组蛋白和重组DNA可以在土壤中存在很长时间,并对土壤生物多样性产生潜在负面影响。因此寻找一个既节约成本又对环境无害的秸秆处理方法非常重要。高温处理是降解转基因秸秆重组蛋白和重组DNA的有效手段,但目前对处理温度和处理时间的选择还缺乏系统的研究。本研究通过试纸条、聚合酶链反应(PCR)等方法检测不同温度和时间处理的转基因作物秸秆中重组蛋白和重组DNA的水平。结果表明,转基因大豆、棉花、玉米、水稻的秸秆在50℃处理3 h后,其体内的抗除草剂蛋白草胺膦乙酰转移酶(phosphinothricin acetyltransferase, PAT)等重组蛋白基本降解;但相同温度下,重组DNA的降解则需要4 d时间;提高处理温度可以在一定程度上缩短重组蛋白和重组DNA降解所需的时间。50℃处理4 d的条件在实际生产中通过堆肥就能实现。本研究从分子生物学的角度为转基因秸秆处理提供了依据。 展开更多
关键词 转基因秸秆 重组蛋白 重组DNA 草胺膦乙酰转移酶(pat) 5-烯醇式丙酮莽草酸-3-磷酸合酶基因(Cp4-EPSPS) BT基因
下载PDF
叶绿体G 3 PAT酶酰基选择性与植物低温敏感性关系的研究进展
10
作者 朱素琴 季本华 赵华 《种子》 CSCD 北大核心 2008年第8期47-51,共5页
叶绿体甘油-3-磷酸酰基转移酶(G 3 PAT)的酰基选择性与植物低温敏感性密切相关。一般来讲,冷敏感植物叶片中PG分子饱和度比抗冷植物中的高。叶绿体G3 PAT酶是决定PG分子种类并影响其分子中脂肪酸饱和度的关键酶,而G 3 PAT酶分子中的关... 叶绿体甘油-3-磷酸酰基转移酶(G 3 PAT)的酰基选择性与植物低温敏感性密切相关。一般来讲,冷敏感植物叶片中PG分子饱和度比抗冷植物中的高。叶绿体G3 PAT酶是决定PG分子种类并影响其分子中脂肪酸饱和度的关键酶,而G 3 PAT酶分子中的关键氨基酸影响了G 3 PAT酶的酰基选择性。 展开更多
关键词 甘油-3-磷酸-1-酰基转移酶(G 3 pat) 低温敏感性 磷脂酰甘油PG
下载PDF
全文检索模型综述 被引量:12
11
作者 申展 江宝林 +2 位作者 陈祎 唐磊 胡运发 《计算机科学》 CSCD 北大核心 2004年第5期61-64,共4页
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全... 全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全文检索模型构建中一些关键问题进行了分析。 展开更多
关键词 信息检索 文档数据库 全文检索模型 倒排表 pat- 互关联后继树 位图 署名文件
下载PDF
搜索引擎结果聚类算法研究 被引量:11
12
作者 张健沛 刘洋 +1 位作者 杨静 代坤 《计算机工程》 CAS CSCD 北大核心 2004年第5期95-97,共3页
随着Web文档数量的剧增,搜索引擎也暴露了许多问题,用户不得不在搜索引擎返回的大量文档摘要列表中查找。而对搜索引擎结果聚类能使用户在更高的主题层次上来查看搜索引擎返回的结果。该文提出了搜索引擎结果聚类的几个重要指标并给... 随着Web文档数量的剧增,搜索引擎也暴露了许多问题,用户不得不在搜索引擎返回的大量文档摘要列表中查找。而对搜索引擎结果聚类能使用户在更高的主题层次上来查看搜索引擎返回的结果。该文提出了搜索引擎结果聚类的几个重要指标并给出了一个新的基于PAT-tree的搜索引擎结果聚类算法。 展开更多
关键词 聚类 搜索引擎 pattree WEB内容挖掘
下载PDF
领域本体自动构建研究 被引量:12
13
作者 王磊 周宽久 仇鹏 《情报学报》 CSSCI 北大核心 2010年第1期45-52,共8页
本体作为语义基础被广泛应用于信息检索、人工智能、语义网络和知识管理等领域。然而本体的构建和维护工作费时费力,影响了本体的广泛应用。因此,研究者们尝试利用机器学习、数据挖掘等技术自动构建本体,提出诸多本体自动构建的理论... 本体作为语义基础被广泛应用于信息检索、人工智能、语义网络和知识管理等领域。然而本体的构建和维护工作费时费力,影响了本体的广泛应用。因此,研究者们尝试利用机器学习、数据挖掘等技术自动构建本体,提出诸多本体自动构建的理论和方法。本文在总结现存本体自动构建方法的同时深入研究了基于FCA(Formal Concept Analysis)的本体自动构建方法,主要包括:基于PAT-Tree的统计分词,文档特征选择,基于文档一关键词的形式背景生成,最后用FCA构建本体。实验表明,基于FCA的本体构建方法明显提高了本体自动化的程度,卡句建的本体具有较好的可信度。 展开更多
关键词 本体 pat-tree FCA 本体自动构建
下载PDF
一种用于Web信息抽取的页面信息本体自动学习方法 被引量:2
14
作者 柳佳刚 龙军 李泽军 《计算技术与自动化》 2011年第1期119-123,共5页
针对基于Web页面信息本体的信息抽取中,需人工根据待抽信息项的概念和对应的实例值来建立本体的缺点,设计一个页面信息本体的自动学习方法。论文利用前期在基于DOM的页面相似路径归纳学习算法和基于PAT-tree的自动关键词识别算法上的研... 针对基于Web页面信息本体的信息抽取中,需人工根据待抽信息项的概念和对应的实例值来建立本体的缺点,设计一个页面信息本体的自动学习方法。论文利用前期在基于DOM的页面相似路径归纳学习算法和基于PAT-tree的自动关键词识别算法上的研究成果,使用改进的TF.IDF统计方法和复合事件的关联规则算法完成概念和概念间关系的学习,建立页面信息本体,减少建立本体的人工工作量。 展开更多
关键词 本体学习 信息抽取 pat-tree 关联规则
下载PDF
pcDNA3+转化生长因子-β1单独转染及其与pAT_(153)+胰岛素样生长因子-1共转染兔软骨细胞的研究 被引量:9
15
作者 向川 卫小春 杜靖远 《中华实验外科杂志》 CAS CSCD 北大核心 2005年第10期1243-1245,共3页
目的探讨重组大鼠转化生长因子β1基因(pcDNA3+TGFβ1)单独转染及其与重组大鼠胰岛素样生长因子1基因(pAT153+IGF1)共转染兔软骨细胞后细胞增殖及所分泌的TGFβ1因子、IGF1因子、Ⅱ型胶原的变化。方法兔软骨细胞体外分别用pcDNA3+TGFβ... 目的探讨重组大鼠转化生长因子β1基因(pcDNA3+TGFβ1)单独转染及其与重组大鼠胰岛素样生长因子1基因(pAT153+IGF1)共转染兔软骨细胞后细胞增殖及所分泌的TGFβ1因子、IGF1因子、Ⅱ型胶原的变化。方法兔软骨细胞体外分别用pcDNA3+TGFβ1单转染、pcDNA3+TGFβ1和pAT153+IGF1共转染,筛选阳性克隆后,进行原位杂交、免疫组织化学、免疫荧光检测、流式细胞仪检测、3HTdR(3H标记的胸腺嘧啶脱氧核苷)检测。结果基因转染组与空白组相比,TGFβ1、IGF1、Ⅱ型胶原的含量均明显提高,空白组、基因单转染组、基因双转染组软骨细胞位于S期的比例分别为5.6%、33.4%、40.1%,差异有统计学意义(P<0.05)。结论基因pcDNA3+TGFβ1、pAT153+IGF1转染软骨细胞后,细胞分泌的TGFβ1、IGF1及Ⅱ型胶原显著增多,细胞增殖明显增强,上述基因转染有助于软骨细胞活力的提高;pcDNA3+TGFβ1和pAT153+IGF1双基因共转染软骨细胞后,细胞分裂增生活跃程度及分泌的TGFβ1、IGF1和Ⅱ型胶原含量高于pcDNA3+TGFβ1单基因转染,多基因共转染作为将来骨性关节炎基因治疗的方法,其治疗效果可能会优于单基因转染。 展开更多
关键词 pcDNA3+转化生长因子-β1 基因转染 pat153+胰岛素样生长因子-1 软骨细胞 骨性关节炎 基因治疗
原文传递
DNA在Mg/聚2,6-吡啶二甲酸膜上的固定和杂交及其PAT基因片段的电化学阻抗谱测定 被引量:2
16
作者 焦奎 杨涛 +1 位作者 杨婕 冯媛媛 《中国科学(B辑)》 CSCD 北大核心 2007年第1期36-42,共7页
以静电吸附法使Mg^2+修饰于玻碳电极(GCE)上电聚合的2,6-吡啶二甲酸膜(PDC)上,制得的Mg/PDC/GCE电极,成为DNA固定及杂交的良好平台.应用微分脉冲伏安法和电化学阻抗谱对DNA的固定和杂交进行表征.以电化学阻抗谱免标记法检测... 以静电吸附法使Mg^2+修饰于玻碳电极(GCE)上电聚合的2,6-吡啶二甲酸膜(PDC)上,制得的Mg/PDC/GCE电极,成为DNA固定及杂交的良好平台.应用微分脉冲伏安法和电化学阻抗谱对DNA的固定和杂交进行表征.以电化学阻抗谱免标记法检测目标DNA比以亚甲基蓝为指示剂的微分脉冲伏安法有更高的灵敏度.固定于电极表面的DNA探针与互补单链DNA杂交后使电负性的[Fe(CN)6]^3-/4-的表面电子传递电阻值显著增大,以此作为检测信号可以高灵敏度地测定目标DNA.电化学阻抗谱检测转基因植物外源PAT基因片段,线性范围为1.0×10^-9-1.0×10^-5mol/L,检测限为3.4×10^-10mol/L. 展开更多
关键词 聚2 6-吡啶二甲酸 DNA 微分脉冲伏安法 电化学阻抗谱 pat基因
原文传递
基于新闻标题的网络热词发现算法
17
作者 郭冲 《计算机与现代化》 2013年第3期58-62,66,共6页
使用基于PAT-Tree的候选短语提取算法,通过修改PAT-Tree数据结构使之适合处理变长中文字符串及非中文字符。根据交互信息评估字符串的关联程度,并结合新闻报道和网络热词的特点提出向前过滤算法发现网络热词。与其它同类算法相比,本算... 使用基于PAT-Tree的候选短语提取算法,通过修改PAT-Tree数据结构使之适合处理变长中文字符串及非中文字符。根据交互信息评估字符串的关联程度,并结合新闻报道和网络热词的特点提出向前过滤算法发现网络热词。与其它同类算法相比,本算法不需要制定复杂的语言规则和候选短语的评分公式,实现更加简单、速度更快。实验证明了本文算法的有效性和正确性。 展开更多
关键词 网络热词 pat-tree 互信息 中文字符串 候选短语
下载PDF
基于序列数据挖掘的中文网页特征选择方法 被引量:2
18
作者 谷峰 刘晨曦 吴扬扬 《山东大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期97-100,共4页
提出了一种基于序列数据挖掘的中文网页候选特征的选择方法,并用于中文网页分类模型.该方法运用改进的PAT树结构挖掘频繁出现在同一类中文网页中的字符串,通过净频率计算,挖掘出中文网页中频繁出现的有意义的词、短语、英文单词等,并结... 提出了一种基于序列数据挖掘的中文网页候选特征的选择方法,并用于中文网页分类模型.该方法运用改进的PAT树结构挖掘频繁出现在同一类中文网页中的字符串,通过净频率计算,挖掘出中文网页中频繁出现的有意义的词、短语、英文单词等,并结合CHI算法得到文本特征.实验表明,该算法不仅能挖掘出传统方法所选择出的绝大部分特征,还能挖掘出一些有意义的、切词系统词库中没有的、能反映分类特点的人名,地名,新词、常用语、外文单词等. 展开更多
关键词 序列数据挖掘 pat 净频率 频繁字串 中文网页分类
下载PDF
具有概念联想功能的特定领域分词词典的自动构建 被引量:3
19
作者 张彦 邵志清 《计算机工程》 CAS CSCD 北大核心 2004年第20期148-150,共3页
提出了一种基于PAT树型结构的高频字串提取的改进算法,并以此用来获得特定领域网页中的未登录词集合,利用基于语义距离的概念相似度计算公式来获得任一概念的相关概念,从而给出了用于特定领域搜索引擎的语义词典完整的自动构建方法。将... 提出了一种基于PAT树型结构的高频字串提取的改进算法,并以此用来获得特定领域网页中的未登录词集合,利用基于语义距离的概念相似度计算公式来获得任一概念的相关概念,从而给出了用于特定领域搜索引擎的语义词典完整的自动构建方法。将生成的语义词典用于搜索引擎FlyingSender中。实验结果证明新的词典比原有的手工构建的词典分词效果要理想得多,而且提供了概念联想的功能。 展开更多
关键词 语义词典 未登录词 pat 语义距离
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部