期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于TF-IDF优化算法在文本分类中的应用研究 被引量:2
1
作者 王庆福 常广炎 《电脑编程技巧与维护》 2014年第10期11-12,共2页
TF-IDF算法是文本挖掘领域的经典算法,TF-IDF算法在文本分类时会使关键词权值发生波动,对该算法在分类时权值做全局化定义,可提高文本分类准确率。
关键词 tf—IDF算法 文本分类 全局化定义
下载PDF
基于NER和TF/IDF算法的涉密文件的脱密鉴别方法研究 被引量:1
2
作者 王雷 李云亚 《无线互联科技》 2021年第21期110-113,共4页
随着网络以及各类应用的发展,涉密材料往往在网络渠道传播、流传过程中被泄露,而且往往是涉密材料已经传播一定的范围之后,才能引起相关部门的注意而采用相应的措施。在公开网络产生泄密事件处理过程中,最重要的因素是在泄密材料出现于... 随着网络以及各类应用的发展,涉密材料往往在网络渠道传播、流传过程中被泄露,而且往往是涉密材料已经传播一定的范围之后,才能引起相关部门的注意而采用相应的措施。在公开网络产生泄密事件处理过程中,最重要的因素是在泄密材料出现于公开网络并广泛传播之前,发现并确定传播材料是否涉密、可能的来源以及相应的密级。文章提出一种基于NER和TF/IDF算法的涉密文件的脱密鉴别方法,利用NER和TF/IDF算法识别涉密文件中的命名实体,构成矩阵,经过HASH脱密,发送统一中心平台存储。鉴别时,取出文件中各命名实体对应的TF/IDF值乘以出现的次数并求和,其值跟预先设定的阈值比较,以此来确定是否为涉密文件,从而进一步判断涉密文件的来源。 展开更多
关键词 涉密文件 脱密鉴别 NER tf/IDF算法
下载PDF
两种Fisher精确检验算法的模拟比较 被引量:2
3
作者 王斌会 《中国卫生统计》 CSCD 北大核心 2005年第2期114-115,共2页
关键词 FISHER 精确检验算法 模拟比较 SF算法 tf算法 检验
下载PDF
本体环境下用户偏好库的查询算法扩展 被引量:2
4
作者 李宝敏 韩岳松 《西安工业大学学报》 CAS 2007年第5期480-484,共5页
查全率,查准率的高低在很大程度上决定了一个智能搜索引擎的性能,而用户偏好库中的算法如果运用得当可明显提高查全率和查准率.在探讨了在基于本体的智能搜索中用户偏好库的作用和其类型,特别是客观世界中某一特定领域或主题的用户偏好... 查全率,查准率的高低在很大程度上决定了一个智能搜索引擎的性能,而用户偏好库中的算法如果运用得当可明显提高查全率和查准率.在探讨了在基于本体的智能搜索中用户偏好库的作用和其类型,特别是客观世界中某一特定领域或主题的用户偏好库之后,详细地研究了用户偏好库中用户兴趣剖像生成的提取算法,TF*IDF算法和TF*IWF*IWF算法和基于本体的查询扩展算法,并且讨论了各个算法之间的联系.论述了用户偏好库在基于本体的搜索系统中的独特意义.通过实验最终验证了这些算法可达到查全率为10.1%、查准率为81%的良好效果,进而证实基于本体在智能搜索中所体现的优势. 展开更多
关键词 本体 用户偏好库 兴趣剖像生成算法 tf*IDF算法 tf*IWF*IWF算法 扩展查询算法
下载PDF
一种基于真假值的智能家居控制算法研究 被引量:1
5
作者 史斌斌 王宜怀 《电子技术应用》 北大核心 2016年第5期60-63,67,共5页
为了满足智能家居对智能控制的要求,提出了一种针对智能家居的控制算法,该算法基于真假值位图实现,故称为"真假值控制算法(简称TF算法)"。首先建立针对家用电器的表达模型,然后提出简单算法,最后在简单算法的基础上进行改进... 为了满足智能家居对智能控制的要求,提出了一种针对智能家居的控制算法,该算法基于真假值位图实现,故称为"真假值控制算法(简称TF算法)"。首先建立针对家用电器的表达模型,然后提出简单算法,最后在简单算法的基础上进行改进确定了最终TF算法。该算法具有不需要训练样本、应对变化反应速度快、计算量小和容易被编码实现等特点。实验表明,该算法具有很强的适应性和健壮性,可以很好地应用于实践项目。 展开更多
关键词 物联网 智能家居 智能控制 tf控制算法 节能省电
下载PDF
对基于本体的搜索中用户偏好库的算法研究
6
作者 韩岳松 李宝敏 《计算机技术与发展》 2007年第12期64-67,共4页
介绍了本体的基本概念及其基本的元素。探讨了在基于本体的智能搜索中用户偏好库的作用和其类型,特别是客观世界中某一特定领域或主题的搜索中用户偏好库的研究。研究了用户偏好库中用户兴趣剖像生成的提取算法,即TF*IDF算法和TF*IWF*IW... 介绍了本体的基本概念及其基本的元素。探讨了在基于本体的智能搜索中用户偏好库的作用和其类型,特别是客观世界中某一特定领域或主题的搜索中用户偏好库的研究。研究了用户偏好库中用户兴趣剖像生成的提取算法,即TF*IDF算法和TF*IWF*IWF算法和基于本体的查询扩展算法。并且讨论了各个算法之间的联系,论述了用户偏好库在基于本体的搜索系统中的独特作用。 展开更多
关键词 本体 用户偏好库 兴趣剖像生成算法 tf*IDF算法 tf*IWF*IWF算法 扩展查询算法
下载PDF
基于频繁项集挖掘的正例文本提取方法
7
作者 朱祥玉 《信息技术与信息化》 2008年第3期41-43,共3页
提取合适的正例文本是生成有效过滤模板的重要基础。通常采用的人工评测方法的显著缺点是无法准确判断文本内容并选择切实相关的文本,所以本文在频繁项集挖掘的基础上提出了一种判断给定文本是否相关并提取合适正例文本的方法。实验结... 提取合适的正例文本是生成有效过滤模板的重要基础。通常采用的人工评测方法的显著缺点是无法准确判断文本内容并选择切实相关的文本,所以本文在频繁项集挖掘的基础上提出了一种判断给定文本是否相关并提取合适正例文本的方法。实验结果证实了该方法的有效性。 展开更多
关键词 过滤模板 正例文本 频繁项集 tf—RIApriori算法
下载PDF
基于语义匹配的海量异构数据自动化集成方法研究 被引量:6
8
作者 李贺 李晓琳 《软件导刊》 2018年第4期194-196,共3页
随着互联网与信息化的普及,数据数量、数据来源与数据格式的复杂性愈加突出。互联网、传感器、人工收集等多种来源产生了海量异构数据,为解决多源异构数据处理问题,设计一种将海量异构数据自动化集成到同一数据仓库的方法。通过建立元... 随着互联网与信息化的普及,数据数量、数据来源与数据格式的复杂性愈加突出。互联网、传感器、人工收集等多种来源产生了海量异构数据,为解决多源异构数据处理问题,设计一种将海量异构数据自动化集成到同一数据仓库的方法。通过建立元数据模型(以数据集为单位)将来源数据按数据集分类,映射整合到数据仓库中,通过CRF序列标注模型、Skip-Gram神经网络、TF*IDF等机器学习技术,解决了数据仓库集成中语义映射的难题,实现了海量多源异构数据的自动化入库,为之后的数据分析挖掘提供了良好基础。 展开更多
关键词 海量异构数据处理 元数据 CRF序列标注 Skip-Gram神经网络 tf*IDF算法
下载PDF
基于SVM金融分析报告的行业分类研究
9
作者 张严月 《现代计算机》 2012年第15期13-17,共5页
针对传统金融分析报告分类效率低的问题,提出基于支持向量机的中文文本分类技术来对金融分析报告进行分类。该分类技术采用中科院提供的中文分词系统以及使用两种特征选择算法相结合进行分词和特征选择,并且提出针对TF/IDF权重计算的改... 针对传统金融分析报告分类效率低的问题,提出基于支持向量机的中文文本分类技术来对金融分析报告进行分类。该分类技术采用中科院提供的中文分词系统以及使用两种特征选择算法相结合进行分词和特征选择,并且提出针对TF/IDF权重计算的改进方法。该分类技术选择支持向量机作为分类算法,通过开源的支持向量机对样本进行训练和测试。实验结果表明,采用中文文本分类技术对金融分析报告按照行业进行分类能够满足金融机构的使用需求。 展开更多
关键词 金融分析报告 文本分类 组合特征选择算法 改进的tf/IDF算法 支持向量机
下载PDF
基于TSS模型对商品综合评价研究
10
作者 王佳帅 金宇悦 +1 位作者 刘亚飞 吴宇航 《新一代信息技术》 2019年第24期71-76,93,共7页
研究评级和评论制度对消费者购买商品决策的影响,能有效帮助公司制定合理的营销策略。本文采用关键词信息匹配技术,基于时间序列的综合评价模型,开发TSS模型用于分析在线产品销售策略以提高产品满意度。模型以月为时间单位,拟合平均评... 研究评级和评论制度对消费者购买商品决策的影响,能有效帮助公司制定合理的营销策略。本文采用关键词信息匹配技术,基于时间序列的综合评价模型,开发TSS模型用于分析在线产品销售策略以提高产品满意度。模型以月为时间单位,拟合平均评价值和时间的关系,发现初始阶段顾客对商品评价会存在较大差别,第70个月后评价开始趋向集中。特定高评级对评论产生正向中性程度影响,特定低评级产生正向较弱程度影响;而特定好评会对评价产生正向较强程度影响,特定差评会产生负向较弱程度影响。随着时间的推移,TSS模型鲁棒性强,为其他商品在线评级销售同样提供了清晰可行的解决方案,适用于各种产品的评价评级研究。 展开更多
关键词 tf—IDF算法 在线客户评论 时间序列分析 相关性分析
下载PDF
基于知识图谱及机器学习的桥梁病害智能诊断方法
11
作者 郭桥 梁柱 +1 位作者 沈国栋 金耀 《公路》 北大核心 2023年第10期329-334,共6页
在桥梁的运维管养工作中,对病害成因的分析和判断通常需要丰富的知识储备和从业经验。以预应力混凝土连续梁桥为例,利用构建的知识图谱作为知识牵引,基于积累的管养数据,采用多种机器学习算法进行数据驱动,研究实现桥梁病害智能诊断的... 在桥梁的运维管养工作中,对病害成因的分析和判断通常需要丰富的知识储备和从业经验。以预应力混凝土连续梁桥为例,利用构建的知识图谱作为知识牵引,基于积累的管养数据,采用多种机器学习算法进行数据驱动,研究实现桥梁病害智能诊断的方法。结果表明,基于TF-IDF算法的诊断模型准确率较高,能够为工程技术人员提供有效的桥梁病害成因诊断决策支持。 展开更多
关键词 桥梁病害 智能诊断 知识图谱 tf—IDF算法
原文传递
政务领域本体术语的自动抽取 被引量:10
12
作者 翟笃风 刘柏嵩 《现代图书情报技术》 CSSCI 北大核心 2010年第4期59-65,共7页
提出一种新的政务本体术语自动抽取的方法。首先通过中文分词技术和单字合并法提取政务文本中的词作为候选术语;通过C-value求解法和TF-IDF算法对候选术语进行过滤抽取,从而实现政务领域术语的自动抽取。通过实验比较,发现该方法在不影... 提出一种新的政务本体术语自动抽取的方法。首先通过中文分词技术和单字合并法提取政务文本中的词作为候选术语;通过C-value求解法和TF-IDF算法对候选术语进行过滤抽取,从而实现政务领域术语的自动抽取。通过实验比较,发现该方法在不影响领域术语抽取召回率的同时可以提高抽取术语的正确率。 展开更多
关键词 政务领域本体 术语 单字合并法 C—value tf—IDF算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部