期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
Construction of Intelligent Recommendation Retrieval Model of FuJian Intangible Cultural Heritage Digital Archives Resources 被引量:2
1
作者 Xueqing Liao 《Intelligent Automation & Soft Computing》 SCIE 2023年第7期677-690,共14页
In order to improve the consistency between the recommended retrieval results and user needs,improve the recommendation efficiency,and reduce the average absolute deviation of resource retrieval,a design method of int... In order to improve the consistency between the recommended retrieval results and user needs,improve the recommendation efficiency,and reduce the average absolute deviation of resource retrieval,a design method of intelligent recommendation retrieval model for Fujian intangible cultural heritage digital archive resources based on knowledge atlas is proposed.The TG-LDA(Tag-granularity LDA)model is proposed on the basis of the standard LDA(Linear Discriminant Analysis)model.The model is used to mine archive resource topics.The Pearson correlation coefficient is used to measure the relevance between topics.Based on the measurement results,the FastText deep learning model is used to achieve archive resource classification.According to the classification results,TF-IDF(term frequency–inverse document frequency)algorithm is used to calculate the weight of resource retrieval keywords to achieve resource retrieval,and a recommendation model of intangible cultural heritage digital archives resources is built through the knowledge map to achieve comprehensive and personalized recommendation of resources.The experimental results show that the recommendation and retrieval results of the proposed method are more in line with users’needs,can provide users with personalized digital archive resources,and the average absolute deviation of resource retrieval is low,the recommendation efficiency is high,and the utilization effect of archive resources is effectively improved. 展开更多
关键词 Knowledge map intangible cultural heritage digital archives intelligent recommendation SEARCH TG-LDA model fasttext model
下载PDF
基于fastText算法的行业分类技术 被引量:5
2
作者 吴震 冉晓燕 +3 位作者 苗权 刘纯艳 张栋 魏娜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第2期193-198,共6页
随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础。根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型。首先,构建行业分类关键词库,通过特征词库进行... 随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础。根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型。首先,构建行业分类关键词库,通过特征词库进行分词和权重计算。然后,构建分类器模型,实现中文行业的自动分类。最后,实验选取了80000个包含企业经营范围、企业信息、舆论信息的测试文档,结果表明,所提模型结果高于Bayes、决策树、KNN等分类算法,取得了较好的应用效果。 展开更多
关键词 自然语言处理 行业分类 fasttext算法 关键词 语法模型
下载PDF
基于fastText模型的词向量表示改进算法 被引量:10
3
作者 阴爱英 吴运兵 +1 位作者 郑一江 余小燕 《福州大学学报(自然科学版)》 CAS 北大核心 2019年第3期314-319,共6页
传统词向量表示模型往往忽视了单词间的句法形态结构,导致模型预测准确率不高.为此,提出基于fastText模型的词向量表示改进算法.首先,在训练模型数据集上,引入stopwords处理技术,剔除一些无意义介词等对预测模型干扰,减少噪声数据;其次... 传统词向量表示模型往往忽视了单词间的句法形态结构,导致模型预测准确率不高.为此,提出基于fastText模型的词向量表示改进算法.首先,在训练模型数据集上,引入stopwords处理技术,剔除一些无意义介词等对预测模型干扰,减少噪声数据;其次,针对fastText模型中n-gram分解格式进行限定,将分解条件设置为符合英文单词的组成结构;最后,去除fastText模型中单词前后缀标记符,减少无用分解对模型预测产生干扰.实验结果表明,与fastText模型相比,所提出的改进模型在单词关系评分、语义相似性、句法相似性均取得较好的准确率. 展开更多
关键词 词向量 skip-gram模型 fasttext模型 自然语言处理
下载PDF
基于fastText的中文文本分类 被引量:19
4
作者 代令令 蒋侃 《计算机与现代化》 2018年第5期35-40,85,共7页
在保证文本分类准确率的情况下缩短分类时间一直是文本分类领域的一个研究目标。针对目前文本分类处理过程复杂且耗时过长的问题,将Facebook开源的句子分类和单词特征学习模型fastText引入到中文文本分类领域中,并验证其在中文分类中的... 在保证文本分类准确率的情况下缩短分类时间一直是文本分类领域的一个研究目标。针对目前文本分类处理过程复杂且耗时过长的问题,将Facebook开源的句子分类和单词特征学习模型fastText引入到中文文本分类领域中,并验证其在中文分类中的效果。相对于目前主流的文本分类方法,基于fastText模型的分类方法在保证分类效果的同时,大大缩短了分类时间。此外,在分类准确率和参数设置方面进行分析并得出相应的优化规则。 展开更多
关键词 文本分类 fasttext 线性分类器 快速文本分类模型
下载PDF
基于FastText模型的农业短文本分类研究 被引量:1
5
作者 王福健 魏霖静 +1 位作者 安昭先 刘志祖 《软件》 2022年第10期27-29,共3页
本文提出基于FastText分类语言模型来解决农业短文本分类问题。在数据处理好类别的情况下,利用实验对12万条农业数据集进行实验。并探究与典型深度语言模型(TextRNN、TextCNN、TextDPCNN、Transformer)进行对比分析其中的分类准确率和... 本文提出基于FastText分类语言模型来解决农业短文本分类问题。在数据处理好类别的情况下,利用实验对12万条农业数据集进行实验。并探究与典型深度语言模型(TextRNN、TextCNN、TextDPCNN、Transformer)进行对比分析其中的分类准确率和分类处理响应时间。实验结果得出结论,基于深度学习的FastText模型的农业短文本分类效果最好,FastText模型对比其他模型的准确率、精确率、召回率和F1值提高了1%~4%。FastText模型可以对中文农业短文本分类处理速度更好,更优于其他典型深度语言模型算法。 展开更多
关键词 农业短文本分类 文本分类 语言模型 fasttext
下载PDF
基于GRW和FastText模型的电信用户投诉文本分类应用 被引量:2
6
作者 赵进 杨小军 《电信科学》 2021年第6期125-131,共7页
随着神经网络的广泛应用,将神经网络应用到自然语言处理文本分类问题中,成为一种有效的解决方法。电信运营商客户服务中心通过多种渠道收集用户投诉信息,为了对投诉文本信息进行自动分类并将其落实到具体责任部门,提升用户感知,提出了... 随着神经网络的广泛应用,将神经网络应用到自然语言处理文本分类问题中,成为一种有效的解决方法。电信运营商客户服务中心通过多种渠道收集用户投诉信息,为了对投诉文本信息进行自动分类并将其落实到具体责任部门,提升用户感知,提出了一种基于GRW模型和FastText模型的文本分类方法。首先通过GRW模型对投诉文本进行特征选择,提取有效特征词;然后构建基于FastText模型的用户投诉文本分类方法;最后在公开数据集和运营商已标注的投诉文本数据集上进行实验。结果表明,基于GRW和FastText模型的文本分类方法比朴素贝叶斯、双向LSTM和Bert模型在准确率、Kappa系数及汉明损失方面的性能有较大提升。 展开更多
关键词 神经网络 文本分类 GRW模型 fasttext模型
下载PDF
基于NLP的煤矿事故原因分类研究 被引量:5
7
作者 张江石 李泳暾 +3 位作者 冒香凝 胡馨月 潘雨 王梓伊 《中国安全科学学报》 CAS CSCD 北大核心 2023年第6期20-26,共7页
为有效提升分析和处理煤矿事故文本的效率,融合自然语言处理(NLP)技术与事故致因模型,构建一个自动化的事故原因分类框架。首先以事故致因“2-4”模型(24Model)为事故分类依据,分析87份煤矿事故调查报告,得到煤矿事故原因分类框架,构建... 为有效提升分析和处理煤矿事故文本的效率,融合自然语言处理(NLP)技术与事故致因模型,构建一个自动化的事故原因分类框架。首先以事故致因“2-4”模型(24Model)为事故分类依据,分析87份煤矿事故调查报告,得到煤矿事故原因分类框架,构建每类事故原因的语料库;然后利用NLP技术分别处理语料库中各类原因文本,将其用于训练fastText模型,自动识别事故原因文本并分类;最后对比分析fastText模型与TextCNN等其他3种经典模型的分类效果。结果表明:共得到21类事故原因和6684条训练语料,训练后的fastText模型对煤矿事故原因分类的识别正确率能够达到98.92%,综合性能优于其他3种分类模型。基于24Model和NLP技术开发的事故文本挖掘系统,能够快速分析处理事故文本信息,进一步细化事故调查报告中的原因,便于进行事故案例学习和统计分析。 展开更多
关键词 自然语言处理(NLP) 事故原因分类 “2-4”模型(24model) fasttext 文本挖掘
下载PDF
基于TI-FastText的拼音维语识别方法
8
作者 刘宣 季铎 滕超越 《中国人民公安大学学报(自然科学版)》 2024年第1期66-73,共8页
维吾尔语是中国新疆维吾尔自治区最重要的语言之一,由于计算机处理和信息检索中存在一些困难,拼音维语应运而生。拼音维语为维吾尔语的数字化处理提供了便利,但是由于拼音维语没有完全统一的标准、偏向于口语化、网络社交媒体居多、数... 维吾尔语是中国新疆维吾尔自治区最重要的语言之一,由于计算机处理和信息检索中存在一些困难,拼音维语应运而生。拼音维语为维吾尔语的数字化处理提供了便利,但是由于拼音维语没有完全统一的标准、偏向于口语化、网络社交媒体居多、数据收集困难等特点,导致计算机对拼音维语的识别存在困难。基于此,首先引入TF-IDF和FastText模型融合的方法对拼音维语进行识别,与传统方法相比,该方法的创新之处在于TF-IDF可以对拼音维语独特的语言特点进行更深度的提取,并且融合FastText模型可以降低单一模型的局限性,利用其对词序和低频词汇的高敏感性,可以进行更精准的维语识别;同时为了降低模型的鲁棒性,引入数据伪造技术获取了大量的多语种数据集。实验结果显示,该项技术识别拼音维语的准确率可以达到95%以上。通过开发拼音维语识别技术,可以帮助在数字化时代更好地处理和管理维吾尔语的信息,可以推动自然语言处理和人工智能领域技术在维吾尔语识别方面的研究和应用。 展开更多
关键词 拼音维语 fasttext模型 识别 维语
下载PDF
基于多特征融合的医疗社区问题文本聚类研究 被引量:1
9
作者 申喜凤 李美婷 +4 位作者 张维宁 南嘉乐 孙媛媛 付玉伟 高东平 《中国数字医学》 2022年第12期28-34,共7页
目的:医学问题文本数据存在上下文语义缺失且特征稀疏高维等特点,为提高其聚类效果,提出将文本语义特征和主题特征相融合的文本表示方法用于文本聚类。方法:以医疗社区中的问题文本为数据源,将加权fastText词汇语义特征和LDA文档主题特... 目的:医学问题文本数据存在上下文语义缺失且特征稀疏高维等特点,为提高其聚类效果,提出将文本语义特征和主题特征相融合的文本表示方法用于文本聚类。方法:以医疗社区中的问题文本为数据源,将加权fastText词汇语义特征和LDA文档主题特征融合对问题文本进行表示,构建融合特征用于问题文本聚类,聚类效果评估采用聚类准确度(ACC)和标准互信息(NMI)。结果:与其他方法相比,特征融合的聚类模型表现最佳,其聚类准确度和标准互信息为0.577和0.429,高于其他相关基线模型。结论:实验表明,将特征进行融合能够更加全面准确有效地表征医学问题文本,为医学问题文本特征表示和聚类知识发现提供参考。 展开更多
关键词 LDA fasttext模型 特征融合 聚类 问题文本
下载PDF
基于textCNN模型的Android恶意程序检测 被引量:1
10
作者 张雄冠 邵培南 《计算机系统应用》 2021年第1期114-121,共8页
针对当前Android恶意程序检测方法对未知应用程序检测能力不足的问题,提出了一种基于textCNN神经网络模型的Android恶意程序检测方法.该方法使用多种触发机制从不同层面上诱导激发程序潜在的恶意行为;针对不同层面上的函数调用,采用特定... 针对当前Android恶意程序检测方法对未知应用程序检测能力不足的问题,提出了一种基于textCNN神经网络模型的Android恶意程序检测方法.该方法使用多种触发机制从不同层面上诱导激发程序潜在的恶意行为;针对不同层面上的函数调用,采用特定的hook技术对程序行为进行采集;针对采集到的行为日志,使用fastText算法来提取词向量;最后使用textCNN模型根据行为日志对Android程序进行检测与识别.实验结果表明,该方法对Android恶意程序检测的平均准确率达到了93.3%,验证了该方法对Android恶意程序检测具有较高的有效性与正确性. 展开更多
关键词 ANDROID系统 恶意程序检测 行为触发 HOOK技术 fasttext模型 textCNN模型
下载PDF
商品名称短文本快速有效分类的多基模型框架 被引量:1
11
作者 沈雅婷 左志新 《计算机应用与软件》 北大核心 2021年第2期185-190,共6页
提出一种适用于短文本分类的多基模型框架Bagging_fastText(B_f)。它是一种基于自举汇聚法的快速文本分类算法的框架。以fastText为基模型,运用集成学习思想,设置最优超参数并训练出多个基模型组成多基模型,再通过投票机制获取最终类别... 提出一种适用于短文本分类的多基模型框架Bagging_fastText(B_f)。它是一种基于自举汇聚法的快速文本分类算法的框架。以fastText为基模型,运用集成学习思想,设置最优超参数并训练出多个基模型组成多基模型,再通过投票机制获取最终类别。对商品名称短文本分类的实验结果表明,提出的B_f比fastText、朴素贝叶斯传统文本分类算法、文本卷积神经网络(TextCNN)算法的分类效果更优。 展开更多
关键词 多基模型框架 fasttext 文本分类NLP
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部