期刊文献+
共找到1,679篇文章
< 1 2 84 >
每页显示 20 50 100
Mathematical Models for Some Ecophysiological Characteristics in Different Weather Condition in Moss (Plagiomnium acutum)
1
作者 LI Jing LIU Ying-di +1 位作者 LI Hu-ming CHEN Gong-xi (Institute of Ecology, Jishou University, Jishou 416000, China) 《Wuhan University Journal of Natural Sciences》 CAS 2000年第1期123-126,共4页
Based on the data from experiment, several mathematical models for describing the ecophysiological characteristics ofPlagiomnium acutum and the relationship between photosynthetic active radiation (R)P, temperature of... Based on the data from experiment, several mathematical models for describing the ecophysiological characteristics ofPlagiomnium acutum and the relationship between photosynthetic active radiation (R)P, temperature of atmospheric (T a), relative humidity (H r), concentration of carbon dioxide were established with the method of regression. The biological meanings of the models were analyzed primarily, which showed significance in both theory and application. 展开更多
关键词 Key words Plagiomnium acutum Ecophysiological characteristic Regression model
下载PDF
基于图像Bag-of-Words模型的无载体信息隐藏 被引量:47
2
作者 周志立 曹燚 孙星明 《应用科学学报》 CAS CSCD 北大核心 2016年第5期527-536,共10页
介绍一种基于bag-of-words(BOW)模型的无载体信息隐藏方法.该方法使用BOW模型提取图像的视觉关键词(visual words,VW)以表达待隐藏的文本信息,从而实现文本信息在图像中的隐藏.首先使用BOW模型提取图像集中每幅图像的VW,构建文本信息的... 介绍一种基于bag-of-words(BOW)模型的无载体信息隐藏方法.该方法使用BOW模型提取图像的视觉关键词(visual words,VW)以表达待隐藏的文本信息,从而实现文本信息在图像中的隐藏.首先使用BOW模型提取图像集中每幅图像的VW,构建文本信息的关键词和VW的映射关系库;然后把每幅图像分为若干子图像,统计每一幅子图像的VW频数直方图,选择频数最高的VW表示该子图像;最后根据构建的文本关键词和子图像VW的映射关系库,搜索出与待隐藏文本信息存在映射关系的子图像序列,将含有这些子图像的图像作为含密图像进行传递.实验结果和分析表明,该隐藏算法在抗隐写分析、鲁棒性和安全性方面均有良好的表现. 展开更多
关键词 无载体信息隐藏 BAG of words模型 视觉词汇 图像搜索
下载PDF
n-words模型下Hesse稀疏表示的图像检索算法 被引量:2
3
作者 王瑞霞 彭国华 《电子与信息学报》 EI CSCD 北大核心 2016年第5期1115-1122,共8页
论文针对视觉词袋(BOVW)模型放弃图像空间结构的缺点,提出一种基于Hesse稀疏编码的图像检索算法。首先,建立n-words模型,获得图像局部特征表示。n-words模型由一系列连续视觉词获得,是图像特征的一种高级描述。该文从n=1到n=5进行试验,... 论文针对视觉词袋(BOVW)模型放弃图像空间结构的缺点,提出一种基于Hesse稀疏编码的图像检索算法。首先,建立n-words模型,获得图像局部特征表示。n-words模型由一系列连续视觉词获得,是图像特征的一种高级描述。该文从n=1到n=5进行试验,寻找最恰当的n值;其次,将二阶Hesse能量函数融入标准稀疏编码的目标函数,得到Hesse稀疏编码公式;最后,以获得的n-words序列作为编码特征,利用特征符号搜索算法求解最优Hesse系数,计算相似度,返回检索结果。实验在两类数据集上进行,与BOVW模型和已有的算法相比,新算法极大地提高了图像检索的准确率。 展开更多
关键词 图像检索 稀疏编码 视觉词袋模型 n-words模型 Hesse能量函数
下载PDF
基于Bag of Words的干果图像分类研究 被引量:1
4
作者 施明登 周鹏 白铁成 《安徽农业科学》 CAS 2014年第29期10381-10383,共3页
针对干果图像信息量大、分类精度低和耗时多的特点,提出利用Bag of Words模型提取图片的代表特征,并采用朴素贝叶斯分类器指导特征矩阵分类。结果表明,图像分类精度能达到80%,分类处理时间约为2 s。通过增加学习样本来进一步提高分类精... 针对干果图像信息量大、分类精度低和耗时多的特点,提出利用Bag of Words模型提取图片的代表特征,并采用朴素贝叶斯分类器指导特征矩阵分类。结果表明,图像分类精度能达到80%,分类处理时间约为2 s。通过增加学习样本来进一步提高分类精度,将Bag of Words应用于干果图像识别和分类是可行的。 展开更多
关键词 图像分类 词袋模型 朴素贝叶斯分类器
下载PDF
Chinese New-coined Words Management in P.R.C
5
作者 赵鹏 柳轶群 《海外英语》 2014年第7X期257-258,260,共3页
The paper relies on the language management model. First of all, the thousands of new words coined each year in China can be roughly divided into eight groups. Besides, it exemplifies the problems that have occurred i... The paper relies on the language management model. First of all, the thousands of new words coined each year in China can be roughly divided into eight groups. Besides, it exemplifies the problems that have occurred in communication. Last but not least, to reflect language management acts/processes, it reports the efforts the language authorities and governmental bodies have made in the struggle to solve the problems. It attempts to remind the language management agencies of the point that for the use of new words, the language users are always right as long as communication flows without problems in understanding. 展开更多
关键词 LANGUAGE MANAGEMENT MODEL new-coined words purify
下载PDF
Comparison of blood rheological models in patient specific cardiovascular system simulations
6
作者 Anastasios Skiadopoulos Panagiotis Neofytou Christos Housiadas 《Journal of Hydrodynamics》 SCIE EI CSCD 2017年第2期293-304,共12页
Newtonian, Quemada and Casson blood viscosity models are implemented in order to simulate the rheological behavior of blood under pulsating flow conditions in a patient specific iliac bifurcation. The influence of the... Newtonian, Quemada and Casson blood viscosity models are implemented in order to simulate the rheological behavior of blood under pulsating flow conditions in a patient specific iliac bifurcation. The influence of the applied blood constitutive equations is monitored via the wall shear stress (WSS) distribution, magnitude and oscillations, non-Newtonian importance factors, and viscosity values according to the shear rate. The distribution of WSS on the vascular wall follows a pattern which is independent of the theological model chosen. On the other hand, the WSS magnitude and oscillations are directly related to the blood constitutive equations applied and the shear rate. It is concluded that the Newtonian approximation is satisfactory only in high shear and flow rates. Moreover, the Newtonian model seems to overestimate the possibility for the formation of atherosclerotic lesions or aneurysms at sites of the vascular wall where the WSS are oscillating. 展开更多
关键词 Key words Blood flow simulation patient specific geometries geometry reconstruction non-Newtonian models wall shear stress pulsating flow
原文传递
Pretrained Models and Evaluation Data for the Khmer Language
7
作者 Shengyi Jiang Sihui Fu +1 位作者 Nankai Lin Yingwen Fu 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2022年第4期709-718,共10页
Trained on a large corpus,pretrained models(PTMs)can capture different levels of concepts in context and hence generate universal language representations,which greatly benefit downstream natural language processing(N... Trained on a large corpus,pretrained models(PTMs)can capture different levels of concepts in context and hence generate universal language representations,which greatly benefit downstream natural language processing(NLP)tasks.In recent years,PTMs have been widely used in most NLP applications,especially for high-resource languages,such as English and Chinese.However,scarce resources have discouraged the progress of PTMs for low-resource languages.Transformer-based PTMs for the Khmer language are presented in this work for the first time.We evaluate our models on two downstream tasks:Part-of-speech tagging and news categorization.The dataset for the latter task is self-constructed.Experiments demonstrate the effectiveness of the Khmer models.In addition,we find that the current Khmer word segmentation technology does not aid performance improvement.We aim to release our models and datasets to the community in hopes of facilitating the future development of Khmer NLP applications. 展开更多
关键词 pretrained models Khmer language word segmentation part-of-speech(POS)tagging news categorization
原文传递
基于语义理解增强的数学应用题机器解答方法
8
作者 菅朋朋 闫鸣 王彦丽 《计算机应用研究》 北大核心 2025年第1期214-221,共8页
针对现有数学应用题机器解答方法不能自适应理解语义多变的问题文本、求解精度提升受限,提出基于语义理解增强的机器解答方法。首先,设计语义增强的预训练语言模型SeBERT,通过多粒度知识建模策略和连续语义融入策略以实现对题目的精确理... 针对现有数学应用题机器解答方法不能自适应理解语义多变的问题文本、求解精度提升受限,提出基于语义理解增强的机器解答方法。首先,设计语义增强的预训练语言模型SeBERT,通过多粒度知识建模策略和连续语义融入策略以实现对题目的精确理解;其次,构建求解模型SeBERT-PT,其采用语言模型-池化-树的求解结构,有效改善了应用题的语义理解偏差并且提高了解题的精确度;最后,引入基于置信度的判断机制,对于不值得信任的预测直接判定求解失败,确保解答精度的同时,提升求解模型训练效率。实验结果表明,该方法在中文和英文数据集上的解题精度分别达到了85.7%和77.9%,均优于其他基线方法,特别是在涉及复杂语义理解和逻辑推理的题目上,表现尤为突出。证明了该方法在提升数学应用题解答精度方面的有效性,也展示了其在跨语言环境下的广泛适用性。 展开更多
关键词 数学应用题求解 预训练语言模型 语义增强 池化 置信度
下载PDF
A Study on Translation of Chinese Culture-loaded Words from the Per-spective of Relevance Theory
9
作者 高芳卉 《海外英语》 2018年第11期151-153,共3页
The essay tends to analyze the translation of Chinese Culture-loaded words from the perspective of Relevance Theory.The theory gains its prominence by studying the translation process and transcending the conflicts be... The essay tends to analyze the translation of Chinese Culture-loaded words from the perspective of Relevance Theory.The theory gains its prominence by studying the translation process and transcending the conflicts between literal and free translation. It incorporates recent work in cognitive linguistics, with ostensive-inference as its key model. Under the influence of Relevance theory, the translation of culture-loaded words is reader-oriented. Translators are obliged to help target readers to establish new assumptions to achieve equivalent response. 展开更多
关键词 Relevance Theory ostensive-inferential model culture-loaded words contextual effects
下载PDF
高校毕业论文格式设置软件的设计与实现
10
作者 董建文 《智能计算机与应用》 2025年第2期70-76,共7页
本研究利用Python语言开发了一款高校毕业论文格式自动设置软件,旨在提升论文格式设置的效率,减轻学生在遵循格式规范时的工作负担。经测试检验,软件运行稳定、格式设置准确率高。通过调整函数参数,软件可适应不同高校的毕业论文格式要... 本研究利用Python语言开发了一款高校毕业论文格式自动设置软件,旨在提升论文格式设置的效率,减轻学生在遵循格式规范时的工作负担。经测试检验,软件运行稳定、格式设置准确率高。通过调整函数参数,软件可适应不同高校的毕业论文格式要求,从而具备广泛的适用性和推广潜力。运用本软件与手工调整方法相比,显著缩短了论文格式设置的时间,使师生能将更多的时间和精力投入到论文内容的研究和表述上,从而有效提高高校毕业论文整体质量。因此,本软件具有一定的实践意义和应用价值。 展开更多
关键词 格式设置 WORD对象模型 PYTHON语言
下载PDF
Pre-trained models for natural language processing: A survey 被引量:161
11
作者 QIU XiPeng SUN TianXiang +3 位作者 XU YiGe SHAO YunFan DAI Ning HUANG XuanJing 《Science China(Technological Sciences)》 SCIE EI CAS CSCD 2020年第10期1872-1897,共26页
Recently, the emergence of pre-trained models(PTMs) has brought natural language processing(NLP) to a new era. In this survey, we provide a comprehensive review of PTMs for NLP. We first briefly introduce language rep... Recently, the emergence of pre-trained models(PTMs) has brought natural language processing(NLP) to a new era. In this survey, we provide a comprehensive review of PTMs for NLP. We first briefly introduce language representation learning and its research progress. Then we systematically categorize existing PTMs based on a taxonomy from four different perspectives. Next,we describe how to adapt the knowledge of PTMs to downstream tasks. Finally, we outline some potential directions of PTMs for future research. This survey is purposed to be a hands-on guide for understanding, using, and developing PTMs for various NLP tasks. 展开更多
关键词 deep learning neural network natural language processing pre-trained model distributed representation word embedding self-supervised learning language modelling
原文传递
Constraint-Based Fuzzy Models for an Environment with Heterogeneous Information-Granules 被引量:2
12
作者 赖国华 江义渊 《Journal of Computer Science & Technology》 SCIE EI CSCD 2006年第3期401-411,共11页
A novel framework for fuzzy modeling and model-based control design is described. Based on the theory of fuzzy constraint processing, the fuzzy model can be viewed as a generalized Takagi-Sugeno (TS) fuzzy model wit... A novel framework for fuzzy modeling and model-based control design is described. Based on the theory of fuzzy constraint processing, the fuzzy model can be viewed as a generalized Takagi-Sugeno (TS) fuzzy model with fuzzy functional consequences. It uses multivariate antecedent membership functions obtained by granular-prototype fuzzy clustering methods and consequent fuzzy equations obtained by fuzzy regression techniques. Constrained optimization is used to estimate the consequent parameters, where the constraints are based on control-relevant a priori knowledge about the modeled process. The fuzzy-constraint-based approach provides the following features. 1) The knowledge base of a constraint-based fuzzy model can incorporate information with various types of fuzzy predicates. Consequently, it is easy to provide a fusion of different types of knowledge. The knowledge can be from data-driven approaches and/or from controlrelevant physical models. 2) A corresponding inference mechanism for the proposed model can deal with heterogeneous information granules. 3) Both numerical and linguistic inputs can be accepted for predicting new outputs. The proposed techniques are demonstrated by means of two examples: a nonlinear function-fitting problem and the well-known Box-Jenkins gas furnace process. The first example shows that the proposed model uses fewer fuzzy predicates achieving similar results with the traditional rule-based approach, while the second shows the performance can be significantly improved when the control-relevant constraints are considered. 展开更多
关键词 computing with words constraint-based problem solving fuzzy modeling granular computing information granulation
原文传递
自然语言处理领域中的词嵌入方法综述 被引量:9
13
作者 曾骏 王子威 +2 位作者 于扬 文俊浩 高旻 《计算机科学与探索》 CSCD 北大核心 2024年第1期24-43,共20页
词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的... 词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的综述文献大多只关注于不同词嵌入方法本身的技术路线,而未能将词嵌入的前置分词方法以及词嵌入方法完整的演变趋势进行分析与概述。以word2vec模型和Transformer模型作为划分点,从生成的词向量是否能够动态地改变其内隐的语义信息来适配输入句子的整体语义这一角度,将词嵌入方法划分为静态词嵌入方法和动态词嵌入方法,并对此展开讨论。同时,针对词嵌入中的分词方法,包括整词切分和子词切分,进行了对比和分析;针对训练词向量所使用的语言模型,从概率语言模型到神经概率语言模型再到如今的深度上下文语言模型的演化,进行了详细列举和阐述;针对预训练语言模型时使用的训练策略进行了总结和探讨。最后,总结词向量质量的评估方法,分析词嵌入方法的当前现状并对其未来发展方向进行展望。 展开更多
关键词 词向量 词嵌入方法 自然语言处理 语言模型 分词 词向量评估
下载PDF
基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究 被引量:2
14
作者 余礼根 郭晓利 +3 位作者 赵红涛 杨淦 张俊 李奇峰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期287-294,共8页
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectiona... 针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。 展开更多
关键词 畜禽疫病 文本分词 预训练语言模型 双向长短时记忆网络 条件随机场
下载PDF
文本相似度计算方法综述 被引量:1
15
作者 魏嵬 丁香香 +2 位作者 郭梦星 杨钊 刘辉 《计算机工程》 CAS CSCD 北大核心 2024年第9期18-32,共15页
文本相似度计算是自然语言处理的一部分,用来计算两个词、句子及文本之间的相似程度,具有多种应用场景,文本相似度计算的研究对于人工智能的发展有着重要作用。文本相似度计算起初基于字符串表面,随着词向量的提出,文本相似度计算可进... 文本相似度计算是自然语言处理的一部分,用来计算两个词、句子及文本之间的相似程度,具有多种应用场景,文本相似度计算的研究对于人工智能的发展有着重要作用。文本相似度计算起初基于字符串表面,随着词向量的提出,文本相似度计算可进行基于统计以及深度学习的建模与计算,也可与预训练模型相结合。首先,将文本相似度计算方法分为基于字符串、基于词向量、基于预训练模型、基于深度学习、其他方法5类,并对这些方法进行简要介绍。然后,根据不同文本相似度计算方法的原理,具体介绍了编辑距离、汉明距离、词袋模型、向量空间模型(VSM)、深度结构语义模型(DSSM)、句子嵌入的简单对比学习(SimCSE)等常见方法。最后,对文本相似度计算常用的数据集以及评价标准进行整理和分析,并对文本相似度计算的未来发展进行展望。 展开更多
关键词 文本相似度 字符串 词向量 预训练模型 深度学习
下载PDF
基于IBTM-TMW 的信号设备故障文本聚类方法
16
作者 杨妮 张友鹏 +1 位作者 左静 赵斌 《中国铁道科学》 EI CAS CSCD 北大核心 2024年第6期194-201,共8页
针对信号设备故障文本数据存在的长度短、专业性强及难以智能化再利用等问题,提出基于改进的词对主题模型和词向量融合(IBTM-TMW)的信号设备故障文本聚类方法。首先,为减少数据噪音,提升数据质量,在数据预处理过程中引入自建词典和保留... 针对信号设备故障文本数据存在的长度短、专业性强及难以智能化再利用等问题,提出基于改进的词对主题模型和词向量融合(IBTM-TMW)的信号设备故障文本聚类方法。首先,为减少数据噪音,提升数据质量,在数据预处理过程中引入自建词典和保留动名词处理;其次,在词对的吉布斯采样建模过程中引入词的差异性重要度作为加权因素,利用改进的词对主题模型(IBTM)提升文本主题特征的学习能力,并将词频-改进逆文档频率权重(TF-MIDF)嵌入到Word2vec词向量的生成过程,将词的文本重要性与Word2vec词向量融合,完善文本词特征向量的表示;最后,通过融合文本主题特征向量和词特征向量,增强文本特征的表示能力,并采用K-means++算法进行故障聚类分析。结果表明:同一试验数据集下,所提方法生成的文本特征向量明显优于其他传统模型,其诊断精度达到89.9%,高于K-means,GMM,AGNES和BIRCH等聚类模型(诊断精度分别为78.3%,68.1%,87.9%和81.7%)。该方法可增强故障文本特征与类别间关联关系的识别能力,为基于文本数据驱动的故障诊断提供参考。 展开更多
关键词 故障诊断 主题模型 词向量 权重 文本聚类
下载PDF
主题方面共享的领域主题层次模型
17
作者 万常选 张奕韬 +3 位作者 刘德喜 刘喜平 廖国琼 万齐智 《软件学报》 EI CSCD 北大核心 2024年第4期1790-1818,共29页
层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且... 层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且不同父主题下的子主题之间还存在子领域方面共享的关联关系,在现有主题关系研究中没有合适的模型来生成这种领域主题层次.为了从领域文本中自动、有效地挖掘出领域主题的层次关系和关联关系,在4个方面进行创新研究.首先,通过主题共享机制改进nCRP构造方法,提出nCRP+层次构造方法,为主题模型中的主题提供具有分层主题方面共享的树形先验分布;其次,结合nCRP+和HDP模型构建重分层的Dirichlet过程,提出rHDP(reallocated hierarchical Dirichlet processes)层次主题模型;第三,结合领域分类信息、词语语义和主题词的领域代表性,定义领域知识,包括基于投票机制的领域隶属度、词语与领域主题的语义相关度和层次化的主题-词语贡献度;最后,通过领域知识改进rHDP主题模型中领域主题和主题词的分配过程,提出结合领域知识的层次主题模型rHDP_DK(rHDP with domain knowledge),并改进采样过程.实验结果表明,基于nCRP+的层次主题模型在评价指标方面均优于基于nCRP的层次主题模型(hLDA,nHDP)和神经主题模型(TSNTM);通过rHDP_DK模型生成的主题层次结构具有领域主题层次清晰、关联子主题的主题词领域差异明确的特点.此外,该模型将为领域主题层次提供一个通用的自动挖掘框架. 展开更多
关键词 层次主题模型 领域分类信息 词语语义 主题关联关系 层次化的采样过程 领域主题层次
下载PDF
基于A-BiLSTM和CNN的文本分类
18
作者 黄远 戴晓红 +2 位作者 黄伟建 于钧豪 黄峥 《计算机工程与设计》 北大核心 2024年第5期1428-1434,共7页
为解决单一神经网络不能获取准确全局文本信息的问题,提出一种基于A-BiLSTM双通道和优化CNN的文本分类模型。A-BiLSTM双通道层使用注意力机制关注对文本分类贡献值较大的部分,并用BiLSTM提取文本中上下文语义信息;A-BiLSTM双通道层中将... 为解决单一神经网络不能获取准确全局文本信息的问题,提出一种基于A-BiLSTM双通道和优化CNN的文本分类模型。A-BiLSTM双通道层使用注意力机制关注对文本分类贡献值较大的部分,并用BiLSTM提取文本中上下文语义信息;A-BiLSTM双通道层中将两者输出的特征信息融合,得到高级语义;A-BiLSTM双通道层后,使用优化CNN的强学习能力提取关键局部特征,得到最终文本特征表示。分类器输出文本信息的类别。实验结果表明,该模型分类效果优于其它对比模型,具有良好的泛化能力。 展开更多
关键词 文本分类 深度学习 双通道网络 注意力机制 双向长短时记忆网络 卷积神经网络 词向量模型
下载PDF
基于BERTopic主题模型融合RoBERTa算法的短文本分类方法研究
19
作者 刘桂锋 陈亦侯 +1 位作者 包翔 韩牧哲 《情报工程》 2024年第5期85-98,共14页
[目的/意义]针对短文本分类中的稀疏问题,提出一种基于BERTopic-RoBERTa-PCA-CatBoost模型进行主题概率特征扩展的短文本分类方法。[方法/过程]使用RoBERTa模型获取短文本的词向量表示,使用BERTopic主题模型提取主题概率特征向量,二者... [目的/意义]针对短文本分类中的稀疏问题,提出一种基于BERTopic-RoBERTa-PCA-CatBoost模型进行主题概率特征扩展的短文本分类方法。[方法/过程]使用RoBERTa模型获取短文本的词向量表示,使用BERTopic主题模型提取主题概率特征向量,二者融合进行特征扩展,最后通过CatBoost算法分类。[局限]在分类层面,未使用深度学习算法进行验证;在特征融合层面,未来可以考虑其他的特征融合方法。[结果/结论]提出的BERTopic-RoBERTa-PCACatBoost模型与LDA-CatBoost模型相比在准确率上提升10.90%,精确率上提升10.91%,召回率上提升10.68%。基于主题概率特征扩展的短文本分类方法能够克服单一模型的不足,提高短文本分类的效果。 展开更多
关键词 短文本分类 词向量 BERTopic模型 RoBERTa模型
下载PDF
基于复杂网络的在线口碑传播模型研究
20
作者 杜学美 荀伟 +1 位作者 谢志鸿 李美菱 《上海管理科学》 2024年第3期25-33,共9页
在线口碑已成为信息传播领域的核心力量,对其进行系统分析对于理解当代社交媒体环境中的消费者行为至关重要。论文引入了传播激活和接受激活的概念,基于病毒传播的SIR模型构建在线口碑传播模型,并运用复杂网络和系统仿真的方法模拟在线... 在线口碑已成为信息传播领域的核心力量,对其进行系统分析对于理解当代社交媒体环境中的消费者行为至关重要。论文引入了传播激活和接受激活的概念,基于病毒传播的SIR模型构建在线口碑传播模型,并运用复杂网络和系统仿真的方法模拟在线口碑传播过程,深入探讨了不同因素对在线口碑传播规模的影响,识别了在线口碑传播网络中各个节点的特征并分析了网络的结构特性。结果表明,不同因素对在线口碑传播规模的作用不同,且关键节点和免疫节点具有不同的属性特征。此外,研究还发现在线口碑传播网络具有小世界特性和无标度特性,该结论进一步丰富了在线口碑传播的理论框架,也为企业网络营销策略及产品质量追溯的优化等提供一定的应用参考。 展开更多
关键词 在线口碑 口碑传播模型 复杂网络 NETLOGO
下载PDF
上一页 1 2 84 下一页 到第
使用帮助 返回顶部