期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
CINO-TextGCN:融合CINO与TextGCN的藏文文本分类模型研究
1
作者 李果 杨进 陈晨 《高原科学研究》 CSCD 2024年第1期121-129,共9页
为提高藏文新闻文本分类准确性,文章提出一种融合少数民族语言预训练模型(Chinese Minority Pr-etrained Language Model,CINO)和图卷积神经网络模型(Text Graph Convolutional Networks,TextGCN)的方法,即CINO-TextGCN模型。为有效评... 为提高藏文新闻文本分类准确性,文章提出一种融合少数民族语言预训练模型(Chinese Minority Pr-etrained Language Model,CINO)和图卷积神经网络模型(Text Graph Convolutional Networks,TextGCN)的方法,即CINO-TextGCN模型。为有效评测该模型对藏文文本的分类性能,自建了较大规模和较高质量的藏文新闻文本公开数据集TNEWS(https://github.com/LG2016/CINO-TextGCN),通过实验发现,CINO-Text-GCN在公开数据集TNCC上的准确率为74.20%,在TNEWS上为83.96%。因此,该融合模型能够较好地捕捉到藏文文本语义,提升藏文文本分类性能。 展开更多
关键词 藏文 图卷积神经网络 融合模型 新闻文本 文本分类
下载PDF
JTG B01-2003与JTG B01-1997《公路工程技术标准》的车型换算方法研究 被引量:3
2
作者 王延娟 杨雪 《交通标准化》 2006年第10期31-34,共4页
通过对多组调查数据进行统计分析,建立回归模型,以及研究JTGB01-2003与JTGB01-1997《公路工程技术标准》之间的车型转换问题,可为交通规划和管理工作中的数据处理提供便利。
关键词 新标准 旧标准 车型划分 换算系数
下载PDF
基于增强语言表示模型的网络新闻长文本分类的研究
3
作者 许楠桸 柯圆圆 胡晓莉 《江汉大学学报(自然科学版)》 2024年第4期37-44,共8页
基于网络实时新闻内容数据,对一份具有时效的中文长文本数据集进行了新闻主题分类。利用年度关键词增强的分词方案提升分词精度,采用一种长文本压缩方法处理中文长文本的特殊数据,具体方法为选择关键句并利用TF-IDF算法提取长文本中关键... 基于网络实时新闻内容数据,对一份具有时效的中文长文本数据集进行了新闻主题分类。利用年度关键词增强的分词方案提升分词精度,采用一种长文本压缩方法处理中文长文本的特殊数据,具体方法为选择关键句并利用TF-IDF算法提取长文本中关键词,再将组合的新文本进行词向量训练。最后,采用增强的语言表示模型进行新闻主题分类,并与6种机器学习和深度学习模型进行对比评估,评价指标为召回率、准确率、精度和F1分数等。实验结果表明:本文的模型可通过提取16个重要词对实时新闻长文本进行有效的分类。 展开更多
关键词 ERNIE模型 预训练模型 新闻分类 长文本处理 中文文本
下载PDF
基于电子电离质谱数据和机器学习的新精神活性物质分类预测模型构建
4
作者 许情 吕敏 +3 位作者 邓虹霄 胡驰 向平 陈航 《质谱学报》 EI CAS CSCD 北大核心 2024年第5期640-646,共7页
新精神活性物质的结构变化快速,给基于标准物质和质谱数据库筛选和鉴定这些新物质带来了挑战。本研究使用机器学习方法为未知新精神活性物质的结构鉴定提供新策略。基于871个质谱数据集构建了最近邻、支持向量机、随机森林和人工神经网... 新精神活性物质的结构变化快速,给基于标准物质和质谱数据库筛选和鉴定这些新物质带来了挑战。本研究使用机器学习方法为未知新精神活性物质的结构鉴定提供新策略。基于871个质谱数据集构建了最近邻、支持向量机、随机森林和人工神经网络算法用于新精神活性物质的结构分类预测,采用5倍交叉验证的网格搜索对模型的超参数进行优化,使用混淆矩阵、准确度、精密度、召回率和f-分数评估4种分类预测模型的性能。结果表明,随机森林模型的预测能力最优,整体准确度可达89.27%,可以很好地对未知化合物结构类别进行预测,从而为未知化合物的结构鉴定提供依据。 展开更多
关键词 电子电离质谱(EI-MS) 新精神活性物质 机器学习 分类预测模型
下载PDF
文本分类TF-IDF算法的改进研究 被引量:107
5
作者 叶雪梅 毛雪岷 +1 位作者 夏锦春 王波 《计算机工程与应用》 CSCD 北大核心 2019年第2期104-109,161,共7页
中国互联网环境的发展,让大量蕴含丰富信息的新词得以普及。而传统的特征词权重TF-IDF(Term Frequency and Inverted Document Frequency)算法主要考虑TF和IDF两个方面的因素,未考虑到新词这一新兴词类的优势。针对特征项中的新词对分... 中国互联网环境的发展,让大量蕴含丰富信息的新词得以普及。而传统的特征词权重TF-IDF(Term Frequency and Inverted Document Frequency)算法主要考虑TF和IDF两个方面的因素,未考虑到新词这一新兴词类的优势。针对特征项中的新词对分类结果的影响,提出基于网络新词改进文本分类TF-IDF算法。在文本预处理中识别新词,并在向量空间模型表示中改变特征权重计算公式。实验结果表明把新词发现加入文本预处理,可以达到特征降维的目的,并且改进后的特征权重算法能优化文本分类的结果。 展开更多
关键词 新词 词频-逆文档频率(TF-IDF) 向量空间模型 文本分类
下载PDF
融合长短时序与文本分类的新闻推荐模型
6
作者 王曙燕 巩婧怡 《西安邮电大学学报》 2023年第3期82-87,共6页
为了更好地向用户准确推荐兴趣新闻,构建一种融合长短时序与文本分类的新闻推荐模型。根据用户兴趣随时间变化的特点,分别获取用户长短时序偏好。将用户长序时间聚类为时间簇,融合Bert模型和文档主题生成模型进行文本自动分类捕捉用户... 为了更好地向用户准确推荐兴趣新闻,构建一种融合长短时序与文本分类的新闻推荐模型。根据用户兴趣随时间变化的特点,分别获取用户长短时序偏好。将用户长序时间聚类为时间簇,融合Bert模型和文档主题生成模型进行文本自动分类捕捉用户兴趣分布,提取各时间簇兴趣分布获得长时序偏好。对用户短时序中的单个时间点兴趣进行词频分析,获得用户短时序偏好。最后融合长短时序偏好,使用余弦相似度算法获得近似偏好用户并推荐新闻。实验结果表明,所提模型相比基于增量协同过滤和潜在语义分析的混合推荐算法与基于用户行为的新闻推荐算法在精准率、召回率和和F值等方面均有提高,在一定程度上提升了推荐效果。 展开更多
关键词 新闻推荐 长短时序 文本分类 Bert模型 余弦相似度
下载PDF
土地利用分类系统的新模式——依据土地利用的产业结构而进行划分的探讨 被引量:48
7
作者 刘平辉 郝晋珉 《中国土地科学》 CSSCI 2003年第1期16-26,共11页
土地利用是人类根据其生活和社会发展的需要,依据土地的特点与其经济区位而对土地进行利用、开发与改造的社会经济行为,由于社会生产力发展的阶段特性,过去多注重于第一产业内土地利用类型的划分,现在,它难以满足第二、第三产业发展的... 土地利用是人类根据其生活和社会发展的需要,依据土地的特点与其经济区位而对土地进行利用、开发与改造的社会经济行为,由于社会生产力发展的阶段特性,过去多注重于第一产业内土地利用类型的划分,现在,它难以满足第二、第三产业发展的需要。结合土地利用变化与产业结构之间的关系及特点,以产业结构分类为基础,按土地利用所服务的产业部门,提出了一套新的土地利用分类体系,该分类体系共分为四个层次,其中第一层次有4个类型,分别是第一产业用地、第二产业用地、第三产业用地和后备产业用地;并在这些层次之下进行续分。该分类体系具有层次多、类型全;土地类型编号科学,便于记忆、理解;有效方便地衡量土地利用的经济效益;使用方便,应用面广,易于被国内各个不同部门接受;具有良好的经济效益等优点。 展开更多
关键词 土地利用 分类管理 产业结构 经济效益 土地管理法 中国
下载PDF
基于隐马尔可夫链的广播新闻分割分类 被引量:7
8
作者 庄越挺 毛祎 +1 位作者 吴飞 潘云鹤 《计算机研究与发展》 EI CSCD 北大核心 2002年第9期1057-1063,共7页
提出了使用具有模拟随机时序数据良好能力的隐马尔可夫链来完成广播新闻分割分类的算法 .首先使用含隐藏语义状态的隐马尔可夫链把原始广播新闻粗略分割分类成开始 /结束和语音两部分 ,其次应用 3个隐马尔可夫链 ,按照最大似然概率法把... 提出了使用具有模拟随机时序数据良好能力的隐马尔可夫链来完成广播新闻分割分类的算法 .首先使用含隐藏语义状态的隐马尔可夫链把原始广播新闻粗略分割分类成开始 /结束和语音两部分 ,其次应用 3个隐马尔可夫链 ,按照最大似然概率法把语音片段预识别为主持人介绍、广告和天气预报 ,最后由语义变化速率识别出新闻现场报道 ,完成广播新闻的精细分割分类任务 . 展开更多
关键词 隐马尔可夫链 广播新闻 音频片段特征 阈值 分割分类算法 音频信号 语音识别 多媒体
下载PDF
基于价值维度的商业模式分类方法研究——以战略新兴产业样本数据为例 被引量:16
9
作者 罗倩 李东 《软科学》 CSSCI 北大核心 2013年第7期18-23,共6页
构建了基于"价值创造"与"价值获取"两个维度的商业模式理论分析框架,在此基础上,提出了有关企业商业模式分类的方法,并以我国战略新兴产业样本数据为例进行实证检验。研究结果显示,分类结果组间具有显著差异,验证... 构建了基于"价值创造"与"价值获取"两个维度的商业模式理论分析框架,在此基础上,提出了有关企业商业模式分类的方法,并以我国战略新兴产业样本数据为例进行实证检验。研究结果显示,分类结果组间具有显著差异,验证了此分类方法的有效性。 展开更多
关键词 商业模式 分类 价值 战略新兴产业
下载PDF
融合FastText模型和注意力机制的网络新闻文本分类模型 被引量:8
10
作者 王婉 张向先 +1 位作者 卢恒 张莉曼 《现代情报》 CSSCI 2022年第3期40-47,共8页
[目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用... [目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用融合注意力机制的Bi LSTM;tte模型实现新闻文本分类。[结果/结论]实验结果显示,融合了Fast Text模型与注意力机制的网络新闻文本分类模型使F1值从90.62%提升到92.03%,说明本文提出的文本分类模型能够提升网络新闻文本分类的精确率,对网络新闻平台提升知识组织效率、优化服务水平具有重要参考价值。 展开更多
关键词 网络新闻 文本分类 注意力机制 双向长短期记忆神经网络模型
下载PDF
我国高校分类的一种新模型 被引量:7
11
作者 何万国 杨正强 蔡宗模 《重庆高教研究》 2015年第3期69-76,共8页
高校分类是一个世界性难题,但却是制定分类发展政策的基础和前提。通过对国内外各种主要分类方法的比较与分析,吸收其合理因素,根据"先类后层"原则,提出了一种新的分类模型,并从课程计划、学位结构、学科构成、办学主体、师... 高校分类是一个世界性难题,但却是制定分类发展政策的基础和前提。通过对国内外各种主要分类方法的比较与分析,吸收其合理因素,根据"先类后层"原则,提出了一种新的分类模型,并从课程计划、学位结构、学科构成、办学主体、师资结构、科研成果及转化、毕业生去向、服务面向八个维度进行了分类。 展开更多
关键词 高校分类 新模型 标准 维度
下载PDF
基于类别关键词的突发事件新闻文本分类方法 被引量:11
12
作者 张永奎 李红娟 《计算机应用》 CSCD 北大核心 2008年第B06期139-140,143,共3页
对突发事件新闻领域的文本自动分类问题进行了研究,提出了一种基于类别关键词的分类方法。在应用向量空间模型的基础上,充分考虑了类别关键词对于文本分类的特殊作用,并进行了实验。实验结果表明,加入类别关键词后,文本分类的精度有较... 对突发事件新闻领域的文本自动分类问题进行了研究,提出了一种基于类别关键词的分类方法。在应用向量空间模型的基础上,充分考虑了类别关键词对于文本分类的特殊作用,并进行了实验。实验结果表明,加入类别关键词后,文本分类的精度有较大的提高,该方法具有一定的实用价值。 展开更多
关键词 文本分类 类别关键词 向量空间模型 突发事件新闻
下载PDF
面向新闻视频内容分析的音频分层分类算法 被引量:1
13
作者 冀中 苏育挺 +1 位作者 宋星光 安欣 《计算机应用研究》 CSCD 北大核心 2009年第5期1673-1675,共3页
提出了一种规则和隐马尔可夫模型相结合的音频分层分类算法,首先利用规则将新闻节目中的音频分为静音、语音和音乐三类,然后采用隐马尔可夫模型进一步将语音和音乐细分为男主持人语音、女主持人语音、交替报道、独白语音、现场语音和... 提出了一种规则和隐马尔可夫模型相结合的音频分层分类算法,首先利用规则将新闻节目中的音频分为静音、语音和音乐三类,然后采用隐马尔可夫模型进一步将语音和音乐细分为男主持人语音、女主持人语音、交替报道、独白语音、现场语音和音乐六类。实验结果表明,男主持人语音、女主持人语音以及音乐的分类效果最好,查准率和查全率均可达90%以上;交替报道的分类性能最差,查准率为57.5%,查全率为79.3%;其他类别的分类性能居中,在70%~90%左右。与同类算法相比,该算法分类性能较高。 展开更多
关键词 音频分类 内容分析 隐马尔可夫模型 新闻视频 视频检索
下载PDF
适于Internet新闻文本实时分类的动态向量空间模型DVSM 被引量:1
14
作者 张晓辉 李莹 +1 位作者 常桂然 赵宏 《计算机科学》 CSCD 北大核心 2004年第6期64-67,共4页
传统向量空问模型(VSM)特征间无关联,且不能动态增量训练,不适合主题和焦点实时变化的Internet新闻信息,为此提出了一种改进的文本实时分类模型——动态向量空间模型(DVSM)。通过对VSM的特征提取策略进行改进,提出了特征聚合和增量训练... 传统向量空问模型(VSM)特征间无关联,且不能动态增量训练,不适合主题和焦点实时变化的Internet新闻信息,为此提出了一种改进的文本实时分类模型——动态向量空间模型(DVSM)。通过对VSM的特征提取策略进行改进,提出了特征聚合和增量训练算法。通过将对分类有相同贡献的文本特征词聚合,使用它们共同的分类贡献向量特征模式作为文本特征向量的基本维;采用增量动态训练改变对分类贡献已改变的特征词在文本向量的特征模式中的位置,适应Internet新闻信息的实时特性。使用静态训练集和动态训练集进行的DVSM与传统VSM的对比实验表明,采用特征聚合和动态训练的DVSM在Internet新闻实时分类中优势效果明显优越。 展开更多
关键词 动态向量空间模型 特征聚合 增量动态训练 Internet新闻分类 DVSM 分类贡献向量特征模式
下载PDF
社会语言学与色彩语码研究 被引量:11
15
作者 杨永林 《现代外语》 CSSCI 北大核心 2002年第4期331-341,共11页
本文从跨学科的角度出发,集中考察了色彩语码研究同社会语言学研究之间相关性的问题。全文共由七个部分组成。第一部分介绍了研究背景与研究目的。第二部分和第三部分分别对色彩语码研究中现行的一些主干理论模式和常用的研究方法进行... 本文从跨学科的角度出发,集中考察了色彩语码研究同社会语言学研究之间相关性的问题。全文共由七个部分组成。第一部分介绍了研究背景与研究目的。第二部分和第三部分分别对色彩语码研究中现行的一些主干理论模式和常用的研究方法进行了评价与反思。第四部分讨论了色彩语码使用中的文化差异现象。第五部分提出了一种新型色彩语码分类模式,以便对各类色彩词汇做出更为科学准确的区分。第六部分通过进一步的实例分析,展示了整合型色彩语码分类模式在语义描写与解释方面的优势。第七部分通过总结与展望,结束了全文。 展开更多
关键词 色彩语码 社会语言学 语义 色彩词汇 文化差异 准确 描写 解释 跨学科 理论模式
下载PDF
新能源汽车综合商业模式对企业绩效的影响研究 被引量:9
16
作者 吴敬静 贺正楚 吴艳 《财经理论与实践》 CSSCI 北大核心 2021年第4期116-122,共7页
基于“价值链、目标市场、资本结构和竞争战略”4个维度,建构新能源汽车企业商业模式分类标准,对2017-2019年我国的新能源汽车上市公司,确定所属综合商业模式,运用面板模型回归,检验商业模式类型与企业绩效关系,结果表明:多数综合商业... 基于“价值链、目标市场、资本结构和竞争战略”4个维度,建构新能源汽车企业商业模式分类标准,对2017-2019年我国的新能源汽车上市公司,确定所属综合商业模式,运用面板模型回归,检验商业模式类型与企业绩效关系,结果表明:多数综合商业模式能显著提升新能源汽车企业持续发展能力。“生产制造型”和“国内市场主导”商业模式企业,产出效益显著提升;“保守型资本结构”和“集中化战略”商业模式企业,存货周转率显著提升;“资源型”或“成本领先型”商业模式企业,总资产周转率效果欠佳;“风险型资本结构”商业模式企业,容易出现长期负债过高问题。 展开更多
关键词 新能源汽车企业 商业模式分类 综合商业模式 企业绩效
下载PDF
沈阳工业互联网技术应用人才能力模型及教育模式探究
17
作者 田晓曦 王洪明 佟曾 《数码设计》 2020年第7期57-57,共1页
笔者针对目前传统教学模式难以满足沈阳工业互联网技术应用人才培养需求的现状,利用教育目标新分类学与界定法构建人才能力模型,依据教学结构论构建差异化教学模式,通过学习过程和学习结果数据验证了该教学模式在提高学生学习成绩、人... 笔者针对目前传统教学模式难以满足沈阳工业互联网技术应用人才培养需求的现状,利用教育目标新分类学与界定法构建人才能力模型,依据教学结构论构建差异化教学模式,通过学习过程和学习结果数据验证了该教学模式在提高学生学习成绩、人工智能水平、学习体验度等方面均有提高。具有丰富工业互联网教学方法论的理论意义和培养适应沈阳工业互联网行业需求的高校学生的实践意义。 展开更多
关键词 差异化教学 工业互联网 人才能力模型 教育目标新分类 教学结构论
下载PDF
切花百合种球新型分级机的设计与应用 被引量:1
18
作者 黎启江 金亚力 +3 位作者 丁仁展 王祥宁 吴学尉 李进昆 《农机化研究》 北大核心 2009年第1期108-110,共3页
切花百合种球的国产化生产是国内新兴的产业,种球的规格一致性是培育优质切花的前提。为此,在国内外现有技术的基础上针对切花百合种球的分级特征,研究开发出了一种适用新型、性能可靠的百合种球分级机,同时介绍了切花百合种球分级机的... 切花百合种球的国产化生产是国内新兴的产业,种球的规格一致性是培育优质切花的前提。为此,在国内外现有技术的基础上针对切花百合种球的分级特征,研究开发出了一种适用新型、性能可靠的百合种球分级机,同时介绍了切花百合种球分级机的结构组成、工作原理和技术特点,并对其开发应用前景进行了展望。该分级机结构简单,性能可靠,分级率和分级精度较高,稳定性好,成本较低,适用范围广。 展开更多
关键词 切花百合种球 新型分级机 花卉
下载PDF
计及新能源资源分级的柔性调度模型预测控制 被引量:9
19
作者 任景 薛晨 +2 位作者 马晓伟 崔伟 刘友波 《智慧电力》 北大核心 2020年第9期30-36,88,共8页
针对新能源大规模并网引起的调度响应、消纳等问题,提出引入模型预测控制的新能源预测模型,基于新能源日前长期预测、日内短期滚动优化及历史数据与环境因素的反馈校正,建立出力预测的滚动优化模型,提高新能源预测的准确度。同时为应对... 针对新能源大规模并网引起的调度响应、消纳等问题,提出引入模型预测控制的新能源预测模型,基于新能源日前长期预测、日内短期滚动优化及历史数据与环境因素的反馈校正,建立出力预测的滚动优化模型,提高新能源预测的准确度。同时为应对新能源大规模接入的不确定性,提出基于新能源分级预警与虚拟储能、火电深度调峰动态响应的电网柔性调度控制方法,以新能源最大化消纳、系统经济运行为目标,协调虚拟储能与火电机组深度调峰方案的动态调整,实现新能源的高精准消纳。算例分析证明了所提方法与模型的有效性。 展开更多
关键词 模型预测控制(MPC) 新能源分级 深度调峰 柔性调度
下载PDF
基于BERT和深度主动学习的农业新闻文本分类方法 被引量:1
20
作者 石运来 崔运鹏 杜志钢 《农业图书情报学报》 2022年第8期19-29,共11页
[目的/意义]当前农业新闻分类研究中的模型训练以被动学习方式居多,普遍存在数据无法即时标注及标注成本过高的问题,对农业新闻分析工作也造成了一定阻碍。为解决该问题,运用主动学习或者深度主动学习技术从未标注数据中选择更有价值和... [目的/意义]当前农业新闻分类研究中的模型训练以被动学习方式居多,普遍存在数据无法即时标注及标注成本过高的问题,对农业新闻分析工作也造成了一定阻碍。为解决该问题,运用主动学习或者深度主动学习技术从未标注数据中选择更有价值和代表性的数据进行人工标注并构建标注数据集,提升农业新闻挖掘工作效率和效果。[方法/过程]将文本分类常用的机器学习模型结合主动学习方法分析提升效果,以及使用BERT模型结合3种采样策略进行深度主动学习训练,在共19847条样本的新闻爬虫语料上以筛选出农业相关新闻为目标,通过每轮增加30个样本标注的迭代实验进行测试。[结果/结论]实验结果表明:主动学习方法的应用对各个模型的训练过程均有明显提升。其中BERT模型配合判别性主动学习采样函数,具有最优的新闻文本分类效果和最低的标注数据需求。 展开更多
关键词 深度学习 农业新闻 文本分类 BERT模型 主动学习
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部