期刊文献+
共找到156篇文章
< 1 2 8 >
每页显示 20 50 100
Corrective-Net:面向多标签文本分类的标签关联学习模块
1
作者 肖新正 黄瑞章 +3 位作者 陈艳平 秦永彬 宋玉梅 周裕林 《计算机工程与科学》 CSCD 北大核心 2024年第6期1092-1100,共9页
在目前的多标签文本分类任务中,主要面临以下2个问题:(1)侧重文本表示学习,对标签之间的关联信息建模不充分;(2)尽管使用了标签关联信息来改善多标签分类任务,但对标签关联的建模过于依赖人工预定义的外部知识,而外部知识的获取成本高昂... 在目前的多标签文本分类任务中,主要面临以下2个问题:(1)侧重文本表示学习,对标签之间的关联信息建模不充分;(2)尽管使用了标签关联信息来改善多标签分类任务,但对标签关联的建模过于依赖人工预定义的外部知识,而外部知识的获取成本高昂,限制了其实际应用。针对以上问题,提出了一种面向多标签文本分类的标签关联学习模块Corrective-Net。该模块可以在不依赖外部知识的前提下,自动学习数据中的标签关联信息;同时,它还可以利用标签关联信息,对基础分类模块的初始预测结果进行修正,使得最终预测兼顾语义信息和标签关联信息,以获得更精准的多标签预测结果。在AAPD和SO数据集上的大量实验表明,Corrective-Net具有通用性和有效性,通过分析标签修正对各个标签性能的影响,得到了显式的标签关联信息,并进行了可视化。 展开更多
关键词 标签关联 标签修正 多标签 文本分类 可视化
下载PDF
Japan's Political Situation vs.the Constitutional Amendment
2
作者 Hu Lingyuan Kou Jianqiao 《Contemporary International Relations》 2020年第1期110-131,共22页
The year 2019 marks the seventh anniversary of Shinzo Abe's return to office,alongside the administration's obsession with Constitutional amendment.During the 25th House of Councillors selection in July,Prime ... The year 2019 marks the seventh anniversary of Shinzo Abe's return to office,alongside the administration's obsession with Constitutional amendment.During the 25th House of Councillors selection in July,Prime Minister Abe changed the rules applied for the four national elections in 2012,wrote the Self-Defense Forces into the Constitution and the Liberal Democratic Party(LDP)convention,and deliberately made the amendment a focal point of controversy in his election campaign.However,when the results of the election came out,the pro-amendment forces,with the LDP at their core,didn't reach the two-thirds majority threshold required for Constitutional revision.Going forwards,the Abe-led Liberal Democratic Party will strive to consolidate Constitutional amendment forces in the National Diet,hoping to cross the majority threshold,and at the same time to coerce opposition parties to comply with passing LDP draft revisions to the Constitution in the National Diet as soon as possible,in order to submit these to national referendum.In the meantime,preparatory works for this referendum are being carried out through the use of political resources to mobilize public support.Whether Abe can reach the political objective of Constitutional amendment during his current term of office and how the Constitutional issue in Japan will play out is sure to attract global attention. 展开更多
关键词 JAPAN POLITICS House of Councillors ELECTION CONSTITUTIONAL amendMENT in EXPLICIT text trend of CONSTITUTIONAL amendMENT
下载PDF
On the Constitutional Review of Correction Activity of Chinese Criminal Law
3
作者 Feng Zehua Wang Zhe Ling Xuefang 《International Journal of Technology Management》 2016年第2期87-90,共4页
下载PDF
融合音素的缅甸语语音识别文本纠错
4
作者 陈璐 董凌 +3 位作者 王文君 王剑 余正涛 高盛祥 《计算机工程与科学》 CSCD 北大核心 2024年第6期1121-1127,共7页
缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法... 缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法。通过参数共享策略对转录文本及其音素进行联合建模,利用音素信息辅助检测并纠正缅甸语同音和空格错误。实验结果表明,本文所提方法相比基线方法ConvSeq2Seq,在缅甸语语音识别纠错任务中的F1值提升了85.97%,达到了79.15%。 展开更多
关键词 缅甸语 语音识别文本纠错 音素 共享参数 BERT
下载PDF
中文文本纠错软件测试用例的选择生成方法 被引量:1
5
作者 冯程皓 谢振平 丁博文 《计算机应用》 CSCD 北大核心 2024年第1期101-112,共12页
针对目前尚无有效的中文文本纠错软件测试用例生成方法的情况,为了服务于软件纠错性能的测量并为软件提供优化方向,设计了一种面向多用户的、工程化的中文文本纠错软件测试用例选择生成方法(SGMT-CCS)。定义了两种不同的可供用户选择的... 针对目前尚无有效的中文文本纠错软件测试用例生成方法的情况,为了服务于软件纠错性能的测量并为软件提供优化方向,设计了一种面向多用户的、工程化的中文文本纠错软件测试用例选择生成方法(SGMT-CCS)。定义了两种不同的可供用户选择的用例评判标准:错误数量密度和错误种类密度。设计了三个模块:测试用例自动化生成模块、测试用例选择模块以及测试用例优先级排序模块。在SGMT-CCS中,用户可以:1)在测试用例自动化生成的过程中自定义错误最小间隔和用例集大小;2)在测试用例选择的过程中自定义错误最小间隔和期望值;3)在测试用例选择和优先级排序的过程中选择不同的用例评判标准进行自定义操作,以适应不同数据集的要求。实验结果表明,SGMT-CCS能够在较短的时间内获得有效的测试用例,选择模块实验在模拟的需求情况下都能满足用户自定义目标,优先级排序模块实验验证了相较于排序前,在不同评判标准下的不同时间段内都能有效提高测试效率。 展开更多
关键词 测试用例生成 中文文本纠错 可选择生成 回归测试 自然语言处理
下载PDF
读《文字墨影》墓志录文札记
6
作者 李佳蔚 何山 《平顶山学院学报》 2024年第3期45-50,共6页
中国文字博物馆收藏有一批珍贵墓志拓片,《文字墨影》选释其中110种,部分为首次刊布,其文献、史料、语料等价值非常突出。该书释读水平整体较高,但受残泐、讹俗、用典等因素影响,文字缺录、误录问题仍较严重,极不利于材料的科学有效利... 中国文字博物馆收藏有一批珍贵墓志拓片,《文字墨影》选释其中110种,部分为首次刊布,其文献、史料、语料等价值非常突出。该书释读水平整体较高,但受残泐、讹俗、用典等因素影响,文字缺录、误录问题仍较严重,极不利于材料的科学有效利用。对照墓志拓片,选取该书典型缺、误文字案例,分形近字、涉典字、疑难字及残泐字四类进行考辨补正,以还原文献原貌,从而为碑刻文献释读整理提供参考,为汉语汉字研究提供可靠实证支撑。 展开更多
关键词 《文字墨影》墓志录文 缺误文字 分类补正 汉语汉字史研究
下载PDF
一种面向中文拼写纠错的自监督预训练方法
7
作者 苏锦钿 余珊珊 洪晓斌 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第9期90-98,共9页
预训练语言模型BERT/RoBERTa/MacBERT等虽然能够通过预训练任务中的掩码语言模型(MLM)很好地学习字和词的语法、语义及上下文特征,但其缺乏拼写错误识别及纠正能力,且在中文拼写纠错(CSC)任务中面临预训练与下游任务微调目标不一致的问... 预训练语言模型BERT/RoBERTa/MacBERT等虽然能够通过预训练任务中的掩码语言模型(MLM)很好地学习字和词的语法、语义及上下文特征,但其缺乏拼写错误识别及纠正能力,且在中文拼写纠错(CSC)任务中面临预训练与下游任务微调目标不一致的问题。为了进一步提升BERT/RoBERTa/MacBERT等模型的拼写错误识别及纠正能力,提出一种面向中文拼写纠错的自监督预训练方法MASC。MASC在MLM的基础上将对被掩码字的正确值预测转换成对拼写错误字的识别和纠正。首先,MASC将MLM对字的掩码扩展为相应的全词掩码,目的是提升BERT对单词级别的语义表征学习能力;接着,利用混淆集从音调相同、音调相近和字形相近等方面对MLM中的被掩码字进行替换,并将MLM的训练目标更改为识别正确的字,从而增强了BERT的拼写错误识别及纠正能力;最后,在3个公开的CSC语料集sighan13、sighan14和sighan15上的实验结果表明,MASC可在不改变BERT/RoBERTa/MacBERT等模型结构的前提下进一步提升它们在下游CSC任务中的效果,并且消融实验也证明了全词掩码、音调和字形等信息的重要性。 展开更多
关键词 中文拼写纠错 文本纠错 自然语言处理 预训练语言模型 深度学习 自监督
下载PDF
基于文本内容分析的互联网医疗平台信息质量评价研究
8
作者 王君 姚唐 王亚妮 《医学信息学杂志》 CAS 2023年第11期7-12,29,共7页
目的/意义借助文本内容分析法对互联网医疗平台用户发布的信息质量进行评价研究。方法/过程通过Python爬虫获取国内典型互联网医疗平台的文本内容,进行自然语言处理和聚类分析,提取特征指标设计逻辑回归模型并进行灰色关联度修正,从而... 目的/意义借助文本内容分析法对互联网医疗平台用户发布的信息质量进行评价研究。方法/过程通过Python爬虫获取国内典型互联网医疗平台的文本内容,进行自然语言处理和聚类分析,提取特征指标设计逻辑回归模型并进行灰色关联度修正,从而构建信息质量评价指标体系。结果/结论互联网医疗平台可重点从信息丰富度、信息发布者特征及用户交流互动方面加强信息的发布与呈现,引导用户发布高质量信息并快速识别有价值信息,促进互联网医疗平台的可持续发展。 展开更多
关键词 互联网医疗 信息质量评价 文本内容分析 逻辑回归 灰色关联度修正
下载PDF
HM-BERT:一种采用分级掩码的风电语音文本纠正方法
9
作者 高永兵 郑伟业 +1 位作者 李春灿 姜春光 《内蒙古科技大学学报》 CAS 2023年第4期367-371,共5页
采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进... 采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进后的模型称为HM-BERT.实验证明:HM-BERT在提升纠正效果的同时还加强了纠正模型的鲁棒性,该方法对其他领域的文本纠正也提供了解决思路. 展开更多
关键词 BERT MLM 分级掩码 语音文本纠正
下载PDF
基于LSTM和灰色模型的股价时间序列预测研究 被引量:4
10
作者 韩金磊 熊萍萍 孙继红 《南京信息工程大学学报(自然科学版)》 CAS 北大核心 2023年第6期631-642,共12页
影响股价的因素错综复杂,因此在考虑多变量情形下,对时间序列中常用的长短期记忆网络(LSTM)进行修正,并选取股票价格进行预测.首先,采用方差膨胀因子(VIF)进行变量的筛选,再结合自适应提升法(Adaboost)模型查看特征变量的重要程度.其次... 影响股价的因素错综复杂,因此在考虑多变量情形下,对时间序列中常用的长短期记忆网络(LSTM)进行修正,并选取股票价格进行预测.首先,采用方差膨胀因子(VIF)进行变量的筛选,再结合自适应提升法(Adaboost)模型查看特征变量的重要程度.其次,用爬虫对投资者情绪进行文本分析,计算情绪指数等指标并揭示其与股价的关系.然后,对格力电器、飞科电器、美的集团3支股票进行股价预测,对比多层感知器(MLP)模型、LSTM模型,并选择适当的模型作为基准模型,在基准模型的基础上加上情绪指数、投资者关注度等指标构建了LSTM-EM模型.进一步,在考虑了投资者情绪后对残差项使用GM(1,1)模型进行修正.实证结果表明,该模型能对股价进行较为精确的预测. 展开更多
关键词 股价预测 综合预测 文本分析 误差修正 长短期记忆网络(LSTM) 灰色模型
下载PDF
基于MacBERT⁃BiLSTM和注意力机制的短文本分类研究 被引量:1
11
作者 王道康 张吴波 《现代电子技术》 2023年第21期123-128,共6页
针对中文短文本上下文依赖性强,特征信息难以提取的问题,提出一种融合MacBERT、双向长短期记忆神经网络(BiLSTM)、注意力(Attention)机制的短文本分类模型方法。利用预训练模型MacBERT得到动态词向量,输入BiLSTM模型中提取上下文关系特... 针对中文短文本上下文依赖性强,特征信息难以提取的问题,提出一种融合MacBERT、双向长短期记忆神经网络(BiLSTM)、注意力(Attention)机制的短文本分类模型方法。利用预训练模型MacBERT得到动态词向量,输入BiLSTM模型中提取上下文关系特征。结合注意力机制分配不同的权重值,最后使用Softmax分类器得到分类结果。研究表明,该模型在THUCNews数据集上F1值达到了95.63%,相较于基准模型BERT提高了2.18%,验证了其在短文本分类任务中的可行性和有效性。 展开更多
关键词 短文本 文本分类 MacBERT BiLSTM ATTENTION 纠错掩码 特征加权 语义向量
下载PDF
基于BERT的电网现场作业风险自动评级方法 被引量:1
12
作者 虞佳淼 王慧芳 +3 位作者 张亦翔 费正明 周辉 王刘旺 《电网技术》 EI CSCD 北大核心 2023年第11期4746-4754,共9页
电网现场作业风险等级影响着作业的安全性和经济性,目前风险等级评级主要依赖于人工评级,存在一定的错误率。以国网公司的作业风险分级表与实际现场历史文本库作为研究对象,在充分分析各自文本特点的基础上,提出了基于BERT(bidirectiona... 电网现场作业风险等级影响着作业的安全性和经济性,目前风险等级评级主要依赖于人工评级,存在一定的错误率。以国网公司的作业风险分级表与实际现场历史文本库作为研究对象,在充分分析各自文本特点的基础上,提出了基于BERT(bidirectional encoder representations from transformers)模型的电网现场作业风险自动评级方法。考虑作业风险分级表的概括性,提出对作业风险分级表进行文本增强;考虑实际现场历史文本库中存在一定比例的冗余内容和错误评级,提出冗余文本去除方法和基于文本挖掘技术的风险等级纠错方法;以经过上述方法处理后的2类现场作业文本为样本,构建了基于BERT单文本主题分类微调模型的文本分类模型,实现了对电网现场作业风险的自动评级。算例对比了该文模型与其他分类模型在不同样本集下的评级效果,表明BERT模型能够更全面地获取作业文本的语义特征,分级表的文本增强方法和历史库的风险等级纠错方法能提升评级效果,而冗余文本去除会导致作业文本样本数量减少较多,反而降低评级效果。上述结果表明,该文方法能够实现电网现场作业文本的自动评级,并具有较高的准确性。 展开更多
关键词 电网现场作业 作业风险分级表 作业风险评级 BERT 文本增强 数据纠错
下载PDF
基于行业词表的自动语音转写后优化技术
13
作者 马晓亮 安玲玲 +2 位作者 邓从健 杜德泉 张国新 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第8期118-125,共8页
自动语音识别(ASR)技术目前已发展得较为成熟,通用ASR引擎已经广泛应用于交通、医疗、通信等行业。但是,由于行业专有词汇在大规模训练语料库中呈非独立同态分布,通用ASR引擎在各细分行业转写时存在对行业专有词汇识别准确率低的问题。... 自动语音识别(ASR)技术目前已发展得较为成熟,通用ASR引擎已经广泛应用于交通、医疗、通信等行业。但是,由于行业专有词汇在大规模训练语料库中呈非独立同态分布,通用ASR引擎在各细分行业转写时存在对行业专有词汇识别准确率低的问题。相较于互联网环境的16 kHz音频采样率,电话呼叫中心语音为窄带低采样(采样率8 kHz),转写后精度下降尤为明显。为了提高行业词汇的语音转写准确率,文中提出一种基于行业词表的ASR转写后优化技术。首先,对语料库文本数据分别采用卷积神经网络模型和深度神经网络BERT模型进行预测分词,生成行业纠错词表。随后,在生产环境中,使用通用ASR引擎对电话呼叫语音数据进行初始转写。然后,对一次转写后的文本,通过Soft-Masked BERT模型结合纠错词表实现文本数据的纠错,从而提高语音识别准确率。使用广州12345热线客服通话语音数据进行训练和测试,结果表明,使用文中的转写后优化技术可以将通用ASR引擎的行业用词转写准确率提高约10个百分点,且纠错速度较快,具有良好的适用性。 展开更多
关键词 文本纠错 语音识别 客服通话 行业纠错词表 卷积神经网络
下载PDF
DCsR:一种面向中文文本的集成式纠错框架
14
作者 曹军航 黄瑞章 +1 位作者 白瑞娜 赵建辉 《计算机工程与科学》 CSCD 北大核心 2023年第2期370-380,共11页
中文文本纠错技术在自然语言处理中有着非常重要的应用。针对书写灵活多变的中文文本,现有的纠错模型无法覆盖多种错误类型且存在从候选集合TOPK中挑选TOP1时出错概率极大的问题。提出了一种面向中文文本的集成式纠错框架——DCsR,摒弃... 中文文本纠错技术在自然语言处理中有着非常重要的应用。针对书写灵活多变的中文文本,现有的纠错模型无法覆盖多种错误类型且存在从候选集合TOPK中挑选TOP1时出错概率极大的问题。提出了一种面向中文文本的集成式纠错框架——DCsR,摒弃以往建立在已知错误类型的假设上利用单一模型进行纠错的解决方案,根据不同场景选择添加多种表现优异的纠错模型分别进行纠错再集成召回更全面的候选集,同时根据自定义特征的重要程度建立了一个多策略、可拓展的候选排序算法,以挑选更具有公信力的修正结果。DCsR框架有效地解决了模型的偏向性问题,进一步全面提升了对中文文本拼写纠错的能力。实验结果表明,在公开数据集SIGHAN15上,对比现在的主流纠错模型,使用DCsR框架进行纠错的F1值比表现最优的单模型纠错高出了3.93%,进一步提升了对中文文本的纠错能力。针对CGED2020进行的消融实验也表明了DCsR框架的有效性。 展开更多
关键词 中文文本纠错 DCsR框架 集成式纠错 特征重要程度 候选排序算法
下载PDF
语音转录后文本的中文拼写纠错模型
15
作者 邢月晗 郑岩 《电子测量技术》 北大核心 2023年第6期57-61,共5页
针对目前语音转录文本错误率较高的问题,本文提出一种基于MacBERT的文本先检错后纠错模型,对语音转录后文本进行校正。检错阶段使用MacBERT-BiLSTM-CRF模型检查文本是否有错及出错位置。纠错阶段从置信度和字音相似度两个维度出发,划定... 针对目前语音转录文本错误率较高的问题,本文提出一种基于MacBERT的文本先检错后纠错模型,对语音转录后文本进行校正。检错阶段使用MacBERT-BiLSTM-CRF模型检查文本是否有错及出错位置。纠错阶段从置信度和字音相似度两个维度出发,划定“置信度-字音相似度”曲线判断候选字是否进行纠错。候选字的置信度使用MacBERT语言模型计算,并提出一种基于拼音码的字音相似度计算方法。在语音公开数据集Thchs-30上通过调用百度语音识别API进行实验,相比现有方法,在检错阶段和纠错阶段的精确率、召回率、F1值都得到了提高,其中纠错阶段精确率达到83.32%,提高了转录文本的正确性。 展开更多
关键词 语音 文本纠错 MacBERT 拼音码 Thchs-30
下载PDF
基于生成对抗网络的文本生成图像算法
16
作者 段亚茹 赵嘉雨 何立明 《计算机系统应用》 2023年第1期348-357,共10页
文本生成图像算法对生成图像的质量和文本匹配度有很高的要求.为了提高生成图像的清晰度,在现有算法的基础上改进生成对抗网络模型.加入动态记忆网络、细节校正模块(DCM)、文本图像仿射组合模块(ACM)来提高生成图片的质量.其中动态记忆... 文本生成图像算法对生成图像的质量和文本匹配度有很高的要求.为了提高生成图像的清晰度,在现有算法的基础上改进生成对抗网络模型.加入动态记忆网络、细节校正模块(DCM)、文本图像仿射组合模块(ACM)来提高生成图片的质量.其中动态记忆网络可以细化模糊图像并选择重要的文本信息存储,以提高下一阶段生成图像的质量.DCM纠正细节,完成合成图像中缺失部分.ACM编码原始图像特征,重建与文本描述无关的部分.改进后的模型实现了两个目标,一是根据给定文本生成高质量的图片,同时保留与文本无关的内容.二是使生成图像不再较大程度依赖于初始图像的生成质量.通过在CUB-200-2011鸟类数据集进行研究实验,结果表明相较之前的算法模型,FID(Frechet inception)有了显著的改善,结果由16.09变为10.40.证明了算法的可行性和先进性. 展开更多
关键词 生成对抗网络 细节校正 动态记忆网络 文本描述生成图像 文本图像仿射组合模块 图像生成 深度学习
下载PDF
基于错误纠正模块的场景文本识别算法
17
作者 于洁潇 张大壮 何凯 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2023年第4期400-407,共8页
近年来,场景文本识别技术得到了飞速发展.然而,由于不规则场景文本图像中经常存在诸如杂物遮挡、分布扭曲、光照不足等视觉障碍,使得现有方法不能对单词中某些字符进行准确识别,进而产生较多的错误识别.为了解决这一问题,本文提出了一... 近年来,场景文本识别技术得到了飞速发展.然而,由于不规则场景文本图像中经常存在诸如杂物遮挡、分布扭曲、光照不足等视觉障碍,使得现有方法不能对单词中某些字符进行准确识别,进而产生较多的错误识别.为了解决这一问题,本文提出了一种基于错误纠正(error correction,EC)模块的场景文本识别算法.与现有算法中的纠错模块不同,所提出的EC模块是一个序列到序列的预测模型.在EC模块的编解码结构中增加了多单元注意力机制,能够更加关注特征图中的一些重要信息.EC模块可直接从纯文本中学习语义信息,用于纠正拼写错误的文本.此外,提出了一种基于场景文本识别的多特征(multi-feature,MF)提取器,该提取器由5个MF单元组成,可分别从Resnet-45后5个模块的输出中提取特征信息.与传统的方法相比,MF提取器可以从不同深度挖掘更加丰富的图像信息.在7个数据集上的对比实验结果表明,与当前先进方法相比,所提算法在性能上具有明显的优势. 展开更多
关键词 场景文本识别 语义信息纠错 多特征提取 深度学习
下载PDF
区域红色文化的形象认同、投射偏差及修正路径研究——以上海为案例地
18
作者 于秋阳 王倩 《上海经济》 2023年第3期34-49,共16页
近年来,各地采用多种方式着力打造区域红色文化形象,积极推动红色文化的创造性转化与创新性发展。为探究区域红色文化形象的创建成效,本文以上海为案例地,运用Python在不同平台进行文本抓取,利用ROST Content Mining和SPSS软件从投射与... 近年来,各地采用多种方式着力打造区域红色文化形象,积极推动红色文化的创造性转化与创新性发展。为探究区域红色文化形象的创建成效,本文以上海为案例地,运用Python在不同平台进行文本抓取,利用ROST Content Mining和SPSS软件从投射与感知两个方面进行文本内容比较分析,以此探讨区域红色文化形象的投射偏差及优化路径。分析可知,区域红色文化形象的“投射—感知”之间既存在认同的一致,又存在错位的偏差:区域红色文化的投射形象与感知形象的“认同”主要体现在四个方面:以伟大建党精神为引领、物质符号类载体最受关注、红色文化发挥资政育人功能、整体文化满意度较高;“偏差”主要体现在内容层次偏差、功能定位偏差、内容范围偏差三个方面。结合红色文化形象构成要素以及感知高频词的“长尾”内容,区域红色文化形象在投射过程中要以品牌要素修正内容范围偏差,以产品要素修正内容层次偏差,以服务要素修正功能定位偏差。基于此,本文提出了塑造红色IP、强化形象符号、丰富折射方式、增强服务信息四条修正路径。 展开更多
关键词 区域红色文化形象 文本分析 投射-感知 认同与错位 投射偏差 修正路径
下载PDF
高校容错纠错机制的构建与优化——基于部分高校容错纠错政策性文本的比较分析
19
作者 金子鸥 《长春教育学院学报》 2023年第6期62-71,共10页
党的二十大报告对建设堪当民族复兴重任的高素质干部队伍作出部署,指出要落实“三个区分开来”,激励干部敢于担当、积极作为。高校是党的领导阵地,肩负为党育人、为国育才的职责使命,高校干部在加快建设中国特色社会主义现代化教育强国... 党的二十大报告对建设堪当民族复兴重任的高素质干部队伍作出部署,指出要落实“三个区分开来”,激励干部敢于担当、积极作为。高校是党的领导阵地,肩负为党育人、为国育才的职责使命,高校干部在加快建设中国特色社会主义现代化教育强国之路上扮演着重要角色。当前,高校层面存在容错纠错制度机制搭建不平衡,容错纠错启动实施难、效果甚微等问题。在全面从严管党治校背景下,构建符合高校改革发展实际的容错纠错机制、优化实施路径、激活制度效能,是加强新时代党的制度建设、健全全面从严治党体系、鼓励激励高校干部干事创业、推动高等教育高质量发展的应有之义。 展开更多
关键词 高校 容错纠错机制 政策性文本
下载PDF
基于知识图谱与BERT的安全领域汉字文本纠错模型
20
作者 王子斌 张全 +3 位作者 谢聪 余沛 余泓江 李沣庭 《计算机应用》 CSCD 北大核心 2023年第S01期75-80,共6页
针对安全领域所涉及的文本中存在大量人为混淆的文字的问题,提出一种基于汉字知识图谱的BERT(Bidirectional Encoder Representation from Transformers)预训练模型,表征汉字的读音、字形、语义三个维度的特征,构建纠错算法。首先,构建... 针对安全领域所涉及的文本中存在大量人为混淆的文字的问题,提出一种基于汉字知识图谱的BERT(Bidirectional Encoder Representation from Transformers)预训练模型,表征汉字的读音、字形、语义三个维度的特征,构建纠错算法。首先,构建汉字知识图谱刻画汉字的读音、字形拆解、繁简转换、汉字与数字转换等属性和关系,并基于汉字知识图谱中的读音属性和node2vec模型训练得到汉字读音向量;其次,基于知识图谱中字形关系构建node2vec模型,得到node2vec字形向量,并结合卷积神经网络(CNN)方法训练字形向量,两者之和作为最终的字形向量;最后,基于BERT预训练模型,融合读音、字形、语义三维度的向量,并在不同维度间使用自注意力机制加权求和,发现错误字位置并选择正确的候选字。为验证所提模型的有效性,在安全领域诈骗短信数据集上,将所提模型与FASpell、SpellGCN、Soft-Masked BERT进行了对比。实验结果表明,所提模型的正确率和召回率比FASpell分别提升了24.7、21.6个百分点,比SpellGCN分别提升了22.2、13.7个百分点,比Soft-Masked BERT分别提升了20.8、32.7个百分点。可见该纠错模型能够有效识别安全领域文本的错字,在网络诈骗文本分类、要素提取等下游任务中有较好的效果。 展开更多
关键词 自然语言处理 知识图谱 汉字文本纠错 图神经网络 node2vec BERT 预训练模型
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部