期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
舆情事件向量预训练模型
1
作者 王楠 谭舒孺 +1 位作者 谢晓兰 李海荣 《计算机工程与应用》 CSCD 北大核心 2024年第18期189-197,共9页
目前舆情预测研究中,事件表示具有一定的主观性和静态性,没有充分表达出事件演化的动态性和演化性,很多特征需要通过分析事件发展的完整过程得到,导致构建的预测模型并不能实现舆情现象发生前的预警目的。构建了事件预训练模型,实现基... 目前舆情预测研究中,事件表示具有一定的主观性和静态性,没有充分表达出事件演化的动态性和演化性,很多特征需要通过分析事件发展的完整过程得到,导致构建的预测模型并不能实现舆情现象发生前的预警目的。构建了事件预训练模型,实现基于评论数据的事件特征向量自动生成,并用于训练下游舆情反转预测模型。结合事件的主观评论与时序信息,通过构造评论词、事件词向量、事件词、事件句,将抽象的事件特征向量生成问题转换为自然语言预处理问题,基于Transformer结构提出了一种新的建模方式,实现事件特征向量自动生成及舆情反转预测。提出的模型用于舆情反转预测下游任务时,在测试集中对反转事件的预测率达到100%,实现了反转点之前预测出反转现象的目的。同时,该预测模型还可以较为准确地预测生成第二天的事件句,在对测试集的n折交叉验证中仅有11%的事件出现了预测误差,为研究舆情演化相关问题提供数据和方法基础。 展开更多
关键词 舆情反转预测 事件特征预训练 舆情演化 自然语言处理 TRANSFORMER
下载PDF
基于循环神经网络的电力一次设备实体关系抽取模型研究
2
作者 王磊 于洋 +2 位作者 麦立 张传海 王今 《电子设计工程》 2024年第4期107-111,共5页
为提升变电站一次设备启动过程方案编制的数字化水平,文中对自然语言处理中的实体识别及关系抽取方法进行了研究。在定义了生成相关规则库及方案模板库所需数学模型的基础上,讨论了循环神经网络(RNN)在该场景的实际应用方法。应用过程中... 为提升变电站一次设备启动过程方案编制的数字化水平,文中对自然语言处理中的实体识别及关系抽取方法进行了研究。在定义了生成相关规则库及方案模板库所需数学模型的基础上,讨论了循环神经网络(RNN)在该场景的实际应用方法。应用过程中,针对传统RNN网络在处理长时依赖信息时会出现梯度消失的问题,文中引入了长短期记忆单元,并基于该单元设计了一种双向的循环神经网络。通过实际工程数据集上进行的对比测试结果表明,在进行实体识别时,所提算法对于复杂实体的识别效果更优,对操作指令的识别F值能达到94.15%;而在进行关系抽取时,该算法的F值则可达95.21%。 展开更多
关键词 关系抽取 实体识别 RNN 长短期记忆 自然语言处理
下载PDF
基于谓词及句义类型块的汉语句义类型识别 被引量:3
3
作者 王倩 罗森林 +1 位作者 韩磊 潘丽敏 《中文信息学报》 CSCD 北大核心 2014年第2期8-16,共9页
从现代汉语语义学角度,可将句义类型划分为简单句义、复杂句义、复合句义和多重句义4种。作为在整体上对句义结构进行描述的方式之一,句义类型识别是对汉语句子进行完整句义结构分析的重要步骤。该文基于谓词及句义类型块提出了一种汉... 从现代汉语语义学角度,可将句义类型划分为简单句义、复杂句义、复合句义和多重句义4种。作为在整体上对句义结构进行描述的方式之一,句义类型识别是对汉语句子进行完整句义结构分析的重要步骤。该文基于谓词及句义类型块提出了一种汉语句义类型识别的方法,实现了4种句义类型的识别。该方法先通过句中谓词的个数进行初步识别判断出部分简单句,再对剩余的句子先用C4.5机器学习的方法得到句中谓词经过的最大句义类型块的个数,再结合句法结构中顶端句子节点进行判决,最终给出剩余句子的句义类型判定结果。实验采用BFS-CTC汉语标注语料库中10 221个句子进行开集测试,句义类型的整体识别准确率达到97.6%,为基于现代汉语语义学的研究奠定了一定的技术研究基础。 展开更多
关键词 句义类型识别 句义类型 语义分析 自然语言处理
下载PDF
跨文化生物医学文本的语言学方法和应用
4
作者 范健 《科教文汇》 2013年第2期80-81,共2页
本文介绍了在生物学英文文本纷繁芜杂的当今,面对中英文本的文化差异,生物医学自然语言处理(Natural Language processing for Biology,BioNLP)的基本概念和方法。归纳总结了BioNLP在挖掘生物医学文献信息中的重要方面。通过研究实例分... 本文介绍了在生物学英文文本纷繁芜杂的当今,面对中英文本的文化差异,生物医学自然语言处理(Natural Language processing for Biology,BioNLP)的基本概念和方法。归纳总结了BioNLP在挖掘生物医学文献信息中的重要方面。通过研究实例分析了常见的以"词"、"句"、"篇"为语言单位的分析方法并指出这些方法的局限性,最后展望了生物医学计算语言学研究趋势。 展开更多
关键词 计算语言学生物医学自然语言处理文本挖掘 跨文化
下载PDF
数智时代下职业型会计硕士培养模式研究——基于自然语言处理技术的培养方案文本分析
5
作者 李强 杨继雨 《煤炭高等教育》 2023年第6期105-112,共8页
如何紧跟数智时代特征培养职业型会计硕士人才是众多高校面临的难题之一。利用自然语言处理技术对国内高校会计硕士培养方案进行文本量化分析后发现,会计硕士培养方案存在培养目标缺乏创新性、办学定位缺少数智化、集体培养效用偏弱、... 如何紧跟数智时代特征培养职业型会计硕士人才是众多高校面临的难题之一。利用自然语言处理技术对国内高校会计硕士培养方案进行文本量化分析后发现,会计硕士培养方案存在培养目标缺乏创新性、办学定位缺少数智化、集体培养效用偏弱、课程体系不完善等问题,严重阻碍了会计硕士教育整体转型的进程。高校需要通过改革培养目标、创新办学定位、筑牢产教结合、加快数智化课程建设等方式优化职业型会计硕士培养模式。 展开更多
关键词 数智时代 会计硕士 自然语言处理 培养方案
原文传递
针对产品命名实体识别的半监督学习方法 被引量:15
6
作者 黄诗琳 郑小林 陈德人 《北京邮电大学学报》 EI CAS CSCD 北大核心 2013年第2期20-23,54,共5页
针对商务信息领域的产品命名实体,研究了产品命名实体各部分的结构特征和相互关系,建立了一个三层的半监督学习框架.该方法综合利用规则词典和统计的方法,建立一个隐条件随机场模型,可以更充分地利用自举得到数据的隐藏状态.在数码相机... 针对商务信息领域的产品命名实体,研究了产品命名实体各部分的结构特征和相互关系,建立了一个三层的半监督学习框架.该方法综合利用规则词典和统计的方法,建立一个隐条件随机场模型,可以更充分地利用自举得到数据的隐藏状态.在数码相机领域进行的实验结果表明,该方法只需要少量的手工标记数据就能较好地识别网页等文本中的产品命名实体. 展开更多
关键词 产品命名实体识别 商务信息处理 自然语言处理
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部