期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于语境增强的新能源汽车投诉文本方面-观点对抽取
1
作者 汪才钦 周渝皓 +2 位作者 张顺香 王琰慧 王小龙 《计算机应用》 CSCD 北大核心 2024年第8期2430-2436,共7页
挖掘新能源汽车投诉文本中用户对产品多维度的意见,能为产品的设计决策提供参考。因投诉文本具有实体密度高、句式冗长等特点,导致当前方面-观点对抽取(AOPE)方法感知方面项与观点项间的关联性不强。针对这一问题,提出一种基于语境增强... 挖掘新能源汽车投诉文本中用户对产品多维度的意见,能为产品的设计决策提供参考。因投诉文本具有实体密度高、句式冗长等特点,导致当前方面-观点对抽取(AOPE)方法感知方面项与观点项间的关联性不强。针对这一问题,提出一种基于语境增强的AOPE模型(AOE-CE),通过融合主题特征与文本特征作为语境表示增强实体间的关联关系。模型由实体识别和关系检测2个模块组成:首先,实体识别通过预训练模型和词性标注工具编码文本,再利用双向长短期记忆(Bi-LSTM)网络结合多头注意力捕获上下文信息得到文本特征,并将文本特征输入至条件随机场(CRF)得到实体集合;关系检测通过BERT(Bidirectional Encoder Representations from Transformers)获取主题特征,并将主题特征与文本特征融合获得增强的语境表示,再利用三仿射机制以语境表示为辅助增强实体间的关联关系,最后通过Sigmoid得到抽取结果。实验结果表明,AOE-CE的精准率、召回率和F1值比SDRN(Synchronous Doublechannel Recurrent Network)模型分别提升了2.19、1.08和1.60个百分点,表明所提模型具有更好的AOPE效果。 展开更多
关键词 方面-观点对抽取 新能源汽车 投诉文本 语境增强 三仿射机制 多头注意力
下载PDF
一种专利技术主题分析的IPC语境增强Context-LDA模型研究 被引量:15
2
作者 伊惠芳 刘细文 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第4期25-36,共12页
【目的】改善当下多数主题模型建模缺乏语境、可解释性弱、IPC结合不佳的问题。【方法】提出语境增强概念及IPC语境增强Context-LDA模型,将文本下所有IPC与抽取词汇同时作为训练语料,通过Python进行主题建模,并与传统LDA模型比较泛化能... 【目的】改善当下多数主题模型建模缺乏语境、可解释性弱、IPC结合不佳的问题。【方法】提出语境增强概念及IPC语境增强Context-LDA模型,将文本下所有IPC与抽取词汇同时作为训练语料,通过Python进行主题建模,并与传统LDA模型比较泛化能力和主题表示能力。【结果】基于38354条石墨烯专利数据,不同场景下IPC语境增强Context-LDA模型困惑度值较低,多为100以下,泛化能力强;JS值高于传统LDA模型约0.1,主题辨识度更明显;IPC与主题词互相表征,主题可读性增强,且IPC平均位置在9.6/20,不会带来噪声。【局限】尚未将IPC语境增强Context-LDA模型下的词汇表示从uni-gram向n-gram拓展。【结论】主题模型对专利主题分析有着重要的支持作用,需要基于实际需求开发更多有效、精准的分析模型。 展开更多
关键词 技术主题分析 主题模型 语境增强 Context-LDA
原文传递
浅析话语标记语oh增强语境时的语用功能
3
作者 张皓 《海外英语》 2016年第5期213-214,共2页
该文以话语标记语oh为研究对象,以Sperber和Wilson的关联理论为理论基础,以《实习医生格蕾》第八季为语料分析了oh增强语境时的语用功能,希望能够帮助交流者更好地理解话语标记的语用功能,从而正确地理解话语,实现成功交际。
关键词 关联理论 话语标记语oh 增强语境 语用功能
下载PDF
Improved speech absence probability estimation based on environmental noise classification 被引量:2
4
作者 SON Young-ho LEE Sang-min 《Journal of Central South University》 SCIE EI CAS 2012年第9期2548-2553,共6页
An improved speech absence probability estimation was proposed using environmental noise classification for speech enhancement.A relevant noise estimation approach,known as the speech presence uncertainty tracking met... An improved speech absence probability estimation was proposed using environmental noise classification for speech enhancement.A relevant noise estimation approach,known as the speech presence uncertainty tracking method,requires seeking the "a priori" probability of speech absence that is derived by applying microphone input signal and the noise signal based on the estimated value of the "a posteriori" signal-to-noise ratio(SNR).To overcome this problem,first,the optimal values in terms of the perceived speech quality of a variety of noise types are derived.Second,the estimated optimal values are assigned according to the determined noise type which is classified by a real-time noise classification algorithm based on the Gaussian mixture model(GMM).The proposed algorithm estimates the speech absence probability using a noise classification algorithm which is based on GMM to apply the optimal parameter of each noise type,unlike the conventional approach which uses a fixed threshold and smoothing parameter.The performance of the proposed method was evaluated by objective tests,such as the perceptual evaluation of speech quality(PESQ) and composite measure.Performance was then evaluated by a subjective test,namely,mean opinion scores(MOS) under various noise environments.The proposed method show better results than existing methods. 展开更多
关键词 speech enhancement soft decision speech absence probability Gaussian mixture model (GMM)
下载PDF
稀疏地理实体关系的关键词提取方法 被引量:9
5
作者 余丽 陆锋 +2 位作者 刘希亮 程诗奋 张雪英 《地球信息科学学报》 CSCD 北大核心 2016年第11期1465-1475,共11页
网络文本蕴含地理实体关系抽取技术,需要高时效、强鲁棒的关键词提取方法。与监督学习方法相比,无监督学习方法能捕获文本的动态变化特征并发现新增的关系类型,因此备受关注。其中,基于频率的关键词提取方法获得广泛研究,然而,网络文本... 网络文本蕴含地理实体关系抽取技术,需要高时效、强鲁棒的关键词提取方法。与监督学习方法相比,无监督学习方法能捕获文本的动态变化特征并发现新增的关系类型,因此备受关注。其中,基于频率的关键词提取方法获得广泛研究,然而,网络文本蕴含的地理实体关系分布稀疏,基于频率的方法难以直接应用于地理实体关系的关键词提取。为解决该问题,本文基于公开访问的网络资源,提出一种语境增强的关键词提取方法。首先,基于在线百科和开放的同义词词典,通过语境合并和语义融合创建增强的语境,以降低语境中词语的稀疏性。接着,Domain Frequency和Entropy频率统计方法从增强语境中自动构建一个大规模语料。然后,基于该语料选择词法特征并统计其权值,用于扩大语境中词语间的差异。最后,使用选择的词法特征度量增强语境中词语的重要性,将权值最大的词语作为描述地理实体关系的关键词,并基于大规模真实网络文本开展实验。实验结果表明:对于地理实体关系的关键词识别,本文方法的平均精度为85.5%,比Domain Frequency和Entropy方法分别提高41%和36%;对于新增关键词识别,本文方法的精度达到60.3%。语境增强的关键词提取方法能有效地处理地理实体关系分布的稀疏性,可服务于网络文本蕴含地理实体关系的抽取。 展开更多
关键词 地理信息检索 地理实体关系 关键词提取 文本挖掘 语境增强
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部