期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于方差权重因子选词的SIF句向量模型
1
作者 孙毅 裘杭萍 康睿智 《计算机工程》 CAS CSCD 北大核心 2019年第9期204-210,234,共8页
针对平滑反频率(SIF)模型在文本分类和情感分析中性能较差的问题,在SIF模型的基础上,根据单词在不同分类任务类别中的分布情况,计算其对任务贡献度的方差权重(VW)因子,建立一种VW因子选词句向量模型CwVW-SIF。在标准文本分类数据集和情... 针对平滑反频率(SIF)模型在文本分类和情感分析中性能较差的问题,在SIF模型的基础上,根据单词在不同分类任务类别中的分布情况,计算其对任务贡献度的方差权重(VW)因子,建立一种VW因子选词句向量模型CwVW-SIF。在标准文本分类数据集和情感分析数据集上进行测试,结果表明,CwVW-SIF相对SIF模型具有较高的分类精度。 展开更多
关键词 平滑反频率 句向量 方差权重 文本分类 情感分析
下载PDF
基于多特征融合模型的自动摘要 被引量:3
2
作者 吴世鑫 黄德根 张云霞 《计算机工程与设计》 北大核心 2020年第3期650-655,共6页
为解决文本自动摘要任务中特征挖掘不充分的问题,选取句子的词汇、相对位置、长度和句间相似度4个特征,提出一种基于多特征融合模型的摘要系统。基于句法树的词汇特征充分利用语法信息,消除传统方法获取关键词的局限性,相对位置特征通... 为解决文本自动摘要任务中特征挖掘不充分的问题,选取句子的词汇、相对位置、长度和句间相似度4个特征,提出一种基于多特征融合模型的摘要系统。基于句法树的词汇特征充分利用语法信息,消除传统方法获取关键词的局限性,相对位置特征通过获取位置的高阶信息对句子进行赋值,长度特征过滤掉过长的句子,基于平滑逆向频率句嵌入方法构造句向量,有效计算句子间的相似度。实验结果表明,该系统提高了文本自动摘要的准确度。 展开更多
关键词 文本摘要 多特征融合 句法树 平滑逆向频率句嵌入 语义相似度
下载PDF
基于句向量的文本相似度计算方法 被引量:10
3
作者 刘继明 于敏敏 袁野 《科学技术与工程》 北大核心 2020年第17期6950-6955,共6页
为进一步提高文本相似度计算的准确性,提出基于句向量的文本相似函数(part of speech and order smooth inverse frequency,PO-SIF),从词性和词序方面优化了平滑反频率(smooth inverse frequency,SIF)计算方法,SIF算法的核心是通过加权... 为进一步提高文本相似度计算的准确性,提出基于句向量的文本相似函数(part of speech and order smooth inverse frequency,PO-SIF),从词性和词序方面优化了平滑反频率(smooth inverse frequency,SIF)计算方法,SIF算法的核心是通过加权和去除噪声得到句向量来计算句子相似度。在具体计算时,一方面通过增加词性消减因子调节SIF句向量计算权重参数,获得带有词性信息的句向量,另一方面通过将词序相似度与SIF句向量相似度算法进行线性加权优化句子相似度得分。实验结果表明,增加词性和词序的方法可以提升算法准确率。 展开更多
关键词 平滑逆频率 句向量 词性 词序相似度
下载PDF
基于平滑逆频率和依存句法的句子相似度计算方法 被引量:2
4
作者 刘继明 谭云丹 袁野 《科学技术与工程》 北大核心 2019年第20期278-282,共5页
综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助... 综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助哈尔滨工业大学的语言技术平台,将句子的结构信息添加到句子相似度计算中,通过句子中“词语依存关系”三元组的相似性来度量句子间的相似度。实验结果表明,基于SIF和依存句法的句子相似度计算方法所得的反映准确率和召回率平衡度的指标为84.4%,与同类的句子相似度计算方法相比,能更为有效衡量句子间的相似程度。 展开更多
关键词 平滑逆频率 依存句法 句子相似度计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部