-
题名无监督的问句相似度匹配方法
被引量:2
- 1
-
-
作者
宋颖毅
叶东升
王坤龙
葛志
-
机构
中国航天科工集团第二研究院研究生院
北京计算机技术及应用研究所
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第S02期69-72,共4页
-
基金
国防基础科研基金资助项目
-
文摘
问句语义匹配作为常用问题集(frequently asked question,FAQ)问答中的关键任务之一,其主要目的是根据用户输入问题与数据库中问题的相似度对数据库中的问题进行排序,并选择出语义相似度高的问题答案返回给用户。通过对深度学习循环神经网络模型的研究,将双向长短期记忆网络模型(Bi-LSTM)与统计学方法(TF-IDF)相结合,使用无监督的方式学习,生成问句的向量表示,计算问句之间的语义相似度,充分利用和挖掘句子的语义信息。通过在公开百科问答集上的对比实验,表明该方法可以很好地提高问答准确性,对于问答系统的构建有着重要意义。
-
关键词
常用问答
语义相似度
双向长短期记忆网络
词频—逆向文件频率
无监督学习
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于多源数据的装备软件质量综合度量与演化预测
- 2
-
-
作者
冯大成
叶军玲
吴超
高昕睿
宋颖毅
-
机构
北京计算机技术及应用研究所
中国航天科工集团有限公司
-
出处
《质量与可靠性》
2019年第4期40-45,共6页
-
文摘
装备软件质量数据繁杂,缺少规范和客观评价手段。为了对软件质量进行度量、评估与演化预测,将高斯混合模型应用到软件质量的度量和评估中,根据不同质量元间的相关关系,构建相关关系网络,识别出关键少数质量度量元;然后根据组合特征关系训练长短时记忆(LSTM)模型,得到软件质量预测模型。通过试验证明该方法在实际应用中的实用性,能够对评估软件质量作出有效的度量与评估和精确的演化预测分析。
-
关键词
软件质量
质量评估
质量预测
LSTM模型
-
Keywords
Software quality
quality assessment
quality prediction
LSTM model
-
分类号
E919
[军事]
E92
[兵器科学与技术—武器系统与运用工程]
-
-
题名面向开源情报的信息抽取大语言模型
- 3
-
-
作者
赵勤博
王又辰
陈荣
宋颖毅
栾真
田夫兰
-
机构
中国航天科工集团第二研究院七〇六所
-
出处
《计算机工程与设计》
2024年第12期3772-3778,共7页
-
文摘
针对开源情报信息抽取过程依赖多类专用模型和抽取属性限制强等问题,基于一种GLM大语言模型进行指令微调和上下文学习提高信息抽取准确率,利用指令自动化生成方法对原始问题进行泛化,构建SFT数据集。开展多任务统一的微调学习常见抽取模式,通过自动思维链扩充提示增强模型推理能力。实验结果表明,该方法在开源情报命名实体识别、关系抽取和事件抽取任务上,微调模型能满足不同场景下的抽取要求,具有较好的抽取效果。
-
关键词
开源情报
大语言模型
信息抽取
指令自动化生成
指令微调
上下文学习
自动思维链
-
Keywords
open source intelligence
large language model
information extraction
automatic instruction generation
instruction tuning
in-context learning
automatic chain-of-thought
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-