-
题名一种基于子图转述的问题生成方法
- 1
-
-
作者
温立强
熊冠铭
王宇
陈一朴
李伟平
赵文
-
机构
北京大学软件与微电子学院
北京大学软件工程国家工程研究中心
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2024年第10期3578-3588,共11页
-
基金
国家重点研发计划项目(No.2021YFC3340301)。
-
文摘
本文提出了一种子图转述的方法用于解决知识图谱问题生成中的未见谓词问题.传统的问题生成方法主要利用标注的问答数据(问题-逻辑形式对)生成问题,然而标注数据难以覆盖知识图谱中所有的谓词,如何对未见的谓词生成问题依然是一个挑战.本文提出了一种基于子图结构的语义解耦方法,通过将复杂问题对应的知识图谱子图分解为原子级子图,从而将包含未见谓词的多跳子图拆分为易于处理的单跳子图.并且本文设计了一种子图转述方法,通过对数据集中的谓词进行采样,得到子图描述文本,并在大规模无监督数据上训练得到子图转述器,能够为包含未见谓词的子图提供自然语言形式的表述,为生成问题提供了有效的信息.本文定量分析了在不同的难度级别下模型的性能表现,在GrailQA等数据集上的实验结果表明,本文的方法达到了最先进的性能.
-
关键词
子图采样
子图转述
未见谓词
问题生成
知识图谱
-
Keywords
subgraph sampling
subgraph representation
unseen predicates
question generation
knowledge graph
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语义分析的电子商务客户评价研究
- 2
-
-
作者
姬轩
杨丹蕾
熊冠铭
褚伯然
-
机构
北京工业大学经济与管理学院
-
出处
《商场现代化》
2017年第11期43-46,共4页
-
文摘
电子商务迅速发展的背景下,电子商务用户大数据的应用备受关注,其中用户对商品的评价信息具有较高的研究价值。本文以天猫平台特定男士T恤为例,使用爬虫工具Selenium对用户评价信息进行了爬取,并通过预处理、建立情感词典、产品特征提取与特征强度计算等方式,对获取的数据进行语义分析。在此基础上,筛选有效数据,建立经济计量模型以探究主要因素与销量之间的关系,得出目前对销量有显著影响的因素,并且依据模型所得出弹性给予企业针对提高销量的合理性建议。
-
关键词
用户评价
爬虫
语义分析
多元回归
柯布道格拉斯效用函数
-
分类号
F724.6
[经济管理—产业经济]
-