-
题名多跳式机器阅读理解研究进展综述
被引量:1
- 1
-
-
作者
仇亚进
奚雪峰
崔志明
盛胜利
周悦尧
-
机构
苏州科技大学电子与信息工程学院
苏州市虚拟现实智能交互及应用重点实验室
苏州智慧城市研究院
德州理工大学
-
出处
《计算机技术与发展》
2023年第2期9-16,23,共9页
-
基金
国家自然科学基金(61876217,62176175)
江苏省“六大人才高峰”高层次人才项目(XYDXX-086)。
-
文摘
机器阅读理解的目标是使机器更好地理解自然语言文本并在此基础上回答提出的问题,是自然语言处理领域热门的研究方向之一。早期,由于受到了数据集的约束,对机器阅读理解的认识大多仅限于一个单跳式的问答。随着最近几年多跳机器阅读理解数据集的发展,多跳式机器阅读理解得到广泛的研究,极大地推动了机器阅读理解领域的发展。从以下几个方面对基于多跳式的机器阅读理解进行归纳总结:介绍了机器阅读理解任务定义与发展历程;阐述了多跳式机器阅读理解任务定义并梳理总结相关数据集;详细整理了多跳式机器阅读理解基于注意力机制和图神经网络以及问题分解相关模型方法的研究进展;最后,对多跳式机器阅读理解未来研究重点和所面临的研究挑战进行展望。
-
关键词
多跳式机器阅读理解
注意力机制
图神经网络
问题分解
数据集
-
Keywords
muti-hop machine reading comprehension
attention mechanism
graph neural network
question decomposition
dataset
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于类名引导的弱监督文本分类
- 2
-
-
作者
周悦尧
奚雪峰
崔志明
盛胜利
仇亚进
-
机构
苏州科技大学电子与信息工程学院
苏州市科技局苏州市虚拟现实智能交互及应用重点实验室
苏州科技大学苏州智慧城市研究院
德州理工大学计算机学院
-
出处
《计算机工程与设计》
北大核心
2023年第8期2329-2336,共8页
-
基金
国家自然科学基金项目(61876217、62176175)
江苏省“六大人才高峰”高层次人才基金项目(XYDXX-086)
苏州市科技计划基金项目(SGC2021078)。
-
文摘
针对弱监督文本分类过于依赖专家生成种子词的局限,提出一种基于类名引导生成种子词的弱监督文本分类方法。使用Skip-Gram模型学习单词的向量表示,借助vMF(von Mises Fisher)分布对用户提供的类名与语料库之间的关系进行建模,综合考虑语义相关性和语义特异性,由此生成一组高质量的种子词,无需依赖专家经验;迭代使用种子词生成伪标签和文档分类器;扩展种子词,进一步提升模型性能。在NYT和20 Newsgroups两个公开数据集上的实验结果(F1-score)表明了所提弱监督文本分类方法的有效性。
-
关键词
弱监督
文本分类
词向量
冯米塞尔分布
语义相关性
语义特异性
深度学习
-
Keywords
weakly supervision
text classification
word embedding
vMF distribution
semantic relevance
semantic specificity
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于空间精确定位的园林假山沉降监测研究
被引量:1
- 3
-
-
作者
兰志成
仇亚进
奚雪峰
崔志明
胡伏原
-
机构
苏州科技大学电子与信息工程学院
苏州市虚拟现实智能交互及应用技术重点实验室
苏州科技大学智慧城市研究院
-
出处
《苏州科技大学学报(自然科学版)》
2022年第2期79-84,共6页
-
基金
国家自然科学基金资助项目(61876217)
江苏省“六大人才高峰”高层次人才项目(XYDXX-086)。
-
文摘
针对园林假山逐年沉降问题,需要对其空间位移变化进行精确测量。以往的测量方法是使用非棱镜全站仪对测量目标的空间坐标进行采集,但这种方法采集信息有限,并且效率较低。基于空间精确定位的方法利用三维激光扫描技术可以对建筑物实行非接触、高效率与高密度的扫描,并将其应用于假山信息采集中。详细介绍了点云数据采集、拼接、建模、模型比对的方法与流程,并将其两期扫描的数据成果进行比对分析,结果表明假山出现不同程度的沉降现象,整体变化趋势基本稳定。研究结果以期为相关部门对园林假山的修葺提供依据。
-
关键词
园林假山沉降
空间精确定位
三维激光扫描技术
点云数据
-
Keywords
landscape rockery settlement
precise positioning
3D laser scanning technology
point cloud data
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名深度学习的表格到文本生成研究综述
被引量:2
- 4
-
-
作者
胡康
奚雪峰
崔志明
周悦尧
仇亚进
-
机构
苏州科技大学电子与信息工程学院
苏州市虚拟现实智能交互及应用重点实验室
苏州智慧城市研究院
-
出处
《计算机科学与探索》
CSCD
北大核心
2022年第11期2487-2504,共18页
-
基金
国家自然科学基金(61876217,62176175)
江苏省“六大人才高峰”高层次人才项目(XYDXX-086)
苏州市科技计划项目(SGC2021078)。
-
文摘
文本生成是自然语言处理的热门领域,随着信息收集能力的不断增长,人们收集到越来越多的结构化数据,如表格。如何解决信息过载问题,理解表格含义并描述表格内容是人工智能面临的重要问题,因此有了表格到文本生成任务。表格到文本生成是指语言模型输入表格数据后生成表格的对应文本描述。模型生成的文本描述应该语句流畅,充分表达表格信息且不能偏离表格事实。描述了表格到文本生成任务背景并做出了详细定义,分析了当前任务主要难点并介绍了主流研究方法。表格到文本生成共有两大问题:描述什么,如何描述。梳理了不同研究人员针对这两大问题所提出的解决方法,同时总结了所提出模型的特点、优势以及劣势。对比分析了这些优秀模型在主流数据集上的表现,同时根据模型类型进行归类,并进行横向比较分析。介绍了表格到文本生成领域较为通用的评价方法,总结了不同评价方法的特点、优势以及劣势。最后展望了表格到文本生成任务未来发展趋势。
-
关键词
自然语言处理
文本生成
结构化数据
表格到文本生成
-
Keywords
natural language processing
text generation
structured data
table-to-text generation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-