-
题名成本约束下自适应众包标注的用户观点抽取
被引量:3
- 1
-
-
作者
赵威
林煜明
黄涛贻
李优
-
机构
广西可信软件重点实验室(桂林电子科技大学)
广西自动检测技术与仪器重点实验室(桂林电子科技大学)
-
出处
《计算机应用》
CSCD
北大核心
2019年第5期1351-1356,共6页
-
基金
国家自然科学基金资助项目(61562014
U1711263)
+3 种基金
广西自然科学基金重点项目(2018GXNSFDA281049)
桂林电子科技大学研究生优秀学位论文培育项目(16YJPYSS15)
桂林电子科技大学研究生教育创新计划项目(2018YJCX48)
广西可信软件重点实验室研究课题(kx201916)~~
-
文摘
用户评论包含了丰富的用户观点信息,对潜在的顾客和商家具有重要的参考价值。观点目标和观点词作为用户评论中的核心对象,它们的自动抽取是用户评论智能化应用的一项核心工作。目前主要采用有监督的抽取方法解决该问题,这些方法依赖于利用高质量的标注样本进行模型训练,而传统人工标注样本的方法不仅耗时费力,且标注成本高。众包计算为构建高质量训练样本集提供了一种有效途径,然而,众包工作者由于知识背景等因素使得标注结果的质量参差不齐。为了在有限的成本下获取高质量的标注样本,提出一种基于工作者专业水平评估的自适应众包标注方法,构建可靠的观点目标-观点词数据集。首先,通过小成本挖掘出高专业水平的工作者;然后,设计一种基于工作者可靠性的任务分发机制;最后,利用观点目标和观点词间的依赖关系设计了一种有效的标注结果融合算法,通过整合不同工作者的标注结果生成最终可靠的结果。在真实数据集上进行了一系列实验表明,与GLAD模型和多数投票(MV)算法方法相比,所提方法能够在成本预算较小的情况下将构建出的高质量观点目标-观点词数据集的可靠性提高10%左右。
-
关键词
观点挖掘
众包计算
成本约束
工作者检测
数据整合
-
Keywords
opinion mining
crowdsourcing calculation
cost constraint
worker measurement
data integration
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名众包环境下的隐私保护研究
被引量:2
- 2
-
-
作者
刘欢
吴桂兴
-
机构
中国科学技术大学软件学院
-
出处
《计算机技术与发展》
2018年第12期111-115,共5页
-
基金
江苏省科技项目-基础研究计划(BK20141209)
-
文摘
自从众包的概念被提出以来,就日益受到学术界和工业界的广泛关注,而且随着移动互联网和智能设备的蓬勃发展,众包任务的执行也变得更加便利和高效。可以说,众包已经成为一个热门的研究方向。与此同时,人们也越来越重视个人的信息隐私,尤其是在执行众包任务时,人们不希望透露过多的个人信息,以免造成不必要的安全隐患。因此,需要在设计众包机制的时候,考虑到隐私保护,做到既能保证众包任务的顺利执行,又能保护参与者的隐私数据。为此,不仅介绍了众包的概念和工作流程,还详细介绍了差分隐私的数学定义以及实现机制。同时,也对差分隐私在不同众包场景下的应用做了分析,分别是:保护用户提供的数据、保护用户的位置信息以及保护用户的出价信息。通过总结现有的研究,最后对未来的研究方向进行展望。
-
关键词
众包计算
隐私保护
差分隐私
机制设计
-
Keywords
crowdsourcing calculation
privacy protection
differential privacy
mechanism design
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-