-
题名面向软件工程的情感分析技术研究
被引量:1
- 1
-
-
作者
陈震鹏
姚惠涵
曹雁彬
刘譞哲
梅宏
-
机构
高可信软件技术教育部重点实验室(北京大学)
北京大学信息科学技术学院计算机科学与技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2023年第5期2218-2230,共13页
-
基金
北大百度基金(2020BD007)。
-
文摘
情感分析在软件工程领域具有广泛的应用场景,例如,从代码提交信息中检测开发者的情绪、从程序员问答论坛中识别开发者的观点等.但是,现有的“开箱即用”的情感分析工具无法在软件工程相关的任务中取得可靠的结果.已有研究表明,导致不可靠结果的最主要原因是,这些工具无法理解一些单词和短语在软件工程领域中的特定含义.此后,研究者们开始为软件工程领域定制监督学习和远程监督学习方法.为了验证这些方法的效果,研究者们使用软件工程相关的标注数据集来对它们进行数据集内验证,即,将同一数据集划分为训练集和测试集,分别用于方法的训练和测试.但是,对软件工程领域的某些情感分析任务来说,尚无标注数据集,且人工标注数据集耗时耗力.在此情况下,一种可选的方法就是使用为了相似任务从同一目标平台上提取的数据集或者使用从其他软件工程平台上提取的数据集.为了验证这两种做法的可行性,需要进一步以平台内设置和跨平台设置来验证现有情感分析方法.平台内设置指的是使用提取自同一平台的不同数据集作为训练集和测试集;跨平台设置指的是使用提取自不同平台的数据集作为训练集和测试集.目标旨在数据集内设置、平台内设置、跨平台设置这3种设置下,综合验证现有的为软件工程定制的情感分析方法.最终,实验结果为相关的研究者和从业者提供了具有现实指导意义的启示.
-
关键词
情感分析
软件工程
数据集内设置
平台内设置
跨平台设置
-
Keywords
sentiment analysis
software engineering
within-dataset setting
within-platform setting
cross-platform setting
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名多维应用特征融合的用户偏好预测
- 2
-
-
作者
陈震鹏
陆璇
李豁然
刘譞哲
-
机构
北京大学高可信软件技术教育部重点实验室
北京大学(天津滨海)新一代信息技术研究院
-
出处
《计算机科学与探索》
CSCD
北大核心
2017年第9期1405-1417,共13页
-
基金
国家自然科学基金青年-面上连续资助项目(No.61370020)
国家自然科学基金创新研究群体项目(No.61421091)
国家高技术研究发展计划(863计划)(No.2015AA01A202)~~
-
文摘
近年来,随着智能手机的飞速发展,移动应用的数目也快速增长。因此,移动应用开发者会提前预测用户对于自己开发的应用的偏好情况。选取Android应用的被卸载次数与其被下载次数的比值作为用户偏好的隐式反映,用户对应用的评价(喜爱率)作为用户偏好的显式反映。基于国内某知名手机应用市场提供的2014年5月至9月的大规模真实用户使用数据,选取9 795个活跃用户数不少于50的Android手机应用作为研究对象,进行分析。从7个维度定义了可能影响用户对应用偏好的30种特征,并对每个应用进行特征提取。基于定义的特征,使用随机森林算法训练分类器,按照卸载/下载比率或喜爱率的高低对应用进行划分,并找出显著影响卸载/下载比率、喜爱率的特征。
-
关键词
Android手机应用
应用特征
用户偏好
-
Keywords
Android Apps
App features
user preferences
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名数据驱动的移动应用用户接受度建模与预测
被引量:2
- 3
-
-
作者
陆璇
陈震鹏
刘譞哲
梅宏
-
机构
高可信软件技术教育部重点实验室(北京大学)
北京大学软件工程研究所
-
出处
《软件学报》
EI
CSCD
北大核心
2020年第11期3364-3379,共16页
-
基金
广东省重点领域研发计划(2020B010164002)
民航旅客服务智能化应用技术重点实验室开放课题
国家自然科学基金(J1924032)。
-
文摘
应用市场(appmarket)已经成为互联网环境下软件应用开发和交付的一种主流模式.相对于传统模式,应用市场模式下,软件的交付周期更短,用户的反馈更快,最终用户和开发者之间的联系更加紧密和直接.为应对激烈的竞争和动态演变的用户需求,移动应用开发者必须以快速迭代的方式不断更新应用,修复错误缺陷,完善应用质量,提升用户体验.因此,如何正确和综合理解用户对软件的接受程度(简称用户接受度),是应用市场模式下软件开发需考量的重要因素.近年来兴起的软件解析学(softwareanalytics)关注大数据分析技术在软件行业中的具体应用,对软件生命周期中大规模、多种类的相关数据进行挖掘和分析,被认为是帮助开发者提取有效信息、作出正确决策的有效途径.从软件解析学的角度,首先论证了为移动应用构建综合的用户接受度指标模型的必要性和可行性,并从用户评价数据、操作数据、交互行为数据这3个维度给出基本的用户接受度指标.在此基础上,使用大规模真实数据集,在目标用户群体预测、用户规模预测和更新效果预测等典型的用户接受度指标预测问题中,结合具体指标,提取移动应用生命周期不同阶段的重要特征,以协同过滤、回归融合、概率模型等方法验证用户接受度的可预测性,并讨论了预测结果与特征在移动应用开发过程中可能提供的指导.
-
关键词
用户接受度
应用市场
移动应用
软件解析学
数据驱动
-
Keywords
user acceptance
app market
mobile app
software analytics
data driven
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-