期刊文献+
共找到91篇文章
< 1 2 5 >
每页显示 20 50 100
一种结合代码片段和混合主题模型的软件数据聚类方法
1
作者 魏林林 沈国华 +2 位作者 黄志球 蔡梦男 郭菲菲 《计算机科学》 CSCD 北大核心 2024年第6期44-51,共8页
使用主题模型进行文档聚类是众多文本挖掘任务中一种常见的做法。许多研究针对软件问答网站的数据,利用主题模型进行聚类来分析不同领域在社区的发展情况。然而,这些软件相关数据往往包含代码片段且文本长度分布不均,使用传统单一的主... 使用主题模型进行文档聚类是众多文本挖掘任务中一种常见的做法。许多研究针对软件问答网站的数据,利用主题模型进行聚类来分析不同领域在社区的发展情况。然而,这些软件相关数据往往包含代码片段且文本长度分布不均,使用传统单一的主题模型对文本数据建模,易得到不稳定的聚类结果。文中提出了一种结合代码片段和混合主题模型的聚类方法,并使用Stack Overflow作为数据源,构造了在该平台上被提问数量排名前60的Python第三方库数据集,经过建模,该数据集最终划分为以下6个不同的领域:网络安全、数据分析、人工智能、文本处理、软件开发和系统终端。实验结果表明,在自动评估和人工评估的指标上,使用代码片段结合文本进行主题建模,在聚类结果划分的质量上表现良好,而联合多个模型进行实验,一定程度上提高了聚类结果的稳定性和准确性。 展开更多
关键词 代码片段 主题模型 Stack Overflow PYTHON 聚类
下载PDF
Pre-emptive Channel Borrowing and Traffic Overflowing Channel Allocation Scheme for Multimedia Overlay Networks
2
作者 赵方明 杭娟 何迪 《Journal of Shanghai Jiaotong university(Science)》 EI 2011年第6期677-686,共10页
This paper proposes a channel allocation scheme for multimedia wireless networks,in which a twolayer macro-cell or micro-cell architecture is considered.Macro-cells are used to access high-mobility services;while micr... This paper proposes a channel allocation scheme for multimedia wireless networks,in which a twolayer macro-cell or micro-cell architecture is considered.Macro-cells are used to access high-mobility services;while micro-cells,which are overlaid by the macro-cells,are used to cater low-mobility services.To analyze the scheme,a multidimensional Markov traffic model is firstly developed,in which traffic characteristic of two special periods of time is considered.And then,a pre-emptive channel-borrowing scheme combined with trafficoverflowing strategy for multimedia(voice,video or data) networks is proposed,in which handoff requests can not only borrow channels from adjacent homogenous cells,but also be overflowed to heterogeneous cells.Priority strategies are also dedicated to high-mobility services for they can pre-empt channels being used by low-mobility services in macro-cells.To meet the high quality of service(QoS) requirements of video services and increase the channel utilization ratio,video services can be transformed between real-time services and non-real-time services as necessary.Simulation results show that our schemes can decrease the blocking probabilities and improve the channel utilization. 展开更多
关键词 overlay networks channel-borrowing traffic overflowing pre-emptive priority blocking probability
原文传递
Chinese lanterns overflowing with lights, colors in Europe
3
作者 Wu Yuna 《Voice of Friendship》 2018年第2期18-19,共2页
In the winter of 2017,southern France was hit by the most severe freeze in a decade,and yet the southern city of Gaiaque,with a population of just 10,000,had 250,000 visitors in town.What attracted them to brave the c... In the winter of 2017,southern France was hit by the most severe freeze in a decade,and yet the southern city of Gaiaque,with a population of just 10,000,had 250,000 visitors in town.What attracted them to brave the cold and rain to visit the small city?A Chinese lantern festival,the first kind of it in France.The lantern festival,jointly 展开更多
关键词 Chinese lanterns overflowing with lights colors in Europe EU
原文传递
基于问答语义匹配的知识社区新问题专家推荐方法
4
作者 杜军威 邹树林 +3 位作者 李浩杰 江峰 于旭 胡强 《电子学报》 EI CAS CSCD 北大核心 2023年第7期1875-1888,共14页
传统的知识社区专家推荐方法采用文本相似度匹配机理,并基于问题或专家描述来构建专家特征.这些方法没有利用问题与答案的语义匹配关系,因此难以充分挖掘专家回答问题的能力特征,影响推荐性能.提出一种基于综合历史和当前问答语义匹配... 传统的知识社区专家推荐方法采用文本相似度匹配机理,并基于问题或专家描述来构建专家特征.这些方法没有利用问题与答案的语义匹配关系,因此难以充分挖掘专家回答问题的能力特征,影响推荐性能.提出一种基于综合历史和当前问答语义匹配的知识社区新问题的专家推荐方法(History-Now Semantics Expert RECommendation model,HNS-EREC).首先,采用反馈评价和负采样技术来处理数据集中的两类不平衡现象;其次,基于问答语义来提取专家回答问题能力特征;最后,提出一种基于问答语义匹配的History-Now联合专家推荐模型,该模型能够实现面向专家的历史问答和当前问答的语义联合学习.实验结果表明,相对于其他方法,本文所提出的HNS-EREC方法在新问题专家推荐方面具有显著的优势. 展开更多
关键词 专家推荐 知识社区 不平衡学习 问答语义 stack overflow
下载PDF
Water hammer protection for diversion systems in front of pumps in long-distance water supply projects 被引量:3
5
作者 Lin Shi Jian Zhang +3 位作者 Xiao-dong Yu Sheng Chen Wen-long Zhao Xu-yun Chen 《Water Science and Engineering》 EI CAS CSCD 2023年第2期211-218,共8页
For a water supply system with long-distance diversion pipelines, in addition to the water hammer problems that occur beyond pumps, the safety of the water diversion pipeline in front of pumps also deserves attention.... For a water supply system with long-distance diversion pipelines, in addition to the water hammer problems that occur beyond pumps, the safety of the water diversion pipeline in front of pumps also deserves attention. In this study, a water hammer protection scheme combined with an overflow surge tank and a regulating valve was developed. A mathematical model of the overflow surge tank was developed, and an analytical formula for the height of the overflow surge tank was derived. Furthermore, a practical water supply project was used to evaluate the feasibility of the combined protection scheme and analyze the sensitivity of valve regulation rules. The results showed that the combined protection scheme effectively reduced the height of the surge tank, lessened the difficulties related to construction, and reduced the necessary financial investment for the project. The two-stage closing rule articulated as fast first and then slow could minimize the overflow volume of the surge tank when the power failure occurred, while the two-stage opening rule articulated as slow first and then fast could be more conducive to the safety of the water supply system when the pump started up. 展开更多
关键词 Long-distance diversion pipeline Water supply Water hammer Overflow surge tank Regulating valve
下载PDF
An Integrated Load Balancing Scheme Based on SDN ASR Algorithm 被引量:1
6
作者 Tao Yu Tao Wang +1 位作者 Hao Chen Jilong Wang 《China Communications》 SCIE CSCD 2023年第3期119-127,共9页
At present,the flow table of the SDN switch is stored in the costly Ternary Content Addressable Memory(TCAM)cache.Due to the cost problem,the number of flow tables that the SDN switch can store is extremely limited,wh... At present,the flow table of the SDN switch is stored in the costly Ternary Content Addressable Memory(TCAM)cache.Due to the cost problem,the number of flow tables that the SDN switch can store is extremely limited,which is far less than the number of traffic,so it is prone to overflow problem,and leads to network paralysis.That has become a bottleneck in restricting the processing capacity of the data center,and will become a weak point focused by attackers.In this paper,we propose an algorithm for the Alarm Switch Remove(ASR)that fully loads the flow table space in SDN,and further put forward an integrated load balancing scheme in SDN.Finally,we use Mininet to verify that the scheme can ease the SDN switch flow table overflow problem and increase network throughput. 展开更多
关键词 software defined network flow-table OVERFLOW load balance
下载PDF
面向专家示例的Stack Overflow本体构造和推理研究
7
作者 阮书鹤 钟林辉 +4 位作者 高荣锦 祝艳霞 陈浩然 卢腾骏 夏子豪 《计算机应用研究》 CSCD 北大核心 2023年第12期3736-3741,共6页
Stack Overflow是一个计算机领域的IT技术问答网站,为了获取问答网站中的专家示例并将其应用于API挖掘中。首先采用Scrapy爬虫框架技术获取Stack Overflow问答网站中的结构化数据,并存储在关系模式中;再使用本体建模工具Protég... Stack Overflow是一个计算机领域的IT技术问答网站,为了获取问答网站中的专家示例并将其应用于API挖掘中。首先采用Scrapy爬虫框架技术获取Stack Overflow问答网站中的结构化数据,并存储在关系模式中;再使用本体建模工具Protégé构建本体,然后使用D2RQ工具实现对关系数据库的知识抽取,将关系模式转换为三元组形式的本体模型;同时,提出了一个面向专家示例的子本体抽取算法,用于从原本体中抽取出专家示例推理相关的子本体,并提出了若干条专家示例推理规则,能推导出专家所编写的代码示例。实验结果证明,从Stack Overflow本体模型中抽取的专家示例能提高API调用序列挖掘的准确率。 展开更多
关键词 Stack Overflow问答网站 本体 本体构建 专家示例推理规则 专家示例
下载PDF
Detection of Buffer Overflow Attacks with Memoization-based Rule Set
8
作者 OğuzÖzger HalitÖztekİn 《Journal of Computer Science Research》 2023年第4期13-26,共14页
Different abnormalities are commonly encountered in computer network systems.These types of abnormalities can lead to critical data losses or unauthorized access in the systems.Buffer overflow anomaly is a prominent i... Different abnormalities are commonly encountered in computer network systems.These types of abnormalities can lead to critical data losses or unauthorized access in the systems.Buffer overflow anomaly is a prominent issue among these abnormalities,posing a serious threat to network security.The primary objective of this study is to identify the potential risks of buffer overflow that can be caused by functions frequently used in the PHP programming language and to provide solutions to minimize these risks.Static code analyzers are used to detect security vulnerabilities,among which SonarQube stands out with its extensive library,flexible customization options,and reliability in the industry.In this context,a customized rule set aimed at automatically detecting buffer overflows has been developed on the SonarQube platform.The memoization optimization technique used while creating the customized rule set enhances the speed and efficiency of the code analysis process.As a result,the code analysis process is not repeatedly run for code snippets that have been analyzed before,significantly reducing processing time and resource utilization.In this study,a memoization-based rule set was utilized to detect critical security vulnerabilities that could lead to buffer overflow in source codes written in the PHP programming language.Thus,the analysis process is not repeatedly run for code snippets that have been analyzed before,leading to a significant reduction in processing time and resource utilization.In a case study conducted to assess the effectiveness of this method,a significant decrease in the source code analysis time was observed. 展开更多
关键词 Buffer overflow CYBERSECURITY ANOMALY SonarQube MEMOIZATION
下载PDF
台山核电厂淡水水源工程水库溢流坝消能试验研究 被引量:2
9
作者 黄智敏 何小惠 +2 位作者 付波 陈卓英 钟勇明 《水电能源科学》 北大核心 2010年第8期76-79,共4页
以台山核电厂淡水水源工程为例,通过水力模型试验研究,推荐溢流坝采用宽尾墩+坝面削角阶梯+底流消力池的联合消能方案。试验结果表明,该方案消能效果较显著、工程量小,优化了溢流坝工程布置和体型。
关键词 核电厂 淡水 水源工程 水库 溢流坝 消能效果 模型试验研究 Nuclear Power Plant Fresh Water OVERFLOW Dam Energy DISSIPATION 消能方案 试验结果 工程布置 消力池 宽尾墩 工程量 优化 体型 水力
下载PDF
Experimental study on inner slope failure mechanism of seawall by coupling effect of storm surge and wave 被引量:2
10
作者 PAN Junning WANG Shupeng +2 位作者 SUN Tianting CHEN Maowen WANG Dengting 《Journal of Oceanology and Limnology》 SCIE CAS CSCD 2019年第6期1912-1920,共9页
In the context of global climate change,the impact of group-occurring ocean dynamic disasters on China's offshore areas is becoming more and more intense.The study of the effect of existing ocean dynamic disasters... In the context of global climate change,the impact of group-occurring ocean dynamic disasters on China's offshore areas is becoming more and more intense.The study of the effect of existing ocean dynamic disasters on offshore hazard-bearing bodies mostly focuses on the effect of single disaster-causing factors,and it is still insufficient to study storm surge and dynamic wave coupling&reinforcement effects as well as the process of the dynamic response of such hazard-bearing bodies as seawalls.This study firstly realized the synchronous process of water level and wave through continuous tide generation and wave generation by the wave maker and tide generating device,so as to realize the dynamic coupling simulation of storm surge and wave in the laboratory.Then the physical model test of the typical seawall section was carried out under the dynamic coupling of storm surge and wave as well as at a conventional fixed water level respectively.In the process of test wave overtopping discharge and the damage process of the levee crown and backwall of seawalls were observed and compared,and their damage mechanism was also studied. 展开更多
关键词 sea DIKE storm surge WAVE OVERTOPPING WAVE LEVEE overflowing coupling
下载PDF
基于数据挖掘的专业可信回答者个性化推荐——以Stack Overflow问答社区为例 被引量:4
11
作者 刘迎春 朱旭 +1 位作者 谢年春 李佳 《现代教育技术》 CSSCI 北大核心 2019年第5期78-84,共7页
针对问答社区中问题不能得到及时、有效解答的现状,文章以Stack Overflow问答社区为例,首先介绍了问答社区数据的采集与预处理情况;然后,通过挖掘学习者信息,得到专业可信回答者、高信誉回答者和徽章回答者三种潜在回答者;最后,实施了... 针对问答社区中问题不能得到及时、有效解答的现状,文章以Stack Overflow问答社区为例,首先介绍了问答社区数据的采集与预处理情况;然后,通过挖掘学习者信息,得到专业可信回答者、高信誉回答者和徽章回答者三种潜在回答者;最后,实施了三种回答者推荐并对比了推荐性能。实验结果表明,与高信誉回答者推荐和徽章回答者推荐相比,考虑回答质量和专业相关性的专业可信回答者推荐具有更高的准确率和召回率,其推荐性能更优。实施基于数据挖掘的专业可信回答者个性化推荐,能有效缓解问答社区的信息过载问题,有助于建设更高效的网络学习社区环境。 展开更多
关键词 专业可信度 回答者推荐 数据挖掘 STACK Overflow问答社区
下载PDF
Numerical Study of Storm Surge Inundation in the Southwestern Hangzhou Bay Region During Typhoon Chan-Hom in 2015 被引量:1
12
作者 WANG Kai HOU Yijun +2 位作者 LI Shuiqing DU Mei LI Rui 《Journal of Ocean University of China》 SCIE CAS CSCD 2020年第2期263-271,共9页
Storm surge inundation is a major concern in marine hazard risk assessment during extreme weather conditions.In this study,a high-resolution coupled model(the ADVanced CIRCulation model+the Simulating WAves Nearshore ... Storm surge inundation is a major concern in marine hazard risk assessment during extreme weather conditions.In this study,a high-resolution coupled model(the ADVanced CIRCulation model+the Simulating WAves Nearshore model)was used to investigate the storm surge inundation in the southwestern Hangzhou Bay region during Typhoon Chan-hom in 2015.The simulated hydrodynamic processes(sea surface wave and storm tide)were validated with measured data from wave buoys and tide gauges,indicating that the overall performance of the model was satisfactory.The storm surge inundation in the coastal area was simulated for several idealized control experiments,including different wave effects(wave-enhanced wind stress,wave-enhanced bottom stress,and wave radiation stress).Dike overflowing cases with different dike heights and dike breaking cases with different dike breach lengths were considered in the simulation.The results highlight the necessity of incorporating wave effects in the accurate simulation of storm surge inundation.Dike height significantly influences the magnitude and phase of the maximum inundation area in the dike overflowing cases,and dike breach length is an important factor impacting the magnitude of the maximum inundation area in the dike breaking cases.This study may serve as a useful reference for accurate coastal inundation simulation and risk assessment. 展开更多
关键词 storm surge typhoon waves dike overflowing dike breaking INUNDATION ADCIRC+SWAN
下载PDF
Numerical simulation of cup hydrodynamic deep drawing
13
作者 郎利辉 康达昌 +3 位作者 张士宏 戴昆 王仲仁 苑世剑 《中国有色金属学会会刊:英文版》 CSCD 2000年第5期631-634,共4页
The simulation of hydrodynamic deep drawing by means of FEM is an efficient method that can relieve experimental burden and find the optimum process parameters. Some problems such as mathematical description of cavity... The simulation of hydrodynamic deep drawing by means of FEM is an efficient method that can relieve experimental burden and find the optimum process parameters. Some problems such as mathematical description of cavity liquid flow pressure must be solved firstly. A math formula about hydrodynamic flow pressure that can be applied in general FEM software was proposed, and good results were gained. It was proved that the theoretical results keep coincident with experimental results.[ 展开更多
关键词 HYDRODYNAMIC DEEP DRAWING overflowing pressure FEM
下载PDF
Stack Overflow上机器学习相关问题的大规模实证研究 被引量:4
14
作者 万志远 陶嘉恒 +4 位作者 梁家坤 才振功 苌程 乔林 周巧妮 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2019年第5期819-828,共10页
为了调查机器学习相关主题分布和发展趋势,从在线问答网站Stack Overflow上,利用过滤标签,从4 178多万帖子中提取出60 028个与机器学习相关的问题帖.通过分析问题帖,统计各个机器学习平台的讨论量,发现Scikit-learn、TensorFlow、Keras... 为了调查机器学习相关主题分布和发展趋势,从在线问答网站Stack Overflow上,利用过滤标签,从4 178多万帖子中提取出60 028个与机器学习相关的问题帖.通过分析问题帖,统计各个机器学习平台的讨论量,发现Scikit-learn、TensorFlow、Keras是前3位频繁被讨论的机器学习平台,占总讨论量的58%.为了进一步分析机器学习相关讨论主题,进行潜在狄利克雷分布(LDA)主题模型训练,提出自适应LDA中的主题数渐进搜索方法,采用主题一致性系数评估输出结果,获得主题最佳数量,从而发现9个讨论主题,分属3个类别:代码相关、模型相关、理论相关.基于主题中问题帖的浏览数、评论数,分析不同主题的流行度和回答困难程度. 展开更多
关键词 实证研究 机器学习 STACK OVERFLOW 潜在狄利克雷分布(LDA) 主题一致性
下载PDF
基于Stack Overflow的数据库相关主题分析 被引量:2
15
作者 刘蕴涵 沙朝锋 牛军钰 《计算机科学》 CSCD 北大核心 2021年第6期48-56,共9页
数据库管理系统虽是一种较为成熟的软件系统,但开发人员在应用数据库系统进行数据管理以及数据分析时还是会遇到各种问题,因此会在Stack Overflow之类的问答论坛上寻求解决方法。文中获取了Stack Overflow上94473条与数据库相关的问题,... 数据库管理系统虽是一种较为成熟的软件系统,但开发人员在应用数据库系统进行数据管理以及数据分析时还是会遇到各种问题,因此会在Stack Overflow之类的问答论坛上寻求解决方法。文中获取了Stack Overflow上94473条与数据库相关的问题,应用LDA主题模型将这些问题归为25个主题,结果显示开发者的问题可归为"表""SQL""SELECT"等主题。通过研究与数据库相关的不同主题的流行度和困难程度发现,"SQL"主题相关的问题较为流行。除此以外,文中还分别研究了3种不同的数据库,即MySQL,Oracle和MongoDB,分析了与不同数据库系统相关的问题的主题分布。文中的研究成果有助于了解数据库开发者所面临的挑战,从而为数据库系统版本更新、数据库课程教学内容的设置,甚至是数据库领域的研究问题提供参考。 展开更多
关键词 Stack Overflow 数据库 LDA 主题建模
下载PDF
Stack Overflow的缺陷代码特征分析与相似缺陷检测 被引量:2
16
作者 亢振兴 赵逢禹 刘亚 《小型微型计算机系统》 CSCD 北大核心 2021年第3期661-665,共5页
目前在软件代码缺陷审查以及缺陷预测中,研究人员对源代码进行分析研究却忽略了代码的缺陷信息.本文通过对缺陷信息进行分析,发现缺陷信息对于相似缺陷的检测有着重要的参考价值.基于这一思想,本文分析软件缺陷社区Stack Overflow中关... 目前在软件代码缺陷审查以及缺陷预测中,研究人员对源代码进行分析研究却忽略了代码的缺陷信息.本文通过对缺陷信息进行分析,发现缺陷信息对于相似缺陷的检测有着重要的参考价值.基于这一思想,本文分析软件缺陷社区Stack Overflow中关于缺陷代码的信息,提出一种基于缺陷代码特征分析的相似缺陷检测方法.该方法首先对缺陷报告进行LDA主题分析并将缺陷报告分类到不同的主题(类别)中,统计得到高频缺陷类别;其次对于高频缺陷类别的缺陷代码提取特征;最后根据缺陷代码特征构建相似缺陷检测模型.为了验证相似缺陷检测模型的有效性,针对数据操作缺陷数据构建诊断模型并对该模型进行实证,实验结果表明该方法对检测其他代码中相似缺陷有较好的效果. 展开更多
关键词 Stack Overflow LDA 缺陷代码特征 特征相似度 相似缺陷检测
下载PDF
基于CBOW-LDA主题模型的Stack Overflow编程网站热点主题发现研究 被引量:4
17
作者 张景 朱国宾 《计算机科学》 CSCD 北大核心 2018年第4期208-214,共7页
Stack Overflow是一个热门的国外编程问答网站,通过对该网站编程提问帖的问题文本进行文本语义挖掘,能获析用户关注的编程热点。由于研究对象所代表的短文本信息具有高维性及分布不均的特点,易导致主题获取不明晰。文中提出一种基于LDA(... Stack Overflow是一个热门的国外编程问答网站,通过对该网站编程提问帖的问题文本进行文本语义挖掘,能获析用户关注的编程热点。由于研究对象所代表的短文本信息具有高维性及分布不均的特点,易导致主题获取不明晰。文中提出一种基于LDA(Latent Dirichlet Allocation)主题模型的CBOW-LDA建模方法,该方法对目标语料进行相似词聚类后再完成主题建模,能有效降低文本输入维度,使主题分布更明确。采集Stack Overflow网站上2010-2015年的问题帖数据集POST,并对其进行实验,同等主题数下采用文本建模中衡量模型性能的评价指标困惑度(Perplexity)来度量算法在不同数据集容量维度下的性能。结果表明,与现有的基于词频权重的词量化主题建模TFLDA方法相比,CBOW-LDA方法的困惑度更低,在实验语料下的困惑度降低约4.87%,证明了所提算法的性能更好。采用CBOW-LDA方法对Stack Overflow进行热点挖掘,同时使用TF-LDA方法进行对比实验,建立手工标注的标准评测集对两种方法获取的热门主题和热搜词汇进行查全率、查准率及F1值的判定,结果证实CBOW-LDA表现更佳,其热点挖掘效果较好。由实验结果可知,Java为该编程网站提问帖中最热门的主题,而C和Javascript则为该网站用户提问中被提及得最频繁的词汇。 展开更多
关键词 STACK OVERFLOW LDA-CBOW语言模型 主题发现 热门主题 困惑度
下载PDF
CodeSearcher:基于自然语言功能描述的代码查询 被引量:1
18
作者 陆龙龙 陈统 +1 位作者 潘敏学 张天 《计算机科学》 CSCD 北大核心 2020年第9期1-9,共9页
在项目开发过程中,开发者需要为实现某一功能而编写代码;在不确定如何使用特定编程语言来实现当前待开发功能时,其往往会在文档或网络资源中进行代码查询。因此,代码查询的有效性会直接影响软件开发的效率。目前,已有相当数量的工具可... 在项目开发过程中,开发者需要为实现某一功能而编写代码;在不确定如何使用特定编程语言来实现当前待开发功能时,其往往会在文档或网络资源中进行代码查询。因此,代码查询的有效性会直接影响软件开发的效率。目前,已有相当数量的工具可以用来辅助开发者进行代码查询,但这些工具普遍存在输入形式复杂或者匹配精确度低等问题。文中提出的CodeSearcher是一种基于自然语言功能描述的代码查询方法。CodeSearcher将软件开发垂直领域的问答网站Stack OverFlow的问答记录转换为〈自然语言描述,代码片段〉数据对,使用神经网络模型将“自然语言描述”和“代码片段”映射到相同的向量空间并进行匹配,从而能够支持开发者使用待开发功能的自然语言描述来查询相应代码。CodeSearcher不同于一般的代码查询系统,一方面,它只需要代码本身而不依赖于代码的注释或说明,因此可以支持更多代码查询的场景;另一方面,它拓展了代码查询的流程,使其不再局限于一次性的查询反馈流程,而是在这中间加入了代码询答的流程,利用返回代码片段之间的差异性元素帮助开发者挑选目标代码,使得开发者不需要详细阅读所有返回的代码片段。实验结果表明,CodeSearcher相较于基准有着更好的效果。 展开更多
关键词 代码查询 自然语言处理 Stack OverFlow
下载PDF
基于Word2Vec的编程领域词语拼写错误检测算法 被引量:3
19
作者 刘峻松 唐明靖 +1 位作者 薛岗 杨成荣 《计算机应用与软件》 北大核心 2022年第3期277-284,共8页
Stack Overflow是一个计算机编程领域的问答社区,其中的文本蕴含大量有价值的信息可供挖掘,但由于其本身存在大量的错误词汇,给文本的分析造成影响。对此,提出一种词语自动检测纠错算法,通过词向量的技术以语义相似度为核心,对错误词汇... Stack Overflow是一个计算机编程领域的问答社区,其中的文本蕴含大量有价值的信息可供挖掘,但由于其本身存在大量的错误词汇,给文本的分析造成影响。对此,提出一种词语自动检测纠错算法,通过词向量的技术以语义相似度为核心,对错误词汇进行分析,结合改进的编辑距离算法对文本进行自动检测纠错。实验结果表明,该算法能够对诸如此类专业性较强的领域主题文本进行自动检测纠错,并且能够较好地还原标准文段用词。 展开更多
关键词 词向量 编辑距离 拼写纠错 Word2Vec Stack Overflow
下载PDF
基于多源信息融合的API知识图谱构建 被引量:1
20
作者 马展 王岩 +1 位作者 王微微 赵瑞莲 《计算机系统应用》 2021年第12期202-210,共9页
API相关的知识通常分散隐含在多个信息源,如API参考文档、问答网站等非结构化的文本中,不利于API的查询与检索.为此,提出一种多源信息融合的API知识图谱构建方法,以提高API检索的效率.API参考文档从设计者角度描述了API的功能和结构,Sta... API相关的知识通常分散隐含在多个信息源,如API参考文档、问答网站等非结构化的文本中,不利于API的查询与检索.为此,提出一种多源信息融合的API知识图谱构建方法,以提高API检索的效率.API参考文档从设计者角度描述了API的功能和结构,Stack Overflow问答网站从用户角度提供了API的使用目的及应用场景,二者互为补充,可共同为API查询与检索提供支持.通过分析API参考文档,抽取API和领域概念作为实体,构建API和领域概念之间的关联关系;利用Stack Overflow问答网站,抽取问答QA和API概念作为实体,构建问答QA和API概念之间的关联关系.在此基础上,将二者进行知识融合,构建多源API知识图谱,以实现基于知识图谱的API推荐.为验证本文方法,分别从知识抽取的准确性和推荐应用两方面对本文构建API知识图谱的有效性进行评估.实验结果表明,基于知识图谱的API推荐,在推荐效果及效率上均有提升. 展开更多
关键词 Stack Overflow 知识抽取 信息融合 知识图谱 信息检索
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部