期刊文献+
共找到263篇文章
< 1 2 14 >
每页显示 20 50 100
Effect of slice scope on data slice-based class cohesion metrics 被引量:3
1
作者 周毓明 徐宝文 《Journal of Southeast University(English Edition)》 EI CAS 2008年第2期174-177,共4页
This paper suggests that a single class rather than methods should be used as the slice scope to compute class cohesion. First, for a given attribute, the statements in all methods that last define the attribute are c... This paper suggests that a single class rather than methods should be used as the slice scope to compute class cohesion. First, for a given attribute, the statements in all methods that last define the attribute are computed. Then, the forward and backward data slices for this attribute are generated by using the class as the slice scope and are combined to compute the corresponding class data slice. Finally, the class cohesion is computed based on all class data slices for the attributes. Compared to traditional cohesion metrics that use methods as the slice scope, the proposed metrics that use a single class as slice scope take into account the possible interactions between the methods. The experimental results show that class cohesion can be more accurately measured when using the class as the slice scope. 展开更多
关键词 COHESION class data slice metrics OBJECT-ORIENTED
下载PDF
Block-based test data adequacy measurement criteria and test complexity metrics
2
作者 陈卫东 杨建军 +1 位作者 叶澄清 潘云鹤 《Journal of Zhejiang University Science》 CSCD 2002年第1期37-41,共5页
On the basis of software testing tools we developed for programming languages, we firstly present a new control flowgraph model based on block. In view of the notion of block, we extend the traditional program\|based ... On the basis of software testing tools we developed for programming languages, we firstly present a new control flowgraph model based on block. In view of the notion of block, we extend the traditional program\|based software test data adequacy measurement criteria, and empirically analyze the subsume relation between these measurement criteria. Then, we define four test complexity metrics based on block. They are J\|complexity 0; J\|complexity 1; J\|complexity \{1+\}; J\|complexity 2. Finally, we show the Kiviat diagram that makes software quality visible. 展开更多
关键词 block NODE SEGMENT control flowgraph model test data adequacy measurement criteria test complexity metric Kiviat diagram
下载PDF
基于Usage Metrics的中文学术论文用户平台偏好和兴趣偏好比较研究 被引量:3
3
作者 陈必坤 周慧娴 +1 位作者 钟周燕 王曰芬 《中国图书馆学报》 CSSCI 北大核心 2018年第6期90-104,共15页
研究中文学术论文用户使用模式有助于分析使用规律,为应用决策提供依据。本文以八个学科被CSSCI或CSCD收录的61本开放获取期刊发表于2014—2015年的学术论文为样本,以期刊官网和信息集成平台上的使用数据为来源,采用Usage Metrics的方法... 研究中文学术论文用户使用模式有助于分析使用规律,为应用决策提供依据。本文以八个学科被CSSCI或CSCD收录的61本开放获取期刊发表于2014—2015年的学术论文为样本,以期刊官网和信息集成平台上的使用数据为来源,采用Usage Metrics的方法,从用户平台偏好和用户兴趣偏好两方面比较中文学术论文的用户使用模式。研究发现:(1)期刊官网与信息集成平台的用户平台偏好存在差异。一是从学科视角看,用户整体上倾向于使用期刊官网而不是信息集成平台获取所需论文,而社会科学的信息集成平台篇均下载次数均大于自然科学。二是从期刊视角看,社会科学用户比自然科学用户更倾向于使用信息集成平台获取所需论文;与信息集成平台相比,期刊官网的用户下载数据呈现更为明显的"两级分化"现象;期刊官网下载次数与信息集成平台下载次数整体上的相关性较低。(2)期刊官网与信息集成平台的用户兴趣偏好存在差异。每本期刊官网和信息集成平台下载次数前20%的学术论文的Jaccard相似系数较低;在所列举的图书馆、情报与文献学中,期刊官网与信息集成平台的用户关注主题不同。 展开更多
关键词 学术文献 使用数据 USAGE Metdcs 学术期刊 学术交流 使用模式
下载PDF
中文学术成果评价的Altmetrics发展及实践路径 被引量:5
4
作者 韩毅 《西华大学学报(哲学社会科学版)》 2018年第1期81-86,共6页
为有效解决中文学术成果评价的Altmetrics应用问题,针对中文环境下Altmetrics评价数据基础设施缺失现状,在综述Altmetrics思想、方法、技术发展历程及中文学术成果应用实践的基础上,提出中文学术成果Altmetrics评价需要解决三方面的问题... 为有效解决中文学术成果评价的Altmetrics应用问题,针对中文环境下Altmetrics评价数据基础设施缺失现状,在综述Altmetrics思想、方法、技术发展历程及中文学术成果应用实践的基础上,提出中文学术成果Altmetrics评价需要解决三方面的问题:利益相关者的Altmetrics应用诉求识别,中文Altmetrics工具开发,以引文为基础的传统计量与以网络空间数据为基础的Altmetrics计量的融合模型。只有解决中文环境下Altmetrics评价的这些基础性问题,中文学术成果评价才会具有坚实的数据基础设施。 展开更多
关键词 中文学术成果 成果评价 Altmetrics 利益相关者 网络数据基础设施 计量融合模型 数据搜集与分析 工具
下载PDF
基于METRIC模型的巴基斯坦农业区蒸散量估算
5
作者 张萧楠 沈彦军 +3 位作者 李红军 张晓龙 李琪云 王艺璇 《中国生态农业学报(中英文)》 CAS CSCD 北大核心 2024年第11期1927-1939,共13页
蒸散量是水分循环和能量循环的重要载体,精确估算农田蒸散量对农业水资源管理具有重要意义。巴基斯坦农业区是世界上重要的灌溉农区之一,如何基于遥感技术估算区域实际蒸散量成为农业水资源精细化管理的基础和前提。本文利用MODIS数据... 蒸散量是水分循环和能量循环的重要载体,精确估算农田蒸散量对农业水资源管理具有重要意义。巴基斯坦农业区是世界上重要的灌溉农区之一,如何基于遥感技术估算区域实际蒸散量成为农业水资源精细化管理的基础和前提。本文利用MODIS数据、气象数据以及DEM数据,采用METRIC模型,估算了2019—2020年巴基斯坦农业区的实际蒸散量,并分析了不同作物生育期蒸散量的时空分布特征,以期为巴基斯坦农业水资源合理利用提供科学依据。研究结果表明:1)比较基于METRIC模型在日尺度和月尺度的蒸散估算结果与农业站点蒸渗仪的实际观测数据发现,二者的均方根误差分别为1.2 mm∙d^(−1)和25 mm∙month^(−1),相关系数分别为0.65和0.84;在空间上,与ETMonitor产品比较,METRIC模型估算结果的空间分布和量级更为合理。2)巴基斯坦农业区蒸散量的空间分布与种植结构密切相关,蒸散量自北向南总体呈阶梯递减格局,小麦、棉花、水稻和甘蔗生育期累积蒸散量分别为392 mm、652 mm、745 mm和1224 mm;就同一种作物来说,旁遮普省作物生育期累积蒸散量高于信德省。3)小麦生育期内月蒸散量呈先下降再上升后下降的变化特征;旁遮普省棉花生育期内月蒸散量呈“单峰”变化特征,信德省棉花生育期内月蒸散量呈“双峰”变化特征;水稻和甘蔗生育期内月蒸散量呈“单峰”变化特征。本研究实现了METRIC模型在巴基斯坦农业区的参数本地化应用和适用性分析,为基于遥感手段估算区域或农作物尺度蒸散量提供了方法借鉴,对揭示不同作物蒸散耗水的时空特征和区域农业水资源管理具有重要意义。 展开更多
关键词 蒸散量 metric模型 能量平衡 MODIS数据 巴基斯坦农业区
下载PDF
Mining Metrics for Enhancing E-Commerce Systems User Experience
6
作者 Antonia Stefani 《Intelligent Information Management》 2022年第1期25-51,共27页
The diversity of e-commerce Business to Consumer systems and the significant increase in their use during the COVID-19 pandemic as a one of the primary channels of retail commerce, has made all the most important the ... The diversity of e-commerce Business to Consumer systems and the significant increase in their use during the COVID-19 pandemic as a one of the primary channels of retail commerce, has made all the most important the need to measuring their quality using practical methods. This paper presents a quality evaluation framework for web metrics that are B2C specific. The framework uses three dimensions based on end-user interaction categories, metrics internal specs and quality sub-characteristics as defined by ISO25010. Beginning from the existing large corpus of general-purpose web metrics, e-commerce specific metrics are chosen and categorized. Analysis results are subjected to a data mining analysis to provide association rules between the various dimensions of the framework. Finally, an ontology that corresponds to the framework is developed to answer to complicated questions related to metrics use and to facilitate the production of new, user defined meta-metrics. 展开更多
关键词 E-COMMERCE Web metrics Quality Attributes data Mining Association Rules Evaluation Framework TAXONOMY ONTOLOGY ISO25010
下载PDF
A Framework for Identifying and Managing Information Quality Metrics of Corporate Performance Management System
7
作者 Kunlaya Pattanagul Wachara Chantatub Wasu Chaopanon 《Journal of Modern Accounting and Auditing》 2012年第2期185-194,共10页
Corporate Performance Management (CPM) system is an information system used to collect, analyze, and visualize key performance indicators (KPIs) to support both business operations and especially strategic decisio... Corporate Performance Management (CPM) system is an information system used to collect, analyze, and visualize key performance indicators (KPIs) to support both business operations and especially strategic decisions. CPM systems display KPIs in forms of scorecard and dashboard so the executives can keep track and evaluate corporate performance. The quality of the information as shown in the KPIs is very crucial for the executives to make the right decisions. Therefore, it is important that the executives must be able to retrieve not only the KPIs but also the quality of those KPIs before using such KPIs in their strategic decisions. The objectives of this study were to determine the role of the CPM system in the organizations, current data and information quality state, problems and perspectives regarding data quality, as well as data quality maturity stage of the organizations. Survey research was used in this study; a questionnaire was sent to collect data from 477 corporations listed in the Stock Exchange of Thailand (SET) on January, 2011. Forty-nine questionnaires were returned. The results show that about half of the organizations have implemented CPM systems. Most organizations are confident in the information in CPM system, but information quality issues are commonly found. Frequent problems regarding information quality are information not up to date, information not ready by time of use, inaccuracy and incomplete. The most concerned and frequently assessed quality dimensions were security, accuracy, completeness, and validity. When asked to prioritize, the most important quality dimensions are accuracy, timeliness, completeness, security, and validity respectively. In addition, most organizations concern about data govemance management and have deployed such measures. This study showed that most organizations are on level 4 on Gartner's data governance maturity stage in which data governance is concerned and managed, but still not effective. 展开更多
关键词 data quality corporate performance management (CPM) system data quality metrics key performanceindicators (KPIs) data maturity and management
下载PDF
Exploring users' within-site navigation behavior:A case study based on clickstream data 被引量:1
8
作者 Tingting JIANG Yu CHI Wenrui JIA 《Chinese Journal of Library and Information Science》 2014年第4期63-76,共14页
Purpose:The goal of our research is to suggest specific Web metrics that are useful for evaluating and improving user navigation experience on informational websites.Design/methodology/approach:We revised metrics in a... Purpose:The goal of our research is to suggest specific Web metrics that are useful for evaluating and improving user navigation experience on informational websites.Design/methodology/approach:We revised metrics in a Web forensic framework proposed in the literature and defined the metrics of footprint,track and movement.Data were obtained from user clickstreams provided by a real estate site’s administrators.There were two phases of data analysis with the first phase on navigation behavior based on user footprints and tracks,and the second phase on navigational transition patterns based on user movements.Findings:Preliminary results suggest that the apartment pages were heavily-trafficked while the agent pages and related information pages were underused to a great extent.Navigation within the same category of pages was prevalent,especially when users navigated among the regional apartment listings.However,navigation of these pages was found to be inefficient.Research limitations:The suggestions for navigation design optimization provided in the paper are specific to this website,and their applicability to other online environments needs to be verified.Preference predications or personal recommendations are not made during the current stage of research.Practical implications:Our clickstream data analysis results offer a base for future research.Meanwhile,website administrators and managers can make better use of the readily available clickstream data to evaluate the effectiveness and efficiency of their site navigation design.Originality/value:Our empirical study is valuable to those seeking analysis metrics for evaluating and improving user navigation experience on informational websites based on clickstream data.Our attempts to analyze the log file in terms of footprint,track and movement will enrich the utilization of such trace data to engender a deeper understanding of users’within-site navigation behavior. 展开更多
关键词 Web navigation User behavior Clickstream data analysis metrics Resale apartment website
下载PDF
Multi-Attribute Couplings-Based Euclidean and Nominal Distances for Unlabeled Nominal Data
9
作者 Lei Gu Furong Zhang Li Ma 《Computers, Materials & Continua》 SCIE EI 2023年第6期5911-5928,共18页
Learning unlabeled data is a significant challenge that needs to han-dle complicated relationships between nominal values and attributes.Increas-ingly,recent research on learning value relations within and between att... Learning unlabeled data is a significant challenge that needs to han-dle complicated relationships between nominal values and attributes.Increas-ingly,recent research on learning value relations within and between attributes has shown significant improvement in clustering and outlier detection,etc.However,typical existing work relies on learning pairwise value relations but weakens or overlooks the direct couplings between multiple attributes.This paper thus proposes two novel and flexible multi-attribute couplings-based distance(MCD)metrics,which learn the multi-attribute couplings and their strengths in nominal data based on information theories:self-information,entropy,and mutual information,for measuring both numerical and nominal distances.MCD enables the application of numerical and nominal clustering methods on nominal data and quantifies the influence of involving and filtering multi-attribute couplings on distance learning and clustering perfor-mance.Substantial experiments evidence the above conclusions on 15 data sets against seven state-of-the-art distance measures with various feature selection methods for both numerical and nominal clustering. 展开更多
关键词 Nominal data distance metrics attribute couplings dissimilarity measures
下载PDF
文本分类算法及其应用场景研究综述 被引量:3
10
作者 刘晓明 李丞正旭 +7 位作者 吴少聪 张宇辰 白红艳 程泽华 陈卓 李永峰 兰钰 沈超 《计算机学报》 EI CAS CSCD 北大核心 2024年第6期1244-1287,共44页
随着大数据时代的到来,互联网中的文本信息迎来了井喷式的增长.文本分类作为自然语言处理中最重要的技术之一,其广泛应用于多个领域,如情感分析、新闻分类、自然语言推理、主题标记、抽取式问答、虚假内容检测等.从传统机器学习分类方... 随着大数据时代的到来,互联网中的文本信息迎来了井喷式的增长.文本分类作为自然语言处理中最重要的技术之一,其广泛应用于多个领域,如情感分析、新闻分类、自然语言推理、主题标记、抽取式问答、虚假内容检测等.从传统机器学习分类方法理论的深入到深度学习分类方法探索的兴起,相关研究模型与思路也在不断演变,各类新的方法、数据集和评价指标层出不穷,丰富了文本分类领域的研究,取得了卓越的理论成就和应用效果.尽管如此,新技术不断发展和业务应用场景不断丰富,同时,也为文本分类研究带来了许多新的问题与挑战,如数据约束场景中不均衡数据的文本表征学习、小样本场景下的文本分类等.针对当前研究难题与挑战,本文对文本分类方法进行了系统性调研,并对当前方法在实际应用场景中面临的技术挑战和未来的研究方向进行了综合探讨.具体而言,本文主要综述了七部分内容,分别是:(1)对文本分类技术的相关基础知识进行了全面介绍,包括文本分类的常见符号定义、计算范式和文本预处理技术;(2)对基于传统机器学习的文本分类方法进行了详细总结;同时,为了方便读者针对不同的应用场景选择合适的分类模型,本文对不同分类器擅长处理的文本分类难题及方法优劣进行了总结;(3)对基于新兴深度学习的文本分类方法进行了周详梳理,根据领域内代表性技术的核心思想进行分类,在此基础上对不同类别下的主要方法进行描述,同时对其技术的优劣进行了总结;(4)为了方便读者对文本分类模型的有效性进行验证,针对文本分类技术应用最为广泛的七大场景,本文对相关数据集进行了系统性的总结;(5)本文对不同任务目标下的常用的模型评价方法进行详尽介绍,以便对模型性能进行合理的定量评估;(6)基于上述内容,本文对典型应用场景中不同种类文本分类算法进行了性能总结对比;(7)本文分别从数据约束与模型计算两个层面对当前文本分类技术所面临的挑战和未来的重要研究方向进行了总结.本文通过梳理文本分类研究发展脉络,对涉及的代表性技术进行了详细总结和对比分析,有效填补了文本分类领域前沿技术的应用综述空白. 展开更多
关键词 文本分类 机器学习 深度学习 评价指标 数据约束
下载PDF
Cyclomatic Complexity-Based Encapsulation, Data Hiding, and Separation of Concerns
11
作者 Charles W. Butler Thomas J. McCabe 《Journal of Software Engineering and Applications》 2021年第1期44-66,共23页
<div style="text-align:justify;"> <span style="font-family:Verdana;">Three design principles are prominent in software development-encapsulation, data hiding, and separation of concerns... <div style="text-align:justify;"> <span style="font-family:Verdana;">Three design principles are prominent in software development-encapsulation, data hiding, and separation of concerns. These principles are used as subjective quality criteria for both procedural and object-oriented applications. The purpose of research is to quantify encapsulation, data hiding, and separation of concerns is quantified using cyclomatic-based metrics. As a result of this research, the derived design metrics, coefficient of encapsulation, coefficient of data hiding, and coefficient of separation of concerns, are defined and applied to production software indicating whether the software has low or high encapsulation, data hiding, and separation of concerns.</span> </div> 展开更多
关键词 Object-Oriented Design Methods RELIABILITY Complexity Measures Software Design ENCAPSULATION Information Hiding Separation of Concerns McCabe metrics Coefficient of Encapsulation Coefficient of data Hiding Coefficient of Separation of Concerns
下载PDF
数据论文引用计量规律初探——基于中国数据期刊的案例研究
12
作者 张丽丽 惠嘉怡 刘瑞霖 《中国科学数据(中英文网络版)》 CSCD 2024年第1期366-388,共23页
数据出版是一种创新数据共享形式。为更好地了解数据出版,本文通过文献综述和案例调研,构建了数据论文计量框架,遴选国内数据期刊《中国科学数据(中英文网络版)》和《全球变化数据学报(中英文)》,揭示两刊数据出版与数据共享情况。统计... 数据出版是一种创新数据共享形式。为更好地了解数据出版,本文通过文献综述和案例调研,构建了数据论文计量框架,遴选国内数据期刊《中国科学数据(中英文网络版)》和《全球变化数据学报(中英文)》,揭示两刊数据出版与数据共享情况。统计涵盖两刊论文指标(学科领域、团队规模、资金来源)、数据指标(数据来源、规格与规模、数据曝光)、引证指标(被引、施引、时间)等30余个特征项。结果显示,宏观趋势方面,数据出版成为数据共享的重要途径,并在规范数据质量、汇聚特色主题数据、推进团队合作、争取资金支持等方面具有优势。中观运营层面,国家数据中心为数据出版提供平台保障。微观资源层面,出版数据集兼具学科差异性和跨域共性治理需求。其中,数据曝光、访问引用转化率等指标,为数据可复用性测度提供线索。此外,独立数据出版在我国尚处发展上升期,建议加强数据文化建设、扩展运营模式、提升资源治理能力与平台建设水平,完善技术迭代与激励评价机制等。 展开更多
关键词 开放数据 数据论文 数据出版 数据重用 数据引用 引用计量
下载PDF
综合天气相似分析方法及其气象预报服务应用
13
作者 李宇中 董良淼 +3 位作者 梁存桂 刘国忠 覃月凤 黄伊曼 《气象科技》 2024年第4期571-582,共12页
为改进传统“切片”式天气形势相似分析方法存在的不同切片相似结果不一致、预报稳定性欠佳问题,借鉴大数据思维,将天气系统视为一个由高中低层大气相互配合、静力热力动力条件相互影响的综合体,以多种气象要素再分析格点资料为基础,采... 为改进传统“切片”式天气形势相似分析方法存在的不同切片相似结果不一致、预报稳定性欠佳问题,借鉴大数据思维,将天气系统视为一个由高中低层大气相互配合、静力热力动力条件相互影响的综合体,以多种气象要素再分析格点资料为基础,采用机器学习PCA方法对原始数据进行降维、浓缩,经归一化处理后构建出适于综合天气相似分析的样本衍生特征因子矩阵;然后使用KNN算法计算样本间各特征维度的相似距离、并结合方差贡献率赋予其相应的权重,最终按综合相似距离大小排序给出目标样本在历史天气形势库中的综合最相似序列,从而实现对传统相似天气预报方法的升级改进。对比分析和测试应用表明,该方法可提供多要素、多层次“立体”综合相似下的一致性结论,有助于预报员更好地理解天气系统结构和演变过程、进而更准确地研判可能发生的相关天气现象,在精细化气象预报服务方面有良好的应用前景。在2023年以来的几次广西区域性极端降水气象预报服务中,该方法取得了较为显著的应用效果。 展开更多
关键词 数据驱动 相似距离 PCA降维 衍生特征 KNN
下载PDF
基于数据挖掘的慢性疲劳综合征动物模型的评价 被引量:1
14
作者 李亚青 王灿 苗明三 《中国比较医学杂志》 CAS 北大核心 2024年第4期54-64,共11页
目的研究慢性疲劳综合征动物模型的应用情况,为其动物实验方法和模型完善提供参考。方法以“慢性疲劳综合征、动物模型”“Chronic fatigue syndrom,animal model”等为检索词,在中国知网、万方、PubMed数据库进行检索,整理2000年7月~2... 目的研究慢性疲劳综合征动物模型的应用情况,为其动物实验方法和模型完善提供参考。方法以“慢性疲劳综合征、动物模型”“Chronic fatigue syndrom,animal model”等为检索词,在中国知网、万方、PubMed数据库进行检索,整理2000年7月~2023年7月慢性疲劳综合征动物模型的文献,对实验动物、造模方法、阳性药、检测指标等内容进行整理,建立数据库进行统计、分析。结果共纳入有效文献155篇;实验动物以SPF级、体重集中在180~220 g的雄性SD大鼠最多;小鼠应用最多的是18~22 g的SPF级雄性KM小鼠;应用最多的阳性药是人参皂苷片;应用最多的造模方法是“强制冷水游泳+慢性束缚”法,造模周期多集中在14 d,大多采用边造模边干预的方式;检测指标以行为学为主,主要包括力竭游泳实验、旷场实验、鼠尾悬吊实验、Morris水迷宫实验以及动物一般状态观察,其次是血清生化指标,检测最多的是血清MDA、SOD、TNF-α、IL-1β、CORT、IL-2、IFN-γ、ACTH、GSH-Px、IgG、IgA、IL-6等;根据研究目的不同选择其余多种检测指标,包括脾、胸腺等脏器指数测定、HE病理染色和超微结构电镜检测的形态学指标、免疫组化相关指标、实时荧光定量PCR检测法和Western blot法检测相关mRNA及蛋白表达指标,检测种类繁多但应用频率均不高;目前动物模型主要用于研究干预效果、探究病因病机及机制。结论目前慢性疲劳综合征的发病机制尚不明确,动物模型以“强制冷水游泳+慢性束缚”的应激造模方法为主,模拟人类身体和心理疲劳状态;动物模型成模标准尚无统一规定,模型评价方式以各种行为学实验单独或组合应用为主,多数文献中客观评价指标多用于病因病机猜想的论证及干预措施有效性评价;各项检测指标应用结果表明慢性疲劳综合征可能与炎症反应、神经功能障碍和线粒体功能异常等因素有关,其发病机制中可能存在免疫功能、能量代谢、细胞增殖和细胞死亡的异常状况,挖掘内容有望为模型应用提供参考,为模型完善提供思路。 展开更多
关键词 慢性疲劳综合 动物模型 评价指标 数据挖掘 综述
下载PDF
路侧感知车辆轨迹数据的质量评估方法
15
作者 雷财林 赵聪 +2 位作者 娄刃 暨育雄 杜豫川 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期56-72,共17页
路侧传感器已大量部署在高速公路上,用来实时采集路段全样本车辆轨迹数据,为交通流全时空管控、微观驾驶行为分析等提供数据支持,但数据质量的快速评估一直是困扰行业管理部门的难题。现有的车辆轨迹数据评估方法大多存在操作复杂、维... 路侧传感器已大量部署在高速公路上,用来实时采集路段全样本车辆轨迹数据,为交通流全时空管控、微观驾驶行为分析等提供数据支持,但数据质量的快速评估一直是困扰行业管理部门的难题。现有的车辆轨迹数据评估方法大多存在操作复杂、维度单一等问题,难以满足对动态交通流中实时产生的车辆轨迹数据的评价需求。为快速判别路侧毫米波雷达车辆轨迹数据的质量,文中通过挖掘数据自身信息提出了一种数据质量评价方法。首先,在分析实测轨迹数据典型问题的基础上,从轨迹完整性、一致性、准确性及有效性4个维度建立了9个二级评价指标;然后,基于CRITIC赋权法计算综合指标;最后,针对4种不同场景的3549条毫米波雷达实测轨迹进行了实证分析。结果表明,毫米波雷达的安装方式、型号等会显著影响车辆轨迹数据的质量,所提出的数据质量评价方法能够量化不同车辆轨迹数据的质量差异。文中研究结果可为路侧传感器采集数据性能衰变的短时监测及数据采集设备的选型提供支持,也可为车辆轨迹数据质量的提升提供方法参考。 展开更多
关键词 智能交通 路侧毫米波雷达 车辆轨迹数据 数据质量 CRITIC赋权法 评价指标体系
下载PDF
基于小样本学习的口语理解方法综述
16
作者 刘纳 郑国风 +3 位作者 徐贞顺 林令德 李晨 杨杰 《郑州大学学报(工学版)》 北大核心 2024年第1期78-89,共12页
小样本口语理解是目前对话式人工智能亟待解决的问题之一。结合国内外最新研究现状,系统地梳理了口语理解任务的相关文献。简要介绍了在非小样本场景中口语理解任务建模的经典方法,包括无关联建模、隐式关联建模、显式关联建模以及基于... 小样本口语理解是目前对话式人工智能亟待解决的问题之一。结合国内外最新研究现状,系统地梳理了口语理解任务的相关文献。简要介绍了在非小样本场景中口语理解任务建模的经典方法,包括无关联建模、隐式关联建模、显式关联建模以及基于预训练范式的建模方法;重点阐述了在小样本口语理解任务中为解决训练样本受限问题而提出的基于模型微调、基于数据增强和基于度量学习3类方法,介绍了如ULMFiT、原型网络和归纳网络等代表性模型。在此基础上对不同模型的语义理解能力、可解释性、泛化能力等性能进行分析对比。最后对口语理解任务面临的挑战和未来发展方向进行讨论,指出零样本口语理解、中文口语理解、开放域口语理解以及跨语言口语理解等研究内容是该领域的研究难点。 展开更多
关键词 口语理解 小样本学习 模型微调 数据增强 度量学习
下载PDF
一种基于数据增强的科技文献关键词提取模型
17
作者 程芮 张海军 《情报杂志》 CSSCI 北大核心 2024年第1期135-141,120,共8页
[研究目的]科技文献关键词提取研究具有重要价值,目前研究中关键词提取方法存在较大误差且只能提取文本中的关键词,难以根据深层语义信息提炼出更符合文本核心主旨的词语。本研究针对关键词提取对上下文隐含语义挖掘不足导致的局限性和... [研究目的]科技文献关键词提取研究具有重要价值,目前研究中关键词提取方法存在较大误差且只能提取文本中的关键词,难以根据深层语义信息提炼出更符合文本核心主旨的词语。本研究针对关键词提取对上下文隐含语义挖掘不足导致的局限性和重点信息关注不足问题开展研究。[研究方法]提出一种基于数据增强的关键词提取模型(GPT-2 BiLSTM Mul-Attention,GPBA),通过语言模型进行数据增强,并结合BiLSTM+Mul-Attention提取模型进行多特征语义信息融合理解。[研究结论]实验结果表明,基于数据增强的关键词提取模型GPBA总体表现优于其他基线模型,并且能更精确地凝练和提取文本中的关键词。 展开更多
关键词 科技文献 关键词提取模型 数据增强 语义信息 评估指标
下载PDF
基于节点中心性和热度的数据布局方法
18
作者 汪雨 韩锐 党寿江 《网络新媒体技术》 2024年第5期34-41,共8页
随着5G和大数据的飞速发展,海量数据的快速、持久存储需求对存储设备和网络性能提出了极大挑战。信息中心网络以及边缘存储等技术的出现,使数据能够在网络边缘就近存储,减少了数据传输时延。但数据长期存储在网络边缘势必会引发边缘节... 随着5G和大数据的飞速发展,海量数据的快速、持久存储需求对存储设备和网络性能提出了极大挑战。信息中心网络以及边缘存储等技术的出现,使数据能够在网络边缘就近存储,减少了数据传输时延。但数据长期存储在网络边缘势必会引发边缘节点空间不足的问题,迫使数据传向更远方,降低存储效率。针对上述问题,提出一种基于节点中心性和热度的数据布局方法,利用节点空闲时间将高空间负载节点的数据迁移至低空间负载的节点,确保边缘高热度的节点空间富余。实验结果表明,相比较Random和一致性Hash等存储布局方案,在进行长期存储任务后,该方法能在边缘空间相对不足的情况下,减少存储数据时的传输开销,使数据写入时间减少30%以上。 展开更多
关键词 信息中心网络 数据存储 数据布局 负载均衡 中心性度量
下载PDF
基于生成对抗网络与度量学习的数据驱动频率安全评估 被引量:1
19
作者 李华瑞 李文博 +5 位作者 李铮 贾宇乔 刘全 缪德炀 李雅然 王宝财 《电力系统保护与控制》 EI CSCD 北大核心 2024年第18期101-111,共11页
随着大容量远距离高压直流输电工程的建设和大规模可再生能源的接入,电力系统的频率安全面临严峻挑战。为了对频率安全进行快速准确的在线评估,提出一种基于度量学习与生成对抗网络技术的数据驱动频率安全评估模型。首先,选取关键频率... 随着大容量远距离高压直流输电工程的建设和大规模可再生能源的接入,电力系统的频率安全面临严峻挑战。为了对频率安全进行快速准确的在线评估,提出一种基于度量学习与生成对抗网络技术的数据驱动频率安全评估模型。首先,选取关键频率安全指标作为模型输出,并构建输入特征集。然后,使用改进的基于Wasserstein距离度量的生成对抗网络(Wasserstein generative adversarial network, WGAN)学习电力系统历史运行场景分布信息,生成覆盖系统典型运行方式的运行场景以构建训练样本集。计及电力系统复杂运行方式下单个机器学习模型对频率安全评估的不适用性,基于核回归度量学习(metric learning for kernel regression, MLKR)算法构建由多个子模型构成的频率安全组合评估模型。最后使用简化的山东电网算例,验证了所提方法的有效性。 展开更多
关键词 频率安全 机器学习 数据驱动 生成对抗网络 度量学习
下载PDF
数据驱动的自我调节学习动态评价模型研究
20
作者 孔维梁 张俊凯 +1 位作者 韩淑云 叶海智 《数字教育》 2024年第1期19-25,共7页
对学习者自我调节学习过程的准确评价,是实现教学干预的必要前提。然而,已有评价方法多为总结性评价,实时性不足。为此,本研究提出了数据驱动的自我调节学习动态评价模型。以学习任务为单位对学习过程进行时序化处理,并构建学习过程中... 对学习者自我调节学习过程的准确评价,是实现教学干预的必要前提。然而,已有评价方法多为总结性评价,实时性不足。为此,本研究提出了数据驱动的自我调节学习动态评价模型。以学习任务为单位对学习过程进行时序化处理,并构建学习过程中生成性数据到自我调节学习状态的映射关系。研究结果表明:(1)生成性数据是评价学习者自我调节学习状态的有力因素,模型具有较高的有效性。(2)学习者的自我调节学习状态在不同评价维度呈现出差异性变化趋势,其中任务分析、自我激励的信念和自我观察维度趋于稳定,而自我控制、自我判断和自我反应3个维度呈现明显波动性变化。(3)高低绩效群体在自我激励的信念、自我控制和自我反应3个评价维度上表现出显著差异,而在任务分析、自我观察和自我判断有3个维度上没有统计学差异。 展开更多
关键词 自我调节学习 生成性数据 指标体系 人工智能 学习分析
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部