期刊文献+
共找到154篇文章
< 1 2 8 >
每页显示 20 50 100
数据标注在智能家居领域的应用研究
1
作者 李坤 温锦辉 +2 位作者 张懿 田立勤 栾尚敏 《微型电脑应用》 2024年第3期23-25,共3页
将数据标注运用到智能家居系统中,通过摄像头、传感器等设备采集图片、视频、文本、语音数据,标注场景有面部识别、家具的标记、语音采集、人脸关键信息点提取、突发事件采集等。通过数据标注技术对人的行为、表情、言语进行识别,主要使... 将数据标注运用到智能家居系统中,通过摄像头、传感器等设备采集图片、视频、文本、语音数据,标注场景有面部识别、家具的标记、语音采集、人脸关键信息点提取、突发事件采集等。通过数据标注技术对人的行为、表情、言语进行识别,主要使用ImageNet数据集、Youtube-8M数据集、Yelp数据集、LibriSpeech数据集等分别作为图像、视频、文本和语音标注的标注数据数据集。对图像标注方法进行改善,通过图像标注对居民的安全处境、情绪状态等做出相应识别处理,从而解决家庭里的各种问题。 展开更多
关键词 数据标注 智能家居 信息点提取 安全
下载PDF
行业标准《人工智能医疗器械 质量要求和评价 第3部分:数据标注通用要求》解析
2
作者 郝烨 王浩 李佳戈 《协和医学杂志》 CSCD 2023年第6期1185-1188,共4页
伴随机器学习技术的迭代升级,人工智能已成为医疗器械领域的新兴方向,尤其近年来发展迅速。国家药品监督管理局于2022年发布了行业标准YY/T 1833《人工智能医疗器械质量要求和评价》系列标准,标志着我国已初步建立了人工智能医疗器械的... 伴随机器学习技术的迭代升级,人工智能已成为医疗器械领域的新兴方向,尤其近年来发展迅速。国家药品监督管理局于2022年发布了行业标准YY/T 1833《人工智能医疗器械质量要求和评价》系列标准,标志着我国已初步建立了人工智能医疗器械的标准体系。数据标注是人工智能医疗器械质控的重要环节,数据标注的规范化、标准化不仅是标准体系的重要方面,也决定了参考标准的准确性和可靠性,从而对数据集质量和产品质量产生重要影响。《人工智能医疗器械质量要求和评价》第3部分为数据标注通用要求,其对人工智能医疗器械在数据标注环节的质量进行了要求,并对评价方法进行了规范。本文将对其重要内容进行解析,以期更好地开展产品质控,促进产品及行业高质量发展。 展开更多
关键词 数据标注 人工智能医疗器械 产品质控 数据
下载PDF
云上车间中的劳动折叠:人工智能数据标注的劳动过程研究 被引量:2
3
作者 戴宇辰 袁冰雨 《福建师范大学学报(哲学社会科学版)》 2023年第3期108-121,170,共15页
数据标注员是当前人工智能产业从业者中的一个典型工种。通过对其具体劳动过程的研究发现,平台技术对劳动过程的一个显著改变在于部分劳动呈现为一种“幽灵化”的状态:首先,工厂车间的云端化成为幽灵劳动诞生的前提。以“公会”为核心... 数据标注员是当前人工智能产业从业者中的一个典型工种。通过对其具体劳动过程的研究发现,平台技术对劳动过程的一个显著改变在于部分劳动呈现为一种“幽灵化”的状态:首先,工厂车间的云端化成为幽灵劳动诞生的前提。以“公会”为核心形式的众包式、分包式网络可以完成从认领工作、准备生产材料到完成生产、分发薪资等一系列流程的组织。其次,可见性的改变是劳动幽灵化的核心轴承,平台技术通过对可见性的精巧控制,实现了劳动者与监督者肉身的实际消失。进而,劳动协作不再是人与人之间的流水线生产,而变成了机器安排下的技术延伸。最后,以平台为中心的数字关系本身也呈现为一种幽灵般的抽象结构,它遮蔽了传统的社会关系,使得劳动者的职业认同显得矛盾重重。 展开更多
关键词 幽灵劳动 平台劳动 数据标注 零工经济
下载PDF
人工智能背后不可或缺的“人工”——关于贵州自动驾驶汽车的图像数据标注员的调研 被引量:1
4
作者 黄瑜 旷轶丹 《清华社会学评论》 2023年第2期56-85,共30页
2020年,数据标注员成为国家认定的新职业——人工智能训练师。但颇具争议的是,劳动者到底扮演着“训练师”还是“AI富士康工人”的角色?本文结合STS对人工智能的探讨,对贵州自动驾驶汽车的图像数据标注员的劳动贡献和劳动状况进行研究... 2020年,数据标注员成为国家认定的新职业——人工智能训练师。但颇具争议的是,劳动者到底扮演着“训练师”还是“AI富士康工人”的角色?本文结合STS对人工智能的探讨,对贵州自动驾驶汽车的图像数据标注员的劳动贡献和劳动状况进行研究。笔者发现,一方面,人力贡献因其“具身性”和“默会知识”的特征而对算法的机器学习起着不可替代的作用;另一方面,图像数据标注员在众包的劳动关系中面临权益无保障及身心受损的困境。 展开更多
关键词 人工智能 数据标注 具身性 默会知识 不稳定劳动
下载PDF
ChatGPT背后的数据标注产业链 被引量:1
5
作者 孙媛媛 《小康》 2023年第9期39-41,共3页
制作于公元前196年的罗塞塔石碑(Rosetta Stone),刻有古埃及国王托勒密五世登基的诏书。石碑上用古希腊文、古埃及象形文以及当时埃及平民使用的通俗体文字刻了同样的内容,这让考古学家解读出失传千余年的埃及象形文的意义与结构,找到... 制作于公元前196年的罗塞塔石碑(Rosetta Stone),刻有古埃及国王托勒密五世登基的诏书。石碑上用古希腊文、古埃及象形文以及当时埃及平民使用的通俗体文字刻了同样的内容,这让考古学家解读出失传千余年的埃及象形文的意义与结构,找到读懂古埃及的密码。在AI领域,为了让机器读懂人类世界,同样有一块“罗塞塔石碑”——数据标注,它的存在让大规模训练数据的机器学习成为可能。 展开更多
关键词 机器学习 数据标注 训练数据 象形文 托勒密 古埃及 CHAT 古希腊文
下载PDF
人工智能时代数据标注众包劳动的法律保护
6
作者 粟瑜 《暨南学报(哲学社会科学版)》 北大核心 2023年第1期64-77,共14页
伴随新一代人工智能产业的高速发展、平台用工模式向生产服务领域的深度扩张,数据标注众包劳动正在我国悄然兴起,但也面临低收入、高强度、虚自主、实管控、无保障等就业质量问题,且被制度性地排除在各种劳动交换法律保护以外。为促进... 伴随新一代人工智能产业的高速发展、平台用工模式向生产服务领域的深度扩张,数据标注众包劳动正在我国悄然兴起,但也面临低收入、高强度、虚自主、实管控、无保障等就业质量问题,且被制度性地排除在各种劳动交换法律保护以外。为促进人工智能产业健康发展、切实维护新就业形态劳动者权益,我国有必要探索构建数据标注众包劳动法律保护制度,保护进路的选择需强调专门立法与司法衡平结合,尽快启动软法,审慎诉诸硬法;保护范围的划定在立法上可将服务合同作为类型构造基础,但在司法上应坚持事实优先,准确辨析隐蔽的劳动关系,克服可能发生的监管套利;保护措施的配置可从财产性权益、人格性权益两大方面分类展开。 展开更多
关键词 人工智能 数据标注 众包 新就业形态 平台立法
下载PDF
平台外包人:论幽灵工作的可见性--以人工智能数据标注员为个案
7
作者 束开荣 《福建师范大学学报(哲学社会科学版)》 2023年第3期122-133,171,共13页
当前,人工智能数据标注是全球算法自动化的“最后一公里”。作为平台社会语境下的幽灵工作,其可见性的生成过程蕴含着平台算法背后人类劳动者所处的社会-技术脉络与本地化语境。首先,制度化的职业承认机制构建了幽灵工作的“社会可见性... 当前,人工智能数据标注是全球算法自动化的“最后一公里”。作为平台社会语境下的幽灵工作,其可见性的生成过程蕴含着平台算法背后人类劳动者所处的社会-技术脉络与本地化语境。首先,制度化的职业承认机制构建了幽灵工作的“社会可见性”,这主要体现为平台-国家的共同在场确立了人工智能数据标注员的职业规范以及中西部省份数字产业转型过程中对当地劳动力资源的持续动员。其次,国内媒体场域与学术社群构建着幽灵劳动者的“代理可见性”,这种“代理可见性”既强化了人工智能数据标注员的职业认同,也揭示出人工智能技术神话背后鲜为人知的劳动过程,以此为幽灵工作职业困境的纾解争取更多公共话语空间。最后,作为互联网基础设施的幽灵工作,人类劳动的可见性始终处于“显现”与“退隐”的动态关系中,这种“动态可见性”从崇高叙事、公共性、网络断连以及物质性等维度立体呈现着幽灵工作得以被“看见”的复杂实践。 展开更多
关键词 平台劳动 幽灵工作 职业困境 可见性 人工智能数据标注
下载PDF
市场失灵在新兴产业中的表现——以数据标注行业为例
8
作者 周俊吉 任兰青 《产业创新研究》 2023年第23期63-65,共3页
新兴技术催生出新行业,孵化出新的蓝海。在前期发展的过程中,新兴的数据标注产业未能通过市场自我调节达到良好的发展状态,体现出市场失灵的特征。相关时期内,政府参与引导有利于整体市场运转,为新兴产业长足发展、我国产业集群争取话... 新兴技术催生出新行业,孵化出新的蓝海。在前期发展的过程中,新兴的数据标注产业未能通过市场自我调节达到良好的发展状态,体现出市场失灵的特征。相关时期内,政府参与引导有利于整体市场运转,为新兴产业长足发展、我国产业集群争取话语权夯实基础。 展开更多
关键词 市场失灵 数据标注 政府干预
下载PDF
星尘数据:做数据标注领域的罗赛塔石碑
9
作者 陈秀娟 《汽车观察》 2023年第2期63-66,共4页
通过自动标注算法技术、数据策略专家服务和数据闭环系统服务,最终实现行业AI的平民化。在古老的埃及,考古学家在金字塔旁发现了一块罗塞塔石碑Rosetta Stone,这块石碑上同时刻有古埃及法老托勒密五世诏书的三种不同语言版本,让近代的... 通过自动标注算法技术、数据策略专家服务和数据闭环系统服务,最终实现行业AI的平民化。在古老的埃及,考古学家在金字塔旁发现了一块罗塞塔石碑Rosetta Stone,这块石碑上同时刻有古埃及法老托勒密五世诏书的三种不同语言版本,让近代的考古学家得以有机会对照各语言版本的内容后,解读出已经失传千余年的埃及象形文之意义与结构。如今,在中国,有一家创业型科技公司解决了人类语言和机器语言之间的转译鸿沟,立志于做数据标注领域的罗塞塔石碑,让大规模训练数据的机器学习成为可能。 展开更多
关键词 语言版本 机器语言 机器学习 数据标注 训练数据 闭环系统 托勒密 创业型
下载PDF
人工智能数据标注格式转换方法
10
作者 郑琳欣 朱大智 吉承文 《数字技术与应用》 2023年第6期164-166,共3页
数据标注在从劳动密集型向技术密集型转换的同时,也在利用AI提升效率。不过在许多全新的领域,机器始终无法代替人类。清晰且标准化的数据适合AI标注,但模糊且繁琐的社会性数据只能由人来进行。数据标注的准确性决定了人工智能算法的有效... 数据标注在从劳动密集型向技术密集型转换的同时,也在利用AI提升效率。不过在许多全新的领域,机器始终无法代替人类。清晰且标准化的数据适合AI标注,但模糊且繁琐的社会性数据只能由人来进行。数据标注的准确性决定了人工智能算法的有效性,因此,数据标注不仅需要有系统的方法、技术和工具,还需要真正认识目前现有数据标注存在的问题,并针对目前的混乱性,给出自己的解决方案。本文概述了数据标注的类型、数据标注工具、数据标注格式,指明了数据标注目前存在的标注格式不一致和缺乏标准化的问题,此外本文还详细介绍了各种标注格式以及转换过程。 展开更多
关键词 数据标注 人工智能 格式转换 标注格式 提升效率 算法的有效性 技术密集型 混乱性
下载PDF
2023数据标注公司排行
11
作者 一亩地 《互联网周刊》 2023年第18期14-14,共1页
数据标注是A I(人工智能)实现的基石,特别是ChatGPT的横空出世,把A I的热度推向了一个新的巅峰,那么作为整个A I产业链的基础层支撑之一,数据标注自然也不能被忽视。行业现状2020年,人工智能训练师被正式纳入国家职业分类目录。一般来说... 数据标注是A I(人工智能)实现的基石,特别是ChatGPT的横空出世,把A I的热度推向了一个新的巅峰,那么作为整个A I产业链的基础层支撑之一,数据标注自然也不能被忽视。行业现状2020年,人工智能训练师被正式纳入国家职业分类目录。一般来说,人工智能训练师主要分为数据标注员和人工智能算法测试员。数据标注从业人员在业内有“A I民工”的称号,由此不难看出数据标注属于劳动密集型产业,具有机械性、重复性的特点,而此类工作正是A I要取代的方向。如此看来,数据标注行业似乎有种“舍身饲虎”的感觉。 展开更多
关键词 数据标注 人工智能 分类目录 舍身饲虎 劳动密集型产业 测试员 CHAT 行业现状
下载PDF
数据工厂去代工化的战略路径——以数据标注行业为例 被引量:1
12
作者 范黎波 于心悦 《科技管理研究》 CSSCI 北大核心 2022年第24期125-136,共12页
数据标注是数据领域的基础工作,而数据标注行业起步较晚,学界对该行业企业研究匮乏,因此以数据标注行业为研究对象,立足于资源基础观理论与制度理论,在对从中国知网和Web of Science数据库检索到的相关文献回顾、对国外数据标注龙头企... 数据标注是数据领域的基础工作,而数据标注行业起步较晚,学界对该行业企业研究匮乏,因此以数据标注行业为研究对象,立足于资源基础观理论与制度理论,在对从中国知网和Web of Science数据库检索到的相关文献回顾、对国外数据标注龙头企业发展实践状况分析的基础上,总结提出数据标注行业转型升级的路径。结果发现:数据标注行业处于快速发展阶段,未来发展趋势将会从注重量转向注重质,追求更高的数据质量、安全性和隐私性;目前中国数据标注行业面临标注效率较低和质量参差不齐、存在数据安全风险、缺乏统一行业规范和标准、人工成本日益上涨等问题,同时经营环境面临行业集中度上升的挑战。基于此,在中国致力发展数字经济的背景下,提出通过实施细化标注任务、提高标注效率、制定行业规范等技术路径,以及扩大企业规模、开发自主品牌、提高研发投入等战略路径,提高中国数据标注行业效率及质量,实现数据工厂的去代加工化,提高研发自主品牌的实力,最终实现由劳动密集型产业向技术密集型产业转变。 展开更多
关键词 数据标注行业 数据工厂 数据标注代加工 数字经济 产业转型升级
下载PDF
数据标注研究综述 被引量:48
13
作者 蔡莉 王淑婷 +1 位作者 刘俊晖 朱扬勇 《软件学报》 EI CSCD 北大核心 2020年第2期302-320,共19页
数据标注是大部分人工智能算法得以有效运行的关键环节.数据标注越准确、标注的数据量越大,算法的性能就越好.数据标注行业的发展带动了中国许多城市和城镇的就业,促使中国逐渐成为世界数据标注的中心.阐述了数据标注的发展概况,包括起... 数据标注是大部分人工智能算法得以有效运行的关键环节.数据标注越准确、标注的数据量越大,算法的性能就越好.数据标注行业的发展带动了中国许多城市和城镇的就业,促使中国逐渐成为世界数据标注的中心.阐述了数据标注的发展概况,包括起源、应用场景、分类和任务;列举了目前常用的标注数据集、开源的数据标注工具和商业数据标注平台;提出了标注中的角色、标准和流程等数据标注规范;给出了一个情感分析场景中的数据标注实例;描述各类主流的标注质量评估算法及其特点,并对比它们优缺点;最后,从任务、工具、数据标注质量和安全性这4个方面对数据标注的研究方向和发展趋势进行了展望. 展开更多
关键词 数据标注 人工智能 众包 数据
下载PDF
基于结果模式的Deep Web数据标注方法 被引量:2
14
作者 李明 李秀兰 《计算机应用》 CSCD 北大核心 2011年第7期1733-1736,共4页
全面准确地标注Deep Web查询结果是Deep Web数据集成的关键问题,但现有的Web数据库标注方法还不能较好地解决该问题,为此提出一种基于结果模式的Deep Web数据标注方法。首先通过结果页面解析和抽取结构化数据来完成数据预处理的工作,并... 全面准确地标注Deep Web查询结果是Deep Web数据集成的关键问题,但现有的Web数据库标注方法还不能较好地解决该问题,为此提出一种基于结果模式的Deep Web数据标注方法。首先通过结果页面解析和抽取结构化数据来完成数据预处理的工作,并在集成结果模式和待标注数据之间建立正确的语义映射,进而确定DeepWeb数据的标注信息。通过对4个领域Web数据库进行实验测试,结果表明所提方法能有效地标注Deep Web查询结果数据。 展开更多
关键词 DEEP WEB 结果模式 数据标注 数据抽取
下载PDF
半自动图像数据标注系统的研究与设计 被引量:1
15
作者 陈翔 《福建电脑》 2022年第10期95-97,共3页
为了降低人工标注图像数据的工作量,本文提出了一种半自动数据标注系统的设计方案。该系统根据一部分预标注的数据,通过目标检测模型自动学习数据的特征,对剩余数据进行自动标注。本系统使标注人员的工作从数据标注转化为数据审核与校正... 为了降低人工标注图像数据的工作量,本文提出了一种半自动数据标注系统的设计方案。该系统根据一部分预标注的数据,通过目标检测模型自动学习数据的特征,对剩余数据进行自动标注。本系统使标注人员的工作从数据标注转化为数据审核与校正,大大提升了标注人员的工作效率。 展开更多
关键词 目标检测 深度学习 数据标注
下载PDF
实体瘤病理数据集建设和数据标注质量控制专家意见(2019) 被引量:5
16
作者 《实体瘤病理数据集建设和数据标注质量控制专家共识》筹备组 于观贞 +10 位作者 陈颖 褚君浩 樊嘉 高强 高云姝 李郁 李庆利 刘西洋 宋志刚 朱明华 倪灿荣 《第二军医大学学报》 CAS CSCD 北大核心 2019年第5期465-470,共6页
病理诊断是肿瘤诊断的金标准,是临床治疗的基石。人工智能在肿瘤组织和细胞检测方面已经取得显著进展,有助于病理医师准确、高效、定量地识别出肿瘤细胞和(或)肿瘤特征,提高工作效率,弥补病理医师短缺。发展病理人工智能的前提是高效、... 病理诊断是肿瘤诊断的金标准,是临床治疗的基石。人工智能在肿瘤组织和细胞检测方面已经取得显著进展,有助于病理医师准确、高效、定量地识别出肿瘤细胞和(或)肿瘤特征,提高工作效率,弥补病理医师短缺。发展病理人工智能的前提是高效、精准的标注工作,即将各种类型和不同分化程度的肿瘤细胞勾勒出来。为了促进行业规范性发展、加强数据标注质量控制,肿瘤学、病理学、电子信息学等领域专家共同组建了《实体瘤病理数据集建设和数据标注质量控制专家共识》筹备组,致力于推进实体瘤病理人工智能标准化数据集的建设。本文从实体瘤病理数据的标本来源、标注团队、标注规则、标注流程、质量控制、疑难病例解决方案等多个环节介绍肿瘤细胞标注过程中达成的初步意见。 展开更多
关键词 肿瘤 病理学 人工智能 数据标注 质量控制
下载PDF
基于领域知识和决策树的Deep Web数据标注 被引量:1
17
作者 常勇 王亮 +1 位作者 姚增利 袁方 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第1期129-132,共4页
数据标注是D eep W eb数据集成系统的重要组成部分。建立了领域标注模型,描述数据标注的思想,根据不同的数据,使用领域知识和决策树两种标注方法,给出标注算法描述,最后以图书领域作为标注对象进行实验。实验结果表明该方法可高效、准... 数据标注是D eep W eb数据集成系统的重要组成部分。建立了领域标注模型,描述数据标注的思想,根据不同的数据,使用领域知识和决策树两种标注方法,给出标注算法描述,最后以图书领域作为标注对象进行实验。实验结果表明该方法可高效、准确地对D eep W eb数据进行标注。 展开更多
关键词 DEEP WEB 数据标注 领域知识 决策树
下载PDF
面向图像分割的数据标注系统 被引量:1
18
作者 张悦 王晓懿 李娟 《铁路通信信号工程技术》 2022年第11期47-53,共7页
图像分割算法训练模型用到的语义分割数据需要经过标注才能使用,目前语义分割相关的开源数据标注工具仅支持描点标注多边形方式标注物体轮廓,存在操作繁多、标注效率低下的缺点。针对上述问题,提出鼠标快速标注方法和整体拷贝/调整标注... 图像分割算法训练模型用到的语义分割数据需要经过标注才能使用,目前语义分割相关的开源数据标注工具仅支持描点标注多边形方式标注物体轮廓,存在操作繁多、标注效率低下的缺点。针对上述问题,提出鼠标快速标注方法和整体拷贝/调整标注多边形方法,并应用于数据标注系统。实验结果表明,使用鼠标快速标注方法和整体拷贝/调整标注多边形方法标注分别可以提高11.6%的标注效率和29.7%的标注效率。使用该面向图像分割的数据标注系统可以有效提高标注人员的标注效率,对大量高质量标注数据的获取有积极作用。 展开更多
关键词 数据标注 多边形标注 标注系统
下载PDF
基于聚类分析的不均衡数据标注技术研究 被引量:3
19
作者 赵俊杰 黄四牛 +1 位作者 吴正午 王帅 《计算机仿真》 北大核心 2020年第2期476-480,共5页
分布不均衡的数据在通过传统聚类分析的方式进行标注时,聚类效果容易偏向于样本数多的类,从而造成标注出现误差的问题。针对此问题提出改进的含有均衡约束聚类算法的标注方法,对不均衡数据的聚类标注准确率实现了比较有效的提高,方法包... 分布不均衡的数据在通过传统聚类分析的方式进行标注时,聚类效果容易偏向于样本数多的类,从而造成标注出现误差的问题。针对此问题提出改进的含有均衡约束聚类算法的标注方法,对不均衡数据的聚类标注准确率实现了比较有效的提高,方法包含数据初始聚类、专家知识调整,数据均衡化处理,含均衡约束聚类等步骤。通过初始聚类对不均衡数据进行初始类标签分配,专家知识调整对部分数据错误标注进行标签调整修改,对数据进行均衡化处理得到均衡数据集,通过均衡约束聚类对均衡数据进行标签最终精确分配。经仿真验证表明,上述方法比较有效的提高了不均衡数据标注准确率。 展开更多
关键词 不均衡数据 数据标注 聚类分析 均衡化处理 仿真验证
下载PDF
反向梯度深度学习下重复网络数据标注仿真
20
作者 庞家乐 张彦 《计算机仿真》 北大核心 2022年第10期467-470,485,共5页
不及时标注合处理网络数据中的重复数据,会影响用户使用与操作体验。现有的重复数据标注方法无法排列比较数据记录间的属性,导致重复数据标注不准确。为此提出新的重复数据标注方法。通过综合加权法计算数据库中所有数据的属性权重值,... 不及时标注合处理网络数据中的重复数据,会影响用户使用与操作体验。现有的重复数据标注方法无法排列比较数据记录间的属性,导致重复数据标注不准确。为此提出新的重复数据标注方法。通过综合加权法计算数据库中所有数据的属性权重值,重新定义每个数据字符串间距离,得到数据间相似度值,并设定标记值。引入反向梯度学习算法,排列比较数据记录间的属性。给定每个数据唯一ID编号,构建专属的属性值记录表,通过与选定的数值比较,确定数据间是否存在重复情况。若存在重复数据,利用三区分快速算法直接标注对应的数据。对比实验结果表明所提方法耗时最短,实现重复数据高精准度的检测与标注。 展开更多
关键词 反向梯度深度学习 重复数据标注 相似度值 属性值记录表 三区分快速算法
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部