期刊文献+
共找到201篇文章
< 1 2 11 >
每页显示 20 50 100
DI-VTR:Dual inter-modal interaction model for video-text retrieval
1
作者 Jie Guo Mengying Wang +2 位作者 Wenwei Wang Yan Zhou Bin Song 《Journal of Information and Intelligence》 2024年第5期388-403,共16页
Video-text retrieval is a challenging task for multimodal information processing due to the semantic gap between different modalities.However,most existing methods do not fully mine the intra-modal interactions,as wit... Video-text retrieval is a challenging task for multimodal information processing due to the semantic gap between different modalities.However,most existing methods do not fully mine the intra-modal interactions,as with the temporal correlation of video frames,which results in poor matching performance.Additionally,the imbalanced semantic information between videos and texts also leads to difficulty in the alignment of the two modalities.To this end,we propose a dual inter-modal interaction network for video-text retrieval,i.e.,DI-vTR.To learn the intra-modal interaction of video frames,we design a contextual-related video encoder to obtain more fine-grained content-oriented video representations.We also propose a dual inter-modal interaction module to accomplish accurate multilingual alignment between the video and text modalities by introducing multilingual text to improve the representation ability of text semantic features.Extensive experimental results on commonly-used video-text retrieval datasets,including MSR-VTT,MSVD and VATEX,show that the proposed method achieves significantly improved performance compared with state-of-the-art methods. 展开更多
关键词 video-text retrieval Multilingual text Dual interaction Contrastivelanguage-image pretraining(CLIP) Cross-modal retrieval
原文传递
Sora:作为世界模拟器的“天空”媒介 被引量:4
2
作者 邓建国 《文化艺术研究》 2024年第1期16-23,112,共9页
目前,关于文生视频人工智能应用Sora的分析存在两个极端:过于内行的技术分析,让人云里雾里;过于外行的“炸裂”分析,让人惊恐不已。从媒介学、传播学和新闻学角度分析Sora,可以发现,它同时属于超级媒介、基础设施型媒介、冷/热媒介、贫... 目前,关于文生视频人工智能应用Sora的分析存在两个极端:过于内行的技术分析,让人云里雾里;过于外行的“炸裂”分析,让人惊恐不已。从媒介学、传播学和新闻学角度分析Sora,可以发现,它同时属于超级媒介、基础设施型媒介、冷/热媒介、贫/富媒介、新/旧媒介、真/假媒介。Sora证明了物理规律的强大和现实的坚韧,能“画出不可画者”,朝着元宇宙方向迈进。在人工智能的重重包围和步步逼近下,在人类创造力的顶峰,红旗仍将高高飘扬;在各种虚拟现实技术盛行的今天,新闻业更应坚守现实本身,此时,机构型媒体作为信源的品牌公信力将变得更加重要。 展开更多
关键词 人工智能 AIGC SORA 文生视频 媒介 元宇宙 繁花
下载PDF
相由心生:AIGC时代的艺术生产与审美新景观——由文生视频AI模型Sora引发的思考 被引量:6
3
作者 夏德元 《文化艺术研究》 2024年第1期24-31,112,共9页
ChatGPT、Bert、Midjourney等大语言模型的诞生,标志着人类社会已进入人工智能生成内容(AIGC)的时代。AIGC技术促进了科学与人文、技术与艺术的深度融合,使艺术创作的门槛不断降低。文生图、文生视频AI模型的快速迭代升级,不仅正在改写... ChatGPT、Bert、Midjourney等大语言模型的诞生,标志着人类社会已进入人工智能生成内容(AIGC)的时代。AIGC技术促进了科学与人文、技术与艺术的深度融合,使艺术创作的门槛不断降低。文生图、文生视频AI模型的快速迭代升级,不仅正在改写艺术生产的格局,重塑视觉文化景观,也必将对人们的日常审美生活实践带来革命性的影响。OpenAI新近推出的文生视频AI模型Sora的惊人表现,再次带给人们前所未有的视觉冲击和心理震撼,从科学哲学和艺术哲学层面对Sora所带来的影响进行审思,或可有利于缓解人们的技术焦虑,并有望建立一种审慎乐观的人机共生信念。 展开更多
关键词 SORA 文生视频 AIGC 人机共生 艺术生产 审美革命
下载PDF
媒介变革中网络文学现实观照的幻像强化——从Internet到Sora的技术迁跃 被引量:2
4
作者 禹建湘 张浩翔 《西华大学学报(哲学社会科学版)》 2024年第2期16-22,共7页
网络文学的媒介提供了一种虚拟空间的文化交流与精神对话方式。伴随着互联网媒介生产技术从早期诞生到Sora AI问世的持续发展,文艺同社会生活边界的日渐模糊,进而打破了以往同社会存在遥远距离的束缚,以一种超现实的虚拟空间状态进入社... 网络文学的媒介提供了一种虚拟空间的文化交流与精神对话方式。伴随着互联网媒介生产技术从早期诞生到Sora AI问世的持续发展,文艺同社会生活边界的日渐模糊,进而打破了以往同社会存在遥远距离的束缚,以一种超现实的虚拟空间状态进入社会大众的生活。网络文艺创作将个体“无意识之思”通过超现实的叙事表达在集体“无意识之思”的公共语境空间内,并通过一种“在场”式体验的创作同创作者与阅读者构成共同的语意空间。而由于公共语境空间的平等交流性,读者与创作者都在他者介入的影响下参与到网络文艺在“自我理想”中找寻“理想自我”的过程中。 展开更多
关键词 网络文学 媒介生产 镜像理论 自我幻像 SORA 文生视频
下载PDF
教育评价改革如何应对AI快速发展的挑战?
5
作者 熊丙奇 《上海教育评估研究》 2024年第2期25-27,43,共4页
继ChatGPT之后,文生视频Sora横空出世。为了应对人工智能快速发展带来的挑战,我国学校教育正在加快推进AI+教育,但是AI+教育受唯分数、唯升学、唯学历的教育评价体系的影响,存在知识化、应试化倾向,人工智能在教育领域的应用还主要服务... 继ChatGPT之后,文生视频Sora横空出世。为了应对人工智能快速发展带来的挑战,我国学校教育正在加快推进AI+教育,但是AI+教育受唯分数、唯升学、唯学历的教育评价体系的影响,存在知识化、应试化倾向,人工智能在教育领域的应用还主要服务于应试,这既不符合教育改革方向,也难以培养适应人工智能时代的创新人才。应对人工智能快速发展的挑战,关键在推进教育评价改革,要坚定破除唯分数、唯升学的教育评价顽瘴痼疾,要在推进教育评价改革过程中,利用人工智能技术提高评价的效率与公信力。 展开更多
关键词 文生视频 创新人才 教育评价
下载PDF
图文结合习题在组织学与胚胎学教学中的应用
6
作者 张金平 田洋洋 +4 位作者 邵素霞 赵静 赵昱 赵秀军 王立轩 《中国组织化学与细胞化学杂志》 CAS CSCD 2024年第2期196-200,共5页
目的本研究旨在研究图文结合习题和不同类型教学视频在组织学和胚胎学教学中的应用效果。方法选取我校2021级影像班和全科医学班学生为研究对象,实验组采用图文结合习题,对照组采用传统纯文字习题。两组学生在教学过程中使用相同的教学... 目的本研究旨在研究图文结合习题和不同类型教学视频在组织学和胚胎学教学中的应用效果。方法选取我校2021级影像班和全科医学班学生为研究对象,实验组采用图文结合习题,对照组采用传统纯文字习题。两组学生在教学过程中使用相同的教学视频辅助教学。课程结束后,对两组学生的切片成绩和期末成绩进行比较和相关性分析,使用调查问卷评价两组的教学效果。结果实验组学生的成绩和高分段学生人数均显著高于对照组。实验组切片成绩和期末成绩之间存在密切相关性,实验组图文结合习题相关知识考点试题中,超过50%得分率的试题数量显著高于对照组。调查问卷显示,图文结合习题配合教学视频中的微课视频更有利于知识的掌握。结论使用图文结合习题能更好地加强组织学与胚胎学理论知识和实践内容的联系。 展开更多
关键词 图文结合习题 教学视频 组织学与胚胎学
下载PDF
Sora文生影像模式下中国风格产品系统参数化建构策略研究
7
作者 周敏宁 《新疆师范大学学报(哲学社会科学版)》 北大核心 2024年第6期138-144,共7页
Sora文生影像模式的出现,标志着人工智能正式进入千亿级参数量的大数据、大模型时代。AI智能既初步具备了机器知觉能够“识万物”,又能通过输入文字、参数使“万物生”。伴随新质生产力的壮大,中国应深刻理解科技不仅是生产力,而且是意... Sora文生影像模式的出现,标志着人工智能正式进入千亿级参数量的大数据、大模型时代。AI智能既初步具备了机器知觉能够“识万物”,又能通过输入文字、参数使“万物生”。伴随新质生产力的壮大,中国应深刻理解科技不仅是生产力,而且是意识形态,应努力建构符合中国美学风格、满足中国用户需求的智能化系统;推动中国语境下的科学与人文相结合,形成能够在未来国际虚拟社区传播、具有中国风格的自创生AI体系,全面推进新时代中国智造与世界智能新业态的紧密融合。 展开更多
关键词 SORA 文生影像 中国风格 人工智能 自创生 隐私让渡
下载PDF
文生视频类人工智能的风险与三维规制:以Sora为视角 被引量:5
8
作者 邓建鹏 赵治松 《新疆师范大学学报(哲学社会科学版)》 北大核心 2024年第6期92-100,共9页
文生视频类人工智能Sora一经发布即引发万众瞩目,其具有的强理解能力、高度仿真性及多模态融合能力为社会带来视觉、听觉震撼的同时,引发诸多法律风险。与此前的生成式人工智能大模型相比,Sora的潜在法律风险在人格权保护、网络犯罪及... 文生视频类人工智能Sora一经发布即引发万众瞩目,其具有的强理解能力、高度仿真性及多模态融合能力为社会带来视觉、听觉震撼的同时,引发诸多法律风险。与此前的生成式人工智能大模型相比,Sora的潜在法律风险在人格权保护、网络犯罪及社会信任等方面更为突出。面对前沿科技给个人权益、刑事犯罪及社会稳定等领域带来的挑战,要及时采取相应的多维规制对策。一是加强对人格权的民法保护,明确个人信息使用的授权,强化数据采集和视频内容监管;二是优化刑法适用与归责,完善刑事法律的解释、适用及责任制度;三是通过规范监管,提升社会信任,推动人工智能由规制对象转向规制工具,助推人工智能系统的安全性和可靠性。 展开更多
关键词 SORA 法律风险 三维规制 人工智能 文生视频类人工智能
下载PDF
“世界模拟”的拟像迷思——基于通用视觉大模型技术的哲学反思 被引量:1
9
作者 吴静 《南通大学学报(社会科学版)》 北大核心 2024年第3期20-30,159,共12页
随着通用视觉大模型技术的迅速发展,对人工智能技术底层逻辑的哲学反思变得刻不容缓。生成式人工智能文生视频、文生图像现象的背后,是数字技术借由算法公理化逻辑所营造出的普世视觉景观,这种视觉景观消解了真实与虚拟之间的边界,在本... 随着通用视觉大模型技术的迅速发展,对人工智能技术底层逻辑的哲学反思变得刻不容缓。生成式人工智能文生视频、文生图像现象的背后,是数字技术借由算法公理化逻辑所营造出的普世视觉景观,这种视觉景观消解了真实与虚拟之间的边界,在本质上与一种通过数字技术而布展的知识生产权力具有同构性。基于数据预训练和投喂的通用视觉大模型,其知识生产中存在着数据“通用”性与模型“泛化”的张力,大模型泛化能力的提高意味着其所依赖的数据来源愈加具有普遍性和公理性,由此在技术无意识层面形成一种代表数字普遍理性的公共知识体系。为此应重新思考虚拟与现实之间的边界问题,在技术设计关注差异要素的基础上,探索人工智能时代人机交互的可能前景。 展开更多
关键词 人工智能 文生视频 大模型 泛化
下载PDF
人工智能文生视频大模型Sora的核心技术、运行机理及未来场景 被引量:5
10
作者 朱光辉 王喜文 《新疆师范大学学报(哲学社会科学版)》 北大核心 2024年第4期149-156,共8页
Sora的出现对人工智能的发展具有重大意义,如推动人工智能技术的普及和应用,革新人机交互方式,促进跨学科研究和应用。但同时也应注意到,面对人工智能领域的不断革新,会引发一系列伦理和法律问题。政府有关部门应尽快制定相应的战略、... Sora的出现对人工智能的发展具有重大意义,如推动人工智能技术的普及和应用,革新人机交互方式,促进跨学科研究和应用。但同时也应注意到,面对人工智能领域的不断革新,会引发一系列伦理和法律问题。政府有关部门应尽快制定相应的战略、规划、政策和标准,引导新一代人工智能技术更好地服务经济社会发展。 展开更多
关键词 文生视频大模型 SORA 扩散模型 世界模型 ChatGPT
下载PDF
文本到视频生成:研究现状、进展和挑战
11
作者 邓梓焌 何相腾 彭宇新 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第5期1632-1644,共13页
文本到视频生成旨在根据用户给定的文本描述生成语义一致、内容真实、时序连贯且符合逻辑的视频。该文首先介绍了文本到视频生成领域的研究现状,详细介绍了3类主流的文本到视频生成方法:基于循环网络与生成对抗网络(GAN)的生成方法,基于... 文本到视频生成旨在根据用户给定的文本描述生成语义一致、内容真实、时序连贯且符合逻辑的视频。该文首先介绍了文本到视频生成领域的研究现状,详细介绍了3类主流的文本到视频生成方法:基于循环网络与生成对抗网络(GAN)的生成方法,基于Transformer的生成方法和基于扩散模型的生成方法。这3类生成方法在视频生成任务上各有优劣:基于循环网络与生成对抗网络的生成方法能生成较高分辨率和时长的视频,但难以生成复杂的开放域视频;基于Transformer的生成方法有能力生成复杂的开放域视频,但受限于Transformer模型单向偏置、累计误差等问题,难以生成高保真视频;扩散模型具有很好的泛化性,但受制于推理速度和高昂的内存消耗,难以生成高清的长视频。然后,该文介绍了文本到视频生成领域的评测基准和指标,并分析比较了现有主流方法的性能。最后,展望了未来可能的研究方向。 展开更多
关键词 文本到视频生成 扩散模型 生成对抗网络
下载PDF
基于云计算的短视频媒体资源个性化推送方法 被引量:2
12
作者 王南 《兵工自动化》 北大核心 2024年第2期16-22,共7页
为提高短视频媒体资源推送的匹配度,提出基于云计算的短视频媒体资源个性化推送方法。设计基于Hadoop的短视频媒体资源个性化推送框架,以采集的信息为基础,采用隐含狄利克雷分布(latent Dirichlet allocation,LDA)模型按主题分类短视频... 为提高短视频媒体资源推送的匹配度,提出基于云计算的短视频媒体资源个性化推送方法。设计基于Hadoop的短视频媒体资源个性化推送框架,以采集的信息为基础,采用隐含狄利克雷分布(latent Dirichlet allocation,LDA)模型按主题分类短视频类型,并通过基于注意力机制的卷积神经网络模型识别精彩瞬间短视频主题;短视频媒体资源推荐模块根据用户的历史短视频浏览行为,确定用户对未浏览短视频的兴趣值,根据其值大小生成推荐列表,通过数据展示层将推送结果呈现给用户。实验结果表明:该方法可实现用户感兴趣主题短视频媒体资源的个性化推送,当各弹幕文本提取的最佳主题数量为2、推荐列表长度为3时,推送效果最突出;该方法能提高短视频媒体资源个性化推送的性能,推送的内容更加符合用户的兴趣度。 展开更多
关键词 云计算 短视频 个性化推送 弹幕文本 注意力机制
下载PDF
文生视频模型Sora的时间性结构分析——对生成式人工智能的现象学思考 被引量:1
13
作者 邓志文 《编辑之友》 北大核心 2024年第6期46-52,共7页
近日,OpenAI推出了代表了目前文生视频最高水平的模型Sora,成为生成式人工智能发展史上的里程碑。然而,Sora还是存在着一些技术上的缺陷和不足。从时间现象学角度看,Sora外在时间结构“阵容”残缺,只有客观时间,没有主观时间和内在时间... 近日,OpenAI推出了代表了目前文生视频最高水平的模型Sora,成为生成式人工智能发展史上的里程碑。然而,Sora还是存在着一些技术上的缺陷和不足。从时间现象学角度看,Sora外在时间结构“阵容”残缺,只有客观时间,没有主观时间和内在时间意识,导致其无法描述人类的心理时间,不能解释事件的因果关系和建构复杂有意义的事件及情节。此外,滞留和前摄的缺席,导致其无法连接动作和结果;缺少内在时间性动态生成结构的介入,Sora亦难以展现随着时间推移而发生的事件。因此,从技术层面增加数据模型的意向性实践和提升意向性设计的算量、算法,完善内外两个时间性结构,成为提升Sora现实表现的关键。 展开更多
关键词 文生视频 SORA 时间性结构 生成式人工智能 现象学 滞留与前摄
下载PDF
互动仪式链理论视角下短视频弹幕互动研究——以Bilibili情侣类视频为例 被引量:2
14
作者 汪雅倩 荣懋丹 《新闻与传播评论》 北大核心 2024年第1期56-70,共15页
移动视频社交时代,各类短视频平台涌现了大批极具影响力的“微名人”,新型互动文化随之产生。为了挖掘其特征属性,聚焦情侣视频博主及CP文化,以B站为例,基于互动仪式链理论视角,探讨情侣博主的内容特征及其与用户之间的互动模式。通过... 移动视频社交时代,各类短视频平台涌现了大批极具影响力的“微名人”,新型互动文化随之产生。为了挖掘其特征属性,聚焦情侣视频博主及CP文化,以B站为例,基于互动仪式链理论视角,探讨情侣博主的内容特征及其与用户之间的互动模式。通过参与式观察和内容分析法进行研究后发现:情侣博主的视频以情境互动类为主,视频主题倾向于搞怪、整蛊,视频基调突出较强的情绪特征。在此基础上,通过文本分析法挖掘弹幕类型、关键词等,并最终建立短视频平台情侣博主与用户之间的互动仪式链模型。基于综合研究方法,勾勒出短视频情侣博主与用户之间从启动到结果的完整互动仪式图景,揭示了互动仪式要素从“身体共同在场”到虚拟共同在场的转变,突出了虚拟场景和情感能量在移动视频社交时代的重要意义。 展开更多
关键词 短视频平台 情侣博主 弹幕互动 内容分析 文本挖掘
下载PDF
人工智能文生视频大模型的作品风险、著作权归属及有效治理
15
作者 丛立先 李泳霖 《新疆师范大学学报(哲学社会科学版)》 北大核心 2024年第6期101-111,共11页
以Sora为代表的文生视频大模型的出现,赋予作品风险、著作权归属和著作权风险治理新的讨论意蕴。笔者认为文生视频大模型作为人类精神产品创作的工具,其生成的内容构成作品。基于文生视频大模型的技术特点,其引发的作品风险不能一概而论... 以Sora为代表的文生视频大模型的出现,赋予作品风险、著作权归属和著作权风险治理新的讨论意蕴。笔者认为文生视频大模型作为人类精神产品创作的工具,其生成的内容构成作品。基于文生视频大模型的技术特点,其引发的作品风险不能一概而论,应基于对作品的不同使用行为加以识别和判断。在著作权归属领域,应坚持视听作品的私权属性,在秉持以意思自治约定归属优先的同时,在个案中结合实质贡献、投资激励和利益平衡原则确定著作权归属。在著作权风险治理领域,应通过著作权规则完善、著作权审判指导、著作权执法监管和大模型行业自治,共同作用于文生视频大模型的合规、高效与可持续发展。 展开更多
关键词 SORA 人工智能 文生视频 作品风险 著作权归属 风险治理
下载PDF
文生视频类人工智能的数据风险及其法律规制——以Sora为例
16
作者 逯达 《河南社会科学》 北大核心 2024年第10期77-87,共11页
Sora具有较强的视频生成能力,被OpenAI定位为“物理世界模拟器”,引领着文生视频类AI的发展。数据是文生视频类AI的质料,在AI运行过程中可能存在安全风险,具体包括预训练数据来源合法性风险,人工操纵标注的数据可能导致的意识形态等风险... Sora具有较强的视频生成能力,被OpenAI定位为“物理世界模拟器”,引领着文生视频类AI的发展。数据是文生视频类AI的质料,在AI运行过程中可能存在安全风险,具体包括预训练数据来源合法性风险,人工操纵标注的数据可能导致的意识形态等风险,抓取虚假数据或非法数据的风险等。而这些数据风险可能衍生出国家与个人的数据安全风险、生成视频数据的著作权风险、深度伪造视频等虚假视频数据传播风险以及意识形态渗透风险。建立健全多维法律规制体系成为文生视频类AI数据风险治理的关键所在。我国应以科技向上向善、包容审慎等为原则,明确服务提供者等主体的数据安全法律义务,健全数据分类分级保护制度,完善数据伦理规范,建立健全包容审慎数据监管、风险防控数据监管以及全过程风险预警与应急处置监管相关机制,明确公众数据风险防范与救济路径。 展开更多
关键词 文生视频类人工智能 SORA 数据风险 法律规制
下载PDF
面向AIGC的文生视频应用进展与对比分析
17
作者 赵可傲 韩菲琳 《现代电影技术》 2024年第6期31-38,共8页
随着人工智能生成内容(AIGC)技术的快速发展与应用,视频生成领域逐渐成为研究焦点,并成为未来视频内容创作的重要探索方向。本文通过分析视频生成技术的发展现状与应用进展,对比评估不同方法的生成格式与质量。通过视频评估工具对不同... 随着人工智能生成内容(AIGC)技术的快速发展与应用,视频生成领域逐渐成为研究焦点,并成为未来视频内容创作的重要探索方向。本文通过分析视频生成技术的发展现状与应用进展,对比评估不同方法的生成格式与质量。通过视频评估工具对不同生成方法产生的视频进行了评分,并呈现了生成画面的效果。此外,研究探讨了构建提示词和设计制作流程的策略,以探索实现视频生成领域新的创作可能性。 展开更多
关键词 AIGC 文生视频技术 生成式人工智能 视频生成技术
下载PDF
基于深度学习的短视频分类技术及监控预警系统
18
作者 徐音 《长江信息通信》 2024年第7期37-39,46,共4页
针对目前互联网上传播的海量短视频,设计并实现了一套短视频文本检测预警系统。该系统通过检测短视频中文本的位置,利用OCR识别技术对文本内容进行识别,运用NLP技术对文本内容进行校正、理解和匹配,最后上传检测结果,实现了对短视频中... 针对目前互联网上传播的海量短视频,设计并实现了一套短视频文本检测预警系统。该系统通过检测短视频中文本的位置,利用OCR识别技术对文本内容进行识别,运用NLP技术对文本内容进行校正、理解和匹配,最后上传检测结果,实现了对短视频中文本信息的结构化。系统可以通过上传短视频来进行短视频文本内容的结构化以及分类,同时对含敏感信息的视频进行预警上报,对非敏感短视频确定相应的标签以进行后续搜索、推荐等附加服务。测试结果表明:短视频分类技术及监控预警系统的分类准确率为96.3%,召回率为93.7%,单帧图像响应时间快,软件成熟度评估达到CMMI3级,兼容性良好。 展开更多
关键词 深度学习 短视频 OCR 文本检测
下载PDF
基于文生视频模型Sora的我国学校体育教育的机遇、挑战与策略研究
19
作者 龙道金 潘嘉峪 《体育科技文献通报》 2024年第4期173-175,180,共4页
Sora是OpenAI于2024年2月发布的文本到视频的生成式AI模型。该模型经过训练,可以从文本指令生成逼真或富有想象力的场景视频,显示出模拟物理世界的潜力。本文通过文献资料法、逻辑分析法等研究方法,探究基于文生视频模型Sora的我国学校... Sora是OpenAI于2024年2月发布的文本到视频的生成式AI模型。该模型经过训练,可以从文本指令生成逼真或富有想象力的场景视频,显示出模拟物理世界的潜力。本文通过文献资料法、逻辑分析法等研究方法,探究基于文生视频模型Sora的我国学校体育教育的机遇、挑战与策略。研究认为,文生视频模型Sora具有提供个性化的内容、交互式学习和不同视觉表现的体育教学功能,由此给我国学校体育教育带来机遇:提供针对性的教学内容,可以满足个性化体育教学;能够展示高水平体育技能的过程,可以提高学习效率;创造虚拟运动情境,有利于学习动机的增强和运动兴趣的提升;可以缩小城乡体育教育差距,促进教育公平。同时,给我国学校体育教育带来挑战:体育教学主体的技术适应性;体育教学质量和内容准确性;体育教学评价的多样性。基于此,提出我国学校体育教育的发展策略:加强体育教师的技术培训;制定关于AI生成体育教学内容的质量标准和审核机制;政府提供政策支持和教育资源的合理分配等,以期促进应用文生视频模型Sora推动我国学校体育教育发展。 展开更多
关键词 文生视频模型 SORA 体育教育 体育教学
下载PDF
中文文本屏幕内容图像通用视频编码标准编码感知失真研究
20
作者 杨楷芳 晁学敏 +1 位作者 蒙琴琴 公衍超 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第4期18-31,共14页
为了探索最新一代通用视频编码标准(versatile video coding, VVC)对中文文本屏幕内容图像(text screen content image, TSCI)感知质量的影响,设计图像主观观测实验并基于VVC混合编码框架原理研究了中文TSCI的VVC编码感知失真。构建中... 为了探索最新一代通用视频编码标准(versatile video coding, VVC)对中文文本屏幕内容图像(text screen content image, TSCI)感知质量的影响,设计图像主观观测实验并基于VVC混合编码框架原理研究了中文TSCI的VVC编码感知失真。构建中文文本屏幕内容图像数据库(Chinese text screen content image dataset, CT-SCID),设计图像主观观测实验,分析VVC引起的中文TSCI感知失真类型及其发展路径;结合VVC的混合编码框架原理,理论分析并实验验证影响VVC编码的中文TSCI感知失真程度的因素;总结当前代表性的屏幕内容图像质量评价方法在中文TSCI VVC编码感知失真评测上的性能表现。实验结果表明:字体大小和对比度是影响中文TSCI VVC编码感知质量的重要因素,且中文TSCI的字体越小、对比度越低时,图像的感知质量等级越低;当前代表性的屏幕内容图像质量评价方法均无法给出完全符合人眼感知特性的质量评价结果。研究对于后续开发适用于中文TSCI的感知质量评价方法、高效编码方法等具有指导意义。 展开更多
关键词 中文文本屏幕内容图像 通用视频编码 感知失真 笔画
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部