期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
AIGC时代网络信息内容的法律治理——以大语言模型为例 被引量:3
1
作者 李铭轩 文继荣 《北京理工大学学报(社会科学版)》 北大核心 2023年第6期83-92,共10页
大语言模型是发展人工智能生成内容(AIGC)最为关键的技术之一。它在推动AIGC发展的同时,也会带来生成违法和不良信息的风险。大语言模型生成违法和不良信息的原因较为复杂,造成的风险程度更为严重,因而给网络信息内容的法律治理带来挑... 大语言模型是发展人工智能生成内容(AIGC)最为关键的技术之一。它在推动AIGC发展的同时,也会带来生成违法和不良信息的风险。大语言模型生成违法和不良信息的原因较为复杂,造成的风险程度更为严重,因而给网络信息内容的法律治理带来挑战。为此,中国在立法上细化相关主体在网络信息内容生成过程中的义务,新增对人工智能生成内容进行标识的义务,但相关规则仍存在着继续完善的空间。未来,中国应进一步明确人工智能生成内容致害的侵权责任规则,确定侵权责任的主体和归责原则,基于现行法构造合理的解释论;合理界定网络信息内容服务平台对内容的注意义务,将AIGC技术发展和产业状况纳入考量因素;完善对人工智能生成内容进行标识的要求,区分场景规定不同的标识要求,增加服务使用者和内容传播者的标识义务。 展开更多
关键词 AIGC 生成式人工智能 网络信息内容 治理 大语言模型
下载PDF
基于多任务学习的位置倾向性得分预测算法 被引量:1
2
作者 曹泽麟 徐君 +1 位作者 董振华 文继荣 《计算机研究与发展》 EI CSCD 北大核心 2023年第1期85-94,共10页
用户搜索时产生的点击数据分布,在不同的搜索场景下存在较大差异.现有算法如融合上下文的位置模型(contextual position based model,CPBM)往往只通过单个模型预测多种场景下的位置倾向性得分,不可避免地降低了模型在不同场景下的预测... 用户搜索时产生的点击数据分布,在不同的搜索场景下存在较大差异.现有算法如融合上下文的位置模型(contextual position based model,CPBM)往往只通过单个模型预测多种场景下的位置倾向性得分,不可避免地降低了模型在不同场景下的预测准确性,影响去除位置偏置的效果.基于上述问题提出一种基于多任务学习的多门专家混合位置倾向性得分预测模型(multi-gate contextual position based model,MCPBM),在CPBM模型的基础上加入信息筛选结构,解决了多场景数据联合训练时预测准确性不佳的问题.同时,为了缓解不同任务收敛速度不一致的问题,提出了指数加权平均权重动态调整算法,在加速模型训练的同时提升了模型整体预测性能.实验结果表明提出的MCPBM模型在多场景数据联合训练时,预测准确性优于传统的CPBM;在使用MCPBM模型去除位置偏置后,基于生成的无偏数据训练得到的排序模型,在AvgRank排序指标上有1%~5%的提升. 展开更多
关键词 位置偏置 无偏排序 逆概率加权 多任务学习 倾向性得分预测
下载PDF
基于多域VQGAN的文本生成国画方法研究 被引量:1
3
作者 孙泽龙 杨国兴 +3 位作者 温静远 费楠益 卢志武 文继荣 《软件学报》 EI CSCD 北大核心 2023年第5期2116-2133,共18页
随着生成式对抗网络的出现,从文本描述合成图像最近成为一个活跃的研究领域.然而,目前文本描述往往使用英文,生成的对象也大多是人脸和花鸟等,专门针对中文和中国画的研究较少.同时,文本生成图像任务往往需要大量标注好的图像文本对,制... 随着生成式对抗网络的出现,从文本描述合成图像最近成为一个活跃的研究领域.然而,目前文本描述往往使用英文,生成的对象也大多是人脸和花鸟等,专门针对中文和中国画的研究较少.同时,文本生成图像任务往往需要大量标注好的图像文本对,制作数据集的代价昂贵.随着多模态预训练的出现与推进,使得能够以一种优化的方式来指导生成对抗网络的生成过程,大大减少了对数据集和计算资源的需求.提出一种多域VQGAN模型来同时生成多种域的中国画,并利用多模态预训练模型WenLan来计算生成图像和文本描述之间的距离损失,通过优化输入多域VQGAN的隐空间变量来达到图片与文本语义一致的效果.对模型进行了消融实验,详细比较了不同结构的多域VQGAN的FID及R-precisoin指标,并进行了用户调查研究.结果表示,使用完整的多域VQGAN模型在图像质量和文本图像语义一致性上均超过原VQGAN模型的生成结果. 展开更多
关键词 文本生成图像 多域生成 中国画生成
下载PDF
ACRank:在神经排序模型中引入检索公理知识
4
作者 薄琳 庞亮 +4 位作者 张朝亮 王钊伟 董振华 徐君 文继荣 《计算机学报》 EI CAS CSCD 北大核心 2023年第10期2117-2131,共15页
传统的信息检索(Information Retrieval,IR)是知识驱动的方法,如以BM25、LMIR等为代表的检索模型在设计过程中考虑词频、逆文档频率、文档长度等关键因素计算查询-文档的相关性得分.这些关键因素被总结为IR公理,在传统模型的设计和评价... 传统的信息检索(Information Retrieval,IR)是知识驱动的方法,如以BM25、LMIR等为代表的检索模型在设计过程中考虑词频、逆文档频率、文档长度等关键因素计算查询-文档的相关性得分.这些关键因素被总结为IR公理,在传统模型的设计和评价中起到了至关重要的作用.如词频规则认为有更多查询词的文档更相关.与之相对,数据驱动的神经排序模型基于大量的标注数据与精巧的神经网络结构自动学习相关性评分函数,带来了显著的排序精度提升.传统IR公理知识是否能用来提升神经排序模型的效果是一个值得研究的重要问题且已有学者进行了初步探索,其首先通过公理指导增强数据生成,然后利用生成的标注数据直接训练神经网络.但IR公理的形式是通过比较匹配信号的强弱给出两个文档间相对的相关关系,而非直接给出文档的相关度标签.针对这一问题,本文提出了一种通过对比学习将IR公理知识引入神经排序模型的框架,称为ACRank.ACRank利用信息检索公理生成增强数据,抽取不同文档的匹配信号,利用对比学习拉开匹配信号间差距,使正样本匹配信号强于负样本,通过上述方式,ACRank将IR公理知识自然地融入到数据驱动的神经排序模型中.ACRank作为通用框架,可应用于不同规则,本文选择词频规则进行实验,基于大规模公开数据集上的实验结果表明,ACRank能够有效提升已有神经检索模型如BERT的排序精度,相关分析实验验证了该框架的有效性. 展开更多
关键词 神经检索模型 信息检索公理 对比学习 知识驱动 数据驱动
下载PDF
多模态与文本预训练模型的文本嵌入差异研究
5
作者 孙宇冲 程曦苇 +3 位作者 宋睿华 车万翔 卢志武 文继荣 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第1期48-56,共9页
为了详细地分析文本单模态预训练模型RoBERTa和图文多模态预训练模型WenLan文本嵌入的差异,提出两种定量比较方法,即在任一空间中,使用距离一个词最近的k近邻词集合表示其语义,进而通过集合间的Jaccard相似度来分析两个空间中词的语义变... 为了详细地分析文本单模态预训练模型RoBERTa和图文多模态预训练模型WenLan文本嵌入的差异,提出两种定量比较方法,即在任一空间中,使用距离一个词最近的k近邻词集合表示其语义,进而通过集合间的Jaccard相似度来分析两个空间中词的语义变化;将每个词与其k近邻词组成词对,分析词对之间的关系。实验结果表明,图文多模态预训练为更抽象的词(如成功和爱情等)带来更多的语义变化,可以更好地区分反义词,发现更多的上下义词,而文本单模态预训练模型更擅长发现同义词。另外,图文多模态预训练模型能够建立更广泛的词之间的相关关系。 展开更多
关键词 多模态预训练 文本表示 文本嵌入分析
下载PDF
Shared-nothing并行数据库系统查询优化技术 被引量:21
6
作者 文继荣 陈红 王珊 《计算机学报》 EI CSCD 北大核心 2000年第1期28-38,共11页
查询优化是并行数据库系统的核心技术 .该文介绍作者自行研制的一个 Shared- nothing并行数据库系统PBA SE/ 2中独特的两阶段优化策略 .为了缩减并行查询优化庞大的搜索空间 ,PBASE/ 2将并行查询优化划分为顺序优化和并行化两个阶段 .... 查询优化是并行数据库系统的核心技术 .该文介绍作者自行研制的一个 Shared- nothing并行数据库系统PBA SE/ 2中独特的两阶段优化策略 .为了缩减并行查询优化庞大的搜索空间 ,PBASE/ 2将并行查询优化划分为顺序优化和并行化两个阶段 .在顺序优化阶段对并行化后的通信代价进行预先估算 ,将通信开销加入顺序优化的代价模型 ,同时对动态规划搜索算法进行了修正和扩展 ,保证了顺序优化阶段得到的最小代价计划在并行化后代价仍然最小 .并行化阶段的优化目标是实现查询工作量在系统内多种资源上的负载平衡 ,提出了资源负载平衡因子的概念 ,并且通过启发式规则、任务调度等机制保证了并行查询执行计划的优化性 . 展开更多
关键词 并行数据库系统 并行查询优化 资源负载平衡
下载PDF
新工科背景下以数据为中心的计算机专业教学改革 被引量:40
7
作者 李翠平 柴云鹏 +3 位作者 杜小勇 张孝 文继荣 陈红 《中国大学教学》 CSSCI 北大核心 2018年第7期22-24,共3页
工科人才培养的关键是要根据产业和技术的最新发展,创新性地改革人才培养模式、改造课程体系、改革教学范式。本文针对大数据、云计算和人工智能等新技术和新产业对计算机专业人才培养提出的新要求,对传统计算机专业教育存在的问题进行... 工科人才培养的关键是要根据产业和技术的最新发展,创新性地改革人才培养模式、改造课程体系、改革教学范式。本文针对大数据、云计算和人工智能等新技术和新产业对计算机专业人才培养提出的新要求,对传统计算机专业教育存在的问题进行分析和总结,探索以数据为中心的适应时代发展和产业需求的新型计算机专业课程体系,通过课程建设全面更新教学内容、促进新工科建设,并在中国人民大学信息学院进行实践。 展开更多
关键词 大数据 以数据为中心 计算机专业 教学改革 新工科
下载PDF
基于用户日志的查询扩展统计模型 被引量:61
8
作者 崔航 文继荣 李敏强 《软件学报》 EI CSCD 北大核心 2003年第9期1593-1599,共7页
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联... 信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的.实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的查询扩展算法可以大幅度提高查询精度. 展开更多
关键词 信息检索 查询扩展 用户日志 日志挖掘
下载PDF
一种通过内容和结构查询文档数据库的方法(英文) 被引量:9
9
作者 王晓玲 文继荣 +2 位作者 栾金锋 马维英 董逸生 《软件学报》 EI CSCD 北大核心 2003年第5期976-983,共8页
文档是有一定逻辑结构的,标题、章节、段落等这些概念是文档的内在逻辑.不同的用户对文档的检索,有不同的需求,检索系统如何提供有意义的信息,一直是研究的中心任务.结合文档的结构和内容,对结构化 文件的检索,提出了一种新的计算相似... 文档是有一定逻辑结构的,标题、章节、段落等这些概念是文档的内在逻辑.不同的用户对文档的检索,有不同的需求,检索系统如何提供有意义的信息,一直是研究的中心任务.结合文档的结构和内容,对结构化 文件的检索,提出了一种新的计算相似度的方法.这种方法可以提供多粒度的文档内容的检索,包括从单词、短语到段落或者章节.基于这种方法实现了一个问题回答系统,测试集是微软的百科全书Encarta,通过与系统方法实验比较,证明通过这种方法检索的文章片断更合理、更有效. 展开更多
关键词 文档数据库 结构查询 结构化文档 计算相似度
下载PDF
短文本理解研究 被引量:48
10
作者 王仲远 程健鹏 +1 位作者 王海勋 文继荣 《计算机研究与发展》 EI CSCD 北大核心 2016年第2期262-269,共8页
短文本理解是一项对于机器智能至关重要但又充满挑战的任务.这项任务有益于众多应用场景,如搜索引擎、自动问答、广告和推荐系统.完成这些应用的首要步骤是将输入文本转化为机器可以诠释的形式,即帮助机器"理解"短文本的含义... 短文本理解是一项对于机器智能至关重要但又充满挑战的任务.这项任务有益于众多应用场景,如搜索引擎、自动问答、广告和推荐系统.完成这些应用的首要步骤是将输入文本转化为机器可以诠释的形式,即帮助机器"理解"短文本的含义.基于这一目标,许多方法利用外来知识源来解决短文本中语境信息不足的问题.通过总结短文本理解领域的相关工作,介绍了基于向量的短文本理解框架.同时,探讨了短文本理解领域未来的研究方向. 展开更多
关键词 知识挖掘 短文本理解 概念化 语义计算
下载PDF
基于XML数据立方的面向对象扩展 被引量:3
11
作者 王晓玲 徐立臻 +1 位作者 文继荣 董逸生 《小型微型计算机系统》 CSCD 北大核心 2003年第4期770-774,共5页
本文是对基于XML的数据立方数据模型的面向对象的实现.通过对数据仓库技术、面向对象技术和XML技术的结合的探讨,扩展了XML Schema,从而为基于WEB数据仓库的应用提供了一种新的表示和实现方法,解决了数据仓库中模式演化所带来的重组问题... 本文是对基于XML的数据立方数据模型的面向对象的实现.通过对数据仓库技术、面向对象技术和XML技术的结合的探讨,扩展了XML Schema,从而为基于WEB数据仓库的应用提供了一种新的表示和实现方法,解决了数据仓库中模式演化所带来的重组问题,通过与面向对象技术的结合使用,把数据仓库变成为数据立方和OLAP方法的仓库.这种数据仓库的实现方案,保证了数据仓库系统的稳定性、灵活性和可扩展性,适应了新一代WEB应用的需要. 展开更多
关键词 数据仓库 OLAP 面向对象 XML 数据立方 数据库 数据模型
下载PDF
多媒体大数据处理与分析专题前言 被引量:2
12
作者 赵耀 李波 +3 位作者 华先胜 文继荣 蒋刚毅 常冬霞 《软件学报》 EI CSCD 北大核心 2018年第4期897-899,共3页
在当今信息爆炸时代,随着网络通信、数字电视和计算机技术的快速进步,图像、视频、声音、文本等多媒体数据的获取、处理、分析和展现技术也得到迅速发展,多媒体系统的应用已渗透到人们生活的各个领域,这在很大程度上方便了人们的生... 在当今信息爆炸时代,随着网络通信、数字电视和计算机技术的快速进步,图像、视频、声音、文本等多媒体数据的获取、处理、分析和展现技术也得到迅速发展,多媒体系统的应用已渗透到人们生活的各个领域,这在很大程度上方便了人们的生活,也很大程度地改变了人们的工作、生活方式.特别是近年来,监控视频、娱乐媒体、社交媒体、医学图像、消费者拍摄的图像/视频等多媒体数据量剧增, 展开更多
关键词 多媒体数据 数据处理 计算机技术 专题 生活方式 监控视频 医学图像 多媒体系统
下载PDF
基于流机制的并行查询执行技术 被引量:1
13
作者 陈红 文继荣 王珊 《计算机科学》 CSCD 北大核心 2000年第4期9-13,共5页
1 引言在并行数据库的研究中,查询执行计划的调度与执行因其复杂性而受到人们的关注。查询优化时,优化器必须采用有效策略大幅度裁剪搜索空间,以降低优化开销,但这很可能会丧失掉更优的执行计划。另一方面,当系统吞吐量很高时,一个查询... 1 引言在并行数据库的研究中,查询执行计划的调度与执行因其复杂性而受到人们的关注。查询优化时,优化器必须采用有效策略大幅度裁剪搜索空间,以降低优化开销,但这很可能会丧失掉更优的执行计划。另一方面,当系统吞吐量很高时,一个查询从优化到执行可能有一个较大的时间差,在查询计划执行时一些重要系统参数可能已经发生了较大变化,从而使该执行计划变得不优甚至难于执行。目前解决这一问题的一种方法是将查询优化与查询执行分开,在查询执行阶段通过有效的调度策略来弥补查询执行计划的缺陷,并进一步平衡系统的负载。 展开更多
关键词 并行执行 数据查询 流机制 并行数据库
下载PDF
大数据时代的互联网分析引擎 被引量:5
14
作者 窦志成 文继荣 《大数据》 2015年第3期36-47,共12页
随着互联网尤其是移动互联网的高速发展,互联网文档的数量、内容的丰富度和复杂度都大大增加,互联网正朝大数据时代迈进,而用户的信息需求也趋于复杂化。除了基本的信息检索需求外,对大量相关文档的深入理解与聚合分析的需求也越来越强... 随着互联网尤其是移动互联网的高速发展,互联网文档的数量、内容的丰富度和复杂度都大大增加,互联网正朝大数据时代迈进,而用户的信息需求也趋于复杂化。除了基本的信息检索需求外,对大量相关文档的深入理解与聚合分析的需求也越来越强烈,而传统的互联网搜索引擎已经无法满足人们对该类信息的需求。针对这一问题,提出"互联网分析引擎"的构想,阐述了其与搜索引擎和OLAP分析系统的区别,介绍了一种互联网分析引擎的架构,并详细讨论了实现该引擎的核心问题。 展开更多
关键词 互联网大数据 分析引擎 数据感知与采集
下载PDF
融合法律文本结构信息的刑事案件判决预测 被引量:1
15
作者 张晗 郑伟昊 +1 位作者 窦志成 文继荣 《计算机工程与应用》 CSCD 北大核心 2023年第3期253-263,共11页
近年来,法律领域的智能化引起了学界的广泛关注。选取法律领域中十分重要的法律判决预测任务作为研究重点,法律判决预测包含推荐相关法条、定罪和刑期预测等三个子任务。随着深度学习在各个领域的广泛应用,一些研究者将深度学习方法引... 近年来,法律领域的智能化引起了学界的广泛关注。选取法律领域中十分重要的法律判决预测任务作为研究重点,法律判决预测包含推荐相关法条、定罪和刑期预测等三个子任务。随着深度学习在各个领域的广泛应用,一些研究者将深度学习方法引入法律判决预测任务并取得了较好的效果。现有基于深度学习的法律判决预测方法通常是通过构建案情描述和法条之间的注意力来提升模型预测能力,或者利用三个法律判决预测子任务间的关系来提升整体的性能。但是这些工作未考虑法律文本中的多层层次化信息,如刑法第三百九十七条包含职务侵占罪和玩忽职守罪,其法条大类是渎职罪,并且每个罪行有不同的刑期。针对该问题,考虑引入法律文本的多层层次化信息用于法律判决预测任务。具体来说,对法律文本的多层结构信息进行预处理,并利用协同注意力机制将法条的多层信息融入到案情描述中,得到每个子任务的融合不同层次的法律信息的案情描述表示,从而提升司法判决预测任务的性能。在真实的法律判决预测任务公开的数据集上进行了实验,结果显示提出的融合法律文本多层结构信息的模型在法律判决预测任务上优于当前最好的模型。对法律智能化的未来和发展进行了展望。 展开更多
关键词 法律判决预测 法律多层结构信息 深度学习
下载PDF
并行数据库系统PBASE/2的查询优化机制
16
作者 陈红 王珊 文继荣 《计算机工程》 EI CAS CSCD 北大核心 2000年第7期11-12,187,共3页
并行查询执行计划的搜索空间里指数级增长,如何高效地裁剪搜索空间是并行查询优化的关键所在。PBASE/2以流机制为基础,采用基于代价估算和启发式规则的改良的两阶段优化技术,有效地解决了这一问题。
关键词 流机制 并行数据库系统 查询优化 PBASE/2
下载PDF
35例脑出血破入脑室及其预后
17
作者 文继荣 郑霞清 《川北医学院学报》 CAS 1997年第3期23-23,共1页
35例脑出血破入脑室及其预后文继荣郑霞清(川北医学院附属医院神经内科)一般资料1本组35例,男25例,女10例。男:女之比为25∶1。年龄最小18岁,最大77岁,平均6057岁。40岁以下4例,均为急性发病、呈... 35例脑出血破入脑室及其预后文继荣郑霞清(川北医学院附属医院神经内科)一般资料1本组35例,男25例,女10例。男:女之比为25∶1。年龄最小18岁,最大77岁,平均6057岁。40岁以下4例,均为急性发病、呈进行性加重,既往有高血压史26例,... 展开更多
关键词 脑出血 破入脑室 预后
下载PDF
脑瘤伴发癫痫25例临床分析
18
作者 文继荣 《川北医学院学报》 CAS 1990年第3期36-37,40,共3页
98例颅内肿瘤经手术相病理检查证实,本文报告25例脑瘤伴癫痫,主要发生在中年人,各类型脑瘤发生率百分比依次为:胶质瘤(64%),脑膜瘤(16%),垂体瘤(12%),转移性瘤(4%)和其他类型肿瘤(4%)。17例病人呈癫痫大发作,额顶部和颞叶为最常见... 98例颅内肿瘤经手术相病理检查证实,本文报告25例脑瘤伴癫痫,主要发生在中年人,各类型脑瘤发生率百分比依次为:胶质瘤(64%),脑膜瘤(16%),垂体瘤(12%),转移性瘤(4%)和其他类型肿瘤(4%)。17例病人呈癫痫大发作,额顶部和颞叶为最常见的部位。 展开更多
关键词 脑瘤 癫痫 大发作
下载PDF
脑肿瘤伴发精神障碍─—附36例分析
19
作者 文继荣 《川北医学院学报》 CAS 1994年第1期63-64,67,共3页
98例颅内肿瘤经手术和病理检查证实,其中36例脑瘤伴精神障碍,最常见的精神症状是情感淡漠,情感不稳,遗忘,意识模糊,嗜睡、痴呆。为最常见的部位为额顶部和颞叶部。
关键词 脑瘤 精神障碍
下载PDF
基于深度学习的图片中商品参数识别方法 被引量:15
20
作者 丁明宇 牛玉磊 +1 位作者 卢志武 文继荣 《软件学报》 EI CSCD 北大核心 2018年第4期1039-1048,共10页
计算机计算性能的提升使得深度学习成为了可能.作为计算机视觉领域的重要发展方向之一的目标检测也开始结合深度学习方法并广泛应用于各行各业.受限于网络的复杂度和检测算法的设计,目标检测的速度和精度成为一个trade-off.目前电商领... 计算机计算性能的提升使得深度学习成为了可能.作为计算机视觉领域的重要发展方向之一的目标检测也开始结合深度学习方法并广泛应用于各行各业.受限于网络的复杂度和检测算法的设计,目标检测的速度和精度成为一个trade-off.目前电商领域的飞速发展产生了大量包含商品参数的图片,使用传统方法难以有效地提取出图片中的商品参数信息.针对这一问题,提出了一种将深度学习检测算法和传统OCR技术相结合的方法,在保证识别速度的同时大大提升了识别的精度.所研究的问题包括检测模型、针对特定数据训练、图片预处理以及文字识别等.首先比较了现有的目标检测算法,权衡其优缺点,然后使用YOLO模型完成检测任务,并针对YOLO模型中存在的不足进行了一定的改进和优化,得到了一个专用于检测图片中商品参数的目标检测模型,最后使用tesseract完成文字提取任务.在将整个流程结合到一起后,该系统不仅有着较好的识别精度,而且是高效和健壮的.最后讨论了优势和不足之处,并指出了未来工作的方向. 展开更多
关键词 目标检测 图像切割 光学字符识别 商品参数 深度学习
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部