期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
CEBX:新一代结构化版式文档技术 被引量:3
1
作者 汤帜 仇睿恒 王毅 《北京信息科技大学学报(自然科学版)》 2010年第S2期11-15,共5页
随着IT技术的发展,越来越多的人习惯于在计算机或移动终端上进行阅读,但传统的版式文档缺乏屏幕自适应特性,不适合在移动终端上阅读,为了提供在不同移动设备上数字内容最佳的阅读体验,需要有更好的文档格式。CEBX是新一代结构化版式文... 随着IT技术的发展,越来越多的人习惯于在计算机或移动终端上进行阅读,但传统的版式文档缺乏屏幕自适应特性,不适合在移动终端上阅读,为了提供在不同移动设备上数字内容最佳的阅读体验,需要有更好的文档格式。CEBX是新一代结构化版式文档技术,该技术实现一次制作、多平台多次利用,既可以原版原式地显示或打印,又可以在移动设备上更好地实现高质量的实时排版和屏幕自适应。此外,CEBX技术在适应移动互联网应用方面提供更好的技术特性,包括减少文档格式的数据量小以提高压缩倍率、减少解析引擎的复杂度以提高解析速度、支持部分加密等灵活的文档对象处理机制等。 展开更多
关键词 版式文档 文档格式 结构信息
下载PDF
布谷鸟搜索算法研究及其应用进展 被引量:12
2
作者 吴一全 周建伟 《智能系统学报》 CSCD 北大核心 2020年第3期435-444,共10页
为进一步加强布谷鸟算法的搜寻能力并提升收敛速度,加快对算法的研究与应用进程,综述了布谷鸟算法的原理、研究概况和其他同类群体智能优化算法的比较及发展趋势。首先给出了算法的基本模型和实现步骤;然后重点阐述了基于发现概率和步... 为进一步加强布谷鸟算法的搜寻能力并提升收敛速度,加快对算法的研究与应用进程,综述了布谷鸟算法的原理、研究概况和其他同类群体智能优化算法的比较及发展趋势。首先给出了算法的基本模型和实现步骤;然后重点阐述了基于发现概率和步长控制量、基于自适应步长、基于混沌理论、与其他算法混合、基于种群特征和种群变异、结合优化策略及基于种群多样性等方面的改进方法,总结了算法的主要应用领域及其进展;随后将其与遗传算法、蚁群优化算法、粒子群优化算法及人工蜂群优化算法的优点、缺点及适用性诸方面进行了对比;最后指出了布谷鸟搜索算法尚存在的缺陷并对进一步的研究方向进行了展望。 展开更多
关键词 群体智能 布谷鸟搜索算法 启发式算法 寄巢产卵 莱维飞行 自适应步长 混沌 种群多样性
下载PDF
尺度与颜色不变性图像特征描述 被引量:2
3
作者 刘岩 吕肖庆 +2 位作者 秦叶阳 汤帜 徐剑波 《小型微型计算机系统》 CSCD 北大核心 2012年第10期2297-2302,共6页
尺度不变特征变换是目前公认的鲁棒性最强的图像特征描述方法之一,在尺度不变性和几何不变性方面具有较好的特性,但该方法主要适用于灰度图像,对图像颜色的区分能力不强,因此,一些对象可能会因为颜色的不同而被错误的区分.另外,尺度不... 尺度不变特征变换是目前公认的鲁棒性最强的图像特征描述方法之一,在尺度不变性和几何不变性方面具有较好的特性,但该方法主要适用于灰度图像,对图像颜色的区分能力不强,因此,一些对象可能会因为颜色的不同而被错误的区分.另外,尺度不变特征变换对关键点局部范围内描述子主方向的依赖性非常强,直接决定了匹配的正确率,但是研究表明,主方向分配产生的误差仅有三分之二左右能控制在[-20。,+20。]范围内,因此部分特征会有三分之一的概率因为主方向分配的误差较大而不能正确匹配.针对以上两个问题,本文提出了一种具有颜色和尺度不变性的局部特征描述方法,颜色不变性通过将RGB图像转换到高斯颜色模型下实现,特征描述过程中不再分配主方向,而用局部相对方向,尺度不变性通过构建高斯金子塔实现.实验选取阿姆斯特丹数据集图像进行了测试,结果表明本文方法比传统尺度不变特征变换方法,在特征点的数目、分布均匀性以及匹配精度方面均有所提高. 展开更多
关键词 尺度不变特征变换 颜色不变性 尺度不变性 增强型近似最近邻匹配 主方向
下载PDF
CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法 被引量:4
4
作者 谢海华 李奥林 +4 位作者 李亚博 陈志优 程静 吕肖庆 汤帜 《中文信息学报》 CSCD 北大核心 2021年第5期38-45,共8页
由于汉语语义表达的多样性和复杂性,中文错别字自动纠正目前存在很多挑战。现有的错别字纠正算法的性能普遍不够理想,而且需要大量高质量的语料进行训练。该文提出一种基于预训练语言模型的错别字纠正方法CPLM-CSC,能够显著地提高纠错... 由于汉语语义表达的多样性和复杂性,中文错别字自动纠正目前存在很多挑战。现有的错别字纠正算法的性能普遍不够理想,而且需要大量高质量的语料进行训练。该文提出一种基于预训练语言模型的错别字纠正方法CPLM-CSC,能够显著地提高纠错性能。CPLM-CSC采用基于单字级别预训练语言模型来进行错别字检测,并采用掩字语言模型来进行错别字纠正。为了提高纠正性能,CPLM-CSC采用音近、形近字判断等多种筛选纠正结果的方法,并针对一些典型且特殊的错误,例如"的地得"误用,采取了专门的数据增强方法。CPLM-CSC在SIGHAN 2015的评测数据集上进行了测试,取得了0.654的F1值,其性能优于其他模型。 展开更多
关键词 中文错别字纠正 预训练语言模型 单字级别模型
下载PDF
基于BERT模型的航天科技开源情报分类 被引量:4
5
作者 孔凡芃 刘旭红 +1 位作者 刘秀磊 李晗 《北京信息科技大学学报(自然科学版)》 2021年第1期28-33,共6页
提出一种基于BERT模型的航天科技开源情报分类算法。通过双向Transformer机制捕捉航天科技开源情报中句子间的关系;采用Multi-head Self-attention机制关注文本中的大量专有名词;结合Softmax分类器对提取的特征进行分类。与TextRCNN、DP... 提出一种基于BERT模型的航天科技开源情报分类算法。通过双向Transformer机制捕捉航天科技开源情报中句子间的关系;采用Multi-head Self-attention机制关注文本中的大量专有名词;结合Softmax分类器对提取的特征进行分类。与TextRCNN、DPCNN等主流语言模型相比,该算法在测试集上的准确率分别提升1.7%、3.33%,验证了该算法在航天科技开源情报分类上的有效性。 展开更多
关键词 文本分类 BERT模型 航天科技 开源情报
下载PDF
基于最优文档嵌入的《红楼梦》作者辨析 被引量:2
6
作者 薛扬 梁循 +1 位作者 谢华伦 杜玮 《中文信息学报》 CSCD 北大核心 2020年第9期97-110,共14页
该文以包括《红楼梦》在内的51部当代及明清文学作品为语料集,利用文档嵌入算法,根据文档嵌入向量的酉不变性定义了不同作者作品文档嵌入矩阵及文档嵌入损失函数,构建了文档嵌入模型中最优维度及最优窗口的选择模型,并根据文本用词和文... 该文以包括《红楼梦》在内的51部当代及明清文学作品为语料集,利用文档嵌入算法,根据文档嵌入向量的酉不变性定义了不同作者作品文档嵌入矩阵及文档嵌入损失函数,构建了文档嵌入模型中最优维度及最优窗口的选择模型,并根据文本用词和文档主题语义特征构建了高维空间中的文档嵌入向量。通过无监督的流形学习降维映射以及有监督的分类算法多组实验,验证了通过文档嵌入得到的向量空间模型可以有效区分不同作者的写作风格,对于已知确定作者的作品分类准确率达99.6%,对于风格较为接近的作者也可以有效识别,例如,文风相似的路遥和陈忠实。并在此分类模型的基础上,构建了变尺度滑动窗口分类模型对《红楼梦》进行深入分析,印证了"红楼梦"前80回与后40回可能来自不同作者,还发现了前100回与后20回也存在着较大的风格差异,不排除有再次更换作者的可能。该文在计算机技术层面上为《红楼梦》的作者辨析问题提供了一种支持意见和新的见解。 展开更多
关键词 红楼梦 作者识别 文档嵌入 最优维度
下载PDF
基于路径分析和关系描述的知识图谱补全方法 被引量:1
7
作者 佟强 刘旭红 +1 位作者 陈雨婷 陈玉立 《科学技术与工程》 北大核心 2021年第12期4999-5004,共6页
面对相对复杂的互联网信息,知识图谱能够将其表达成更加便于理解的形式,通过可视化技术加以显示并提供有价值的参考。但伴随数据实体及实体关系的快速扩增,知识图谱的稀疏性和连通性不足等问题日趋凸显。提出一种基于路径分析和关系描... 面对相对复杂的互联网信息,知识图谱能够将其表达成更加便于理解的形式,通过可视化技术加以显示并提供有价值的参考。但伴随数据实体及实体关系的快速扩增,知识图谱的稀疏性和连通性不足等问题日趋凸显。提出一种基于路径分析和关系描述的知识图谱补全方法,并以泛娱乐领域相关数据为例,对该方法的有效性进行验证。构建基于泛娱乐知识特点的泛娱乐领域知识图谱,并在该知识图谱上进行验证实验。实验结果表明,提出的方法能够很好地推理出知识图谱中的隐含与遗漏路径,有效地实现知识图谱补全,从而发现具有丰富价值的隐含知识。 展开更多
关键词 知识图谱补全 情报获取 知识表示 推理路径分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部