期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
CEBX:新一代结构化版式文档技术
被引量:
3
1
作者
汤帜
仇睿恒
王毅
《北京信息科技大学学报(自然科学版)》
2010年第S2期11-15,共5页
随着IT技术的发展,越来越多的人习惯于在计算机或移动终端上进行阅读,但传统的版式文档缺乏屏幕自适应特性,不适合在移动终端上阅读,为了提供在不同移动设备上数字内容最佳的阅读体验,需要有更好的文档格式。CEBX是新一代结构化版式文...
随着IT技术的发展,越来越多的人习惯于在计算机或移动终端上进行阅读,但传统的版式文档缺乏屏幕自适应特性,不适合在移动终端上阅读,为了提供在不同移动设备上数字内容最佳的阅读体验,需要有更好的文档格式。CEBX是新一代结构化版式文档技术,该技术实现一次制作、多平台多次利用,既可以原版原式地显示或打印,又可以在移动设备上更好地实现高质量的实时排版和屏幕自适应。此外,CEBX技术在适应移动互联网应用方面提供更好的技术特性,包括减少文档格式的数据量小以提高压缩倍率、减少解析引擎的复杂度以提高解析速度、支持部分加密等灵活的文档对象处理机制等。
展开更多
关键词
版式文档
文档格式
结构信息
下载PDF
职称材料
布谷鸟搜索算法研究及其应用进展
被引量:
12
2
作者
吴一全
周建伟
《智能系统学报》
CSCD
北大核心
2020年第3期435-444,共10页
为进一步加强布谷鸟算法的搜寻能力并提升收敛速度,加快对算法的研究与应用进程,综述了布谷鸟算法的原理、研究概况和其他同类群体智能优化算法的比较及发展趋势。首先给出了算法的基本模型和实现步骤;然后重点阐述了基于发现概率和步...
为进一步加强布谷鸟算法的搜寻能力并提升收敛速度,加快对算法的研究与应用进程,综述了布谷鸟算法的原理、研究概况和其他同类群体智能优化算法的比较及发展趋势。首先给出了算法的基本模型和实现步骤;然后重点阐述了基于发现概率和步长控制量、基于自适应步长、基于混沌理论、与其他算法混合、基于种群特征和种群变异、结合优化策略及基于种群多样性等方面的改进方法,总结了算法的主要应用领域及其进展;随后将其与遗传算法、蚁群优化算法、粒子群优化算法及人工蜂群优化算法的优点、缺点及适用性诸方面进行了对比;最后指出了布谷鸟搜索算法尚存在的缺陷并对进一步的研究方向进行了展望。
展开更多
关键词
群体智能
布谷鸟搜索算法
启发式算法
寄巢产卵
莱维飞行
自适应步长
混沌
种群多样性
下载PDF
职称材料
尺度与颜色不变性图像特征描述
被引量:
2
3
作者
刘岩
吕肖庆
+2 位作者
秦叶阳
汤帜
徐剑波
《小型微型计算机系统》
CSCD
北大核心
2012年第10期2297-2302,共6页
尺度不变特征变换是目前公认的鲁棒性最强的图像特征描述方法之一,在尺度不变性和几何不变性方面具有较好的特性,但该方法主要适用于灰度图像,对图像颜色的区分能力不强,因此,一些对象可能会因为颜色的不同而被错误的区分.另外,尺度不...
尺度不变特征变换是目前公认的鲁棒性最强的图像特征描述方法之一,在尺度不变性和几何不变性方面具有较好的特性,但该方法主要适用于灰度图像,对图像颜色的区分能力不强,因此,一些对象可能会因为颜色的不同而被错误的区分.另外,尺度不变特征变换对关键点局部范围内描述子主方向的依赖性非常强,直接决定了匹配的正确率,但是研究表明,主方向分配产生的误差仅有三分之二左右能控制在[-20。,+20。]范围内,因此部分特征会有三分之一的概率因为主方向分配的误差较大而不能正确匹配.针对以上两个问题,本文提出了一种具有颜色和尺度不变性的局部特征描述方法,颜色不变性通过将RGB图像转换到高斯颜色模型下实现,特征描述过程中不再分配主方向,而用局部相对方向,尺度不变性通过构建高斯金子塔实现.实验选取阿姆斯特丹数据集图像进行了测试,结果表明本文方法比传统尺度不变特征变换方法,在特征点的数目、分布均匀性以及匹配精度方面均有所提高.
展开更多
关键词
尺度不变特征变换
颜色不变性
尺度不变性
增强型近似最近邻匹配
主方向
下载PDF
职称材料
CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法
被引量:
4
4
作者
谢海华
李奥林
+4 位作者
李亚博
陈志优
程静
吕肖庆
汤帜
《中文信息学报》
CSCD
北大核心
2021年第5期38-45,共8页
由于汉语语义表达的多样性和复杂性,中文错别字自动纠正目前存在很多挑战。现有的错别字纠正算法的性能普遍不够理想,而且需要大量高质量的语料进行训练。该文提出一种基于预训练语言模型的错别字纠正方法CPLM-CSC,能够显著地提高纠错...
由于汉语语义表达的多样性和复杂性,中文错别字自动纠正目前存在很多挑战。现有的错别字纠正算法的性能普遍不够理想,而且需要大量高质量的语料进行训练。该文提出一种基于预训练语言模型的错别字纠正方法CPLM-CSC,能够显著地提高纠错性能。CPLM-CSC采用基于单字级别预训练语言模型来进行错别字检测,并采用掩字语言模型来进行错别字纠正。为了提高纠正性能,CPLM-CSC采用音近、形近字判断等多种筛选纠正结果的方法,并针对一些典型且特殊的错误,例如"的地得"误用,采取了专门的数据增强方法。CPLM-CSC在SIGHAN 2015的评测数据集上进行了测试,取得了0.654的F1值,其性能优于其他模型。
展开更多
关键词
中文错别字纠正
预训练语言模型
单字级别模型
下载PDF
职称材料
基于BERT模型的航天科技开源情报分类
被引量:
4
5
作者
孔凡芃
刘旭红
+1 位作者
刘秀磊
李晗
《北京信息科技大学学报(自然科学版)》
2021年第1期28-33,共6页
提出一种基于BERT模型的航天科技开源情报分类算法。通过双向Transformer机制捕捉航天科技开源情报中句子间的关系;采用Multi-head Self-attention机制关注文本中的大量专有名词;结合Softmax分类器对提取的特征进行分类。与TextRCNN、DP...
提出一种基于BERT模型的航天科技开源情报分类算法。通过双向Transformer机制捕捉航天科技开源情报中句子间的关系;采用Multi-head Self-attention机制关注文本中的大量专有名词;结合Softmax分类器对提取的特征进行分类。与TextRCNN、DPCNN等主流语言模型相比,该算法在测试集上的准确率分别提升1.7%、3.33%,验证了该算法在航天科技开源情报分类上的有效性。
展开更多
关键词
文本分类
BERT模型
航天科技
开源情报
下载PDF
职称材料
基于最优文档嵌入的《红楼梦》作者辨析
被引量:
2
6
作者
薛扬
梁循
+1 位作者
谢华伦
杜玮
《中文信息学报》
CSCD
北大核心
2020年第9期97-110,共14页
该文以包括《红楼梦》在内的51部当代及明清文学作品为语料集,利用文档嵌入算法,根据文档嵌入向量的酉不变性定义了不同作者作品文档嵌入矩阵及文档嵌入损失函数,构建了文档嵌入模型中最优维度及最优窗口的选择模型,并根据文本用词和文...
该文以包括《红楼梦》在内的51部当代及明清文学作品为语料集,利用文档嵌入算法,根据文档嵌入向量的酉不变性定义了不同作者作品文档嵌入矩阵及文档嵌入损失函数,构建了文档嵌入模型中最优维度及最优窗口的选择模型,并根据文本用词和文档主题语义特征构建了高维空间中的文档嵌入向量。通过无监督的流形学习降维映射以及有监督的分类算法多组实验,验证了通过文档嵌入得到的向量空间模型可以有效区分不同作者的写作风格,对于已知确定作者的作品分类准确率达99.6%,对于风格较为接近的作者也可以有效识别,例如,文风相似的路遥和陈忠实。并在此分类模型的基础上,构建了变尺度滑动窗口分类模型对《红楼梦》进行深入分析,印证了"红楼梦"前80回与后40回可能来自不同作者,还发现了前100回与后20回也存在着较大的风格差异,不排除有再次更换作者的可能。该文在计算机技术层面上为《红楼梦》的作者辨析问题提供了一种支持意见和新的见解。
展开更多
关键词
红楼梦
作者识别
文档嵌入
最优维度
下载PDF
职称材料
基于路径分析和关系描述的知识图谱补全方法
被引量:
1
7
作者
佟强
刘旭红
+1 位作者
陈雨婷
陈玉立
《科学技术与工程》
北大核心
2021年第12期4999-5004,共6页
面对相对复杂的互联网信息,知识图谱能够将其表达成更加便于理解的形式,通过可视化技术加以显示并提供有价值的参考。但伴随数据实体及实体关系的快速扩增,知识图谱的稀疏性和连通性不足等问题日趋凸显。提出一种基于路径分析和关系描...
面对相对复杂的互联网信息,知识图谱能够将其表达成更加便于理解的形式,通过可视化技术加以显示并提供有价值的参考。但伴随数据实体及实体关系的快速扩增,知识图谱的稀疏性和连通性不足等问题日趋凸显。提出一种基于路径分析和关系描述的知识图谱补全方法,并以泛娱乐领域相关数据为例,对该方法的有效性进行验证。构建基于泛娱乐知识特点的泛娱乐领域知识图谱,并在该知识图谱上进行验证实验。实验结果表明,提出的方法能够很好地推理出知识图谱中的隐含与遗漏路径,有效地实现知识图谱补全,从而发现具有丰富价值的隐含知识。
展开更多
关键词
知识图谱补全
情报获取
知识表示
推理路径分析
下载PDF
职称材料
题名
CEBX:新一代结构化版式文档技术
被引量:
3
1
作者
汤帜
仇睿恒
王毅
机构
北京大学计算机科学
技术
研究所
北大方正集团有限公司数字出版技术国家重点实验室
(筹)
出处
《北京信息科技大学学报(自然科学版)》
2010年第S2期11-15,共5页
基金
国家科技重大专项项目"版式文档标准制定与软件产品研发及产业化"项目资助(2010ZX01044-002-01)
文摘
随着IT技术的发展,越来越多的人习惯于在计算机或移动终端上进行阅读,但传统的版式文档缺乏屏幕自适应特性,不适合在移动终端上阅读,为了提供在不同移动设备上数字内容最佳的阅读体验,需要有更好的文档格式。CEBX是新一代结构化版式文档技术,该技术实现一次制作、多平台多次利用,既可以原版原式地显示或打印,又可以在移动设备上更好地实现高质量的实时排版和屏幕自适应。此外,CEBX技术在适应移动互联网应用方面提供更好的技术特性,包括减少文档格式的数据量小以提高压缩倍率、减少解析引擎的复杂度以提高解析速度、支持部分加密等灵活的文档对象处理机制等。
关键词
版式文档
文档格式
结构信息
Keywords
fixed-layout document
document format
structured Information
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
布谷鸟搜索算法研究及其应用进展
被引量:
12
2
作者
吴一全
周建伟
机构
南京航空航天大学电子信息工程学院
北京市测绘设计研究院城市空间信息工程北京市
重点
实验室
北大方正集团有限公司数字出版技术国家重点实验室
出处
《智能系统学报》
CSCD
北大核心
2020年第3期435-444,共10页
基金
国家自然科学基金项目(61573183)
城市空间信息工程北京市重点实验室开放基金项目(2014203)
北大方正集团有限公司数字出版技术国家重点实验室开放课题项目.
文摘
为进一步加强布谷鸟算法的搜寻能力并提升收敛速度,加快对算法的研究与应用进程,综述了布谷鸟算法的原理、研究概况和其他同类群体智能优化算法的比较及发展趋势。首先给出了算法的基本模型和实现步骤;然后重点阐述了基于发现概率和步长控制量、基于自适应步长、基于混沌理论、与其他算法混合、基于种群特征和种群变异、结合优化策略及基于种群多样性等方面的改进方法,总结了算法的主要应用领域及其进展;随后将其与遗传算法、蚁群优化算法、粒子群优化算法及人工蜂群优化算法的优点、缺点及适用性诸方面进行了对比;最后指出了布谷鸟搜索算法尚存在的缺陷并对进一步的研究方向进行了展望。
关键词
群体智能
布谷鸟搜索算法
启发式算法
寄巢产卵
莱维飞行
自适应步长
混沌
种群多样性
Keywords
swarm intelligence
cuckoo search algorithm
metaheuristic algorithm
nest spawning
Levy flights
adaptive step size
chaotic
population diversity
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
尺度与颜色不变性图像特征描述
被引量:
2
3
作者
刘岩
吕肖庆
秦叶阳
汤帜
徐剑波
机构
北京大学计算机科学
技术
研究所
北大方正集团有限公司数字出版技术国家重点实验室
中关村科技园区海淀园博士后工作站
北京大学网络教育学院
出处
《小型微型计算机系统》
CSCD
北大核心
2012年第10期2297-2302,共6页
基金
国家"九七三"重点基础研究发展计划项目(2010CB735908)资助
北京市博士后科研活动经费项目资助
文摘
尺度不变特征变换是目前公认的鲁棒性最强的图像特征描述方法之一,在尺度不变性和几何不变性方面具有较好的特性,但该方法主要适用于灰度图像,对图像颜色的区分能力不强,因此,一些对象可能会因为颜色的不同而被错误的区分.另外,尺度不变特征变换对关键点局部范围内描述子主方向的依赖性非常强,直接决定了匹配的正确率,但是研究表明,主方向分配产生的误差仅有三分之二左右能控制在[-20。,+20。]范围内,因此部分特征会有三分之一的概率因为主方向分配的误差较大而不能正确匹配.针对以上两个问题,本文提出了一种具有颜色和尺度不变性的局部特征描述方法,颜色不变性通过将RGB图像转换到高斯颜色模型下实现,特征描述过程中不再分配主方向,而用局部相对方向,尺度不变性通过构建高斯金子塔实现.实验选取阿姆斯特丹数据集图像进行了测试,结果表明本文方法比传统尺度不变特征变换方法,在特征点的数目、分布均匀性以及匹配精度方面均有所提高.
关键词
尺度不变特征变换
颜色不变性
尺度不变性
增强型近似最近邻匹配
主方向
Keywords
scale invariant feature transform
color invariance
scale invariance
enhanced approximate nearest neighbor matching
canonical orientation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法
被引量:
4
4
作者
谢海华
李奥林
李亚博
陈志优
程静
吕肖庆
汤帜
机构
北大方正集团
有限公司
北京大学王选计算机研究所
出处
《中文信息学报》
CSCD
北大核心
2021年第5期38-45,共8页
基金
国家重点研发计划(2019YFB1406302)
国家自然科学基金(61472014,61573028,61432020)
+1 种基金
北京市自然科学基金(4142023)
北京市科技新星计划(XX2015B010)。
文摘
由于汉语语义表达的多样性和复杂性,中文错别字自动纠正目前存在很多挑战。现有的错别字纠正算法的性能普遍不够理想,而且需要大量高质量的语料进行训练。该文提出一种基于预训练语言模型的错别字纠正方法CPLM-CSC,能够显著地提高纠错性能。CPLM-CSC采用基于单字级别预训练语言模型来进行错别字检测,并采用掩字语言模型来进行错别字纠正。为了提高纠正性能,CPLM-CSC采用音近、形近字判断等多种筛选纠正结果的方法,并针对一些典型且特殊的错误,例如"的地得"误用,采取了专门的数据增强方法。CPLM-CSC在SIGHAN 2015的评测数据集上进行了测试,取得了0.654的F1值,其性能优于其他模型。
关键词
中文错别字纠正
预训练语言模型
单字级别模型
Keywords
Chinese spelling checking and correction
pre-trained language model
char-based model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于BERT模型的航天科技开源情报分类
被引量:
4
5
作者
孔凡芃
刘旭红
刘秀磊
李晗
机构
北京信息科技大学网络文化与
数字
传播北京市
重点
实验室
北京信息科技大学数据与科学情报分析
实验室
北京大学
北大方正集团有限公司数字出版技术国家重点实验室
出处
《北京信息科技大学学报(自然科学版)》
2021年第1期28-33,共6页
基金
国家重点研发计划项目(2018YFC0830202)
北京市自然科学基金资助项目(4204100)
+2 种基金
北大方正集团有限公司数字出版技术国家重点实验室专项课题
面向边缘计算的创新科研平台建设项目(2020KYNH105)
北京信息科技大学“勤信人才”培育计划。
文摘
提出一种基于BERT模型的航天科技开源情报分类算法。通过双向Transformer机制捕捉航天科技开源情报中句子间的关系;采用Multi-head Self-attention机制关注文本中的大量专有名词;结合Softmax分类器对提取的特征进行分类。与TextRCNN、DPCNN等主流语言模型相比,该算法在测试集上的准确率分别提升1.7%、3.33%,验证了该算法在航天科技开源情报分类上的有效性。
关键词
文本分类
BERT模型
航天科技
开源情报
Keywords
text classification
BERT model
aerospace science and technology
open source intelligence
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于最优文档嵌入的《红楼梦》作者辨析
被引量:
2
6
作者
薛扬
梁循
谢华伦
杜玮
机构
中国人民大学信息学院
北大方正集团有限公司数字出版技术国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2020年第9期97-110,共14页
基金
国家自然科学基金(71531012)
数字出版技术国家重点实验室开放课题。
文摘
该文以包括《红楼梦》在内的51部当代及明清文学作品为语料集,利用文档嵌入算法,根据文档嵌入向量的酉不变性定义了不同作者作品文档嵌入矩阵及文档嵌入损失函数,构建了文档嵌入模型中最优维度及最优窗口的选择模型,并根据文本用词和文档主题语义特征构建了高维空间中的文档嵌入向量。通过无监督的流形学习降维映射以及有监督的分类算法多组实验,验证了通过文档嵌入得到的向量空间模型可以有效区分不同作者的写作风格,对于已知确定作者的作品分类准确率达99.6%,对于风格较为接近的作者也可以有效识别,例如,文风相似的路遥和陈忠实。并在此分类模型的基础上,构建了变尺度滑动窗口分类模型对《红楼梦》进行深入分析,印证了"红楼梦"前80回与后40回可能来自不同作者,还发现了前100回与后20回也存在着较大的风格差异,不排除有再次更换作者的可能。该文在计算机技术层面上为《红楼梦》的作者辨析问题提供了一种支持意见和新的见解。
关键词
红楼梦
作者识别
文档嵌入
最优维度
Keywords
A Dream of Red Mansions
authorship identification
document embedding
optimal dimension
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于路径分析和关系描述的知识图谱补全方法
被引量:
1
7
作者
佟强
刘旭红
陈雨婷
陈玉立
机构
北京信息科技大学数据与科学情报分析
实验室
北京信息科技大学网络文化与
数字
传播北京市
重点
实验室
北京信息科技大学
北大方正集团有限公司数字出版技术国家重点实验室
出处
《科学技术与工程》
北大核心
2021年第12期4999-5004,共6页
基金
国家重点研发计划(2017YFB1400402)
北京市教育委员会科技计划面上项目(KM201811232018)
+2 种基金
网络文化与数字传播北京市重点实验室开放课题(ICDDXN006)
北京信息科技大学“勤信人才”培育计划(5112011106)
北大方正集团有限公司数字出版技术国家重点实验室专项课题。
文摘
面对相对复杂的互联网信息,知识图谱能够将其表达成更加便于理解的形式,通过可视化技术加以显示并提供有价值的参考。但伴随数据实体及实体关系的快速扩增,知识图谱的稀疏性和连通性不足等问题日趋凸显。提出一种基于路径分析和关系描述的知识图谱补全方法,并以泛娱乐领域相关数据为例,对该方法的有效性进行验证。构建基于泛娱乐知识特点的泛娱乐领域知识图谱,并在该知识图谱上进行验证实验。实验结果表明,提出的方法能够很好地推理出知识图谱中的隐含与遗漏路径,有效地实现知识图谱补全,从而发现具有丰富价值的隐含知识。
关键词
知识图谱补全
情报获取
知识表示
推理路径分析
Keywords
knowledge graph completion
information acquisition
knowledge representation
inference path analysis
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
CEBX:新一代结构化版式文档技术
汤帜
仇睿恒
王毅
《北京信息科技大学学报(自然科学版)》
2010
3
下载PDF
职称材料
2
布谷鸟搜索算法研究及其应用进展
吴一全
周建伟
《智能系统学报》
CSCD
北大核心
2020
12
下载PDF
职称材料
3
尺度与颜色不变性图像特征描述
刘岩
吕肖庆
秦叶阳
汤帜
徐剑波
《小型微型计算机系统》
CSCD
北大核心
2012
2
下载PDF
职称材料
4
CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法
谢海华
李奥林
李亚博
陈志优
程静
吕肖庆
汤帜
《中文信息学报》
CSCD
北大核心
2021
4
下载PDF
职称材料
5
基于BERT模型的航天科技开源情报分类
孔凡芃
刘旭红
刘秀磊
李晗
《北京信息科技大学学报(自然科学版)》
2021
4
下载PDF
职称材料
6
基于最优文档嵌入的《红楼梦》作者辨析
薛扬
梁循
谢华伦
杜玮
《中文信息学报》
CSCD
北大核心
2020
2
下载PDF
职称材料
7
基于路径分析和关系描述的知识图谱补全方法
佟强
刘旭红
陈雨婷
陈玉立
《科学技术与工程》
北大核心
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部