期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于多重索引模型的大规模词典近似匹配算法 被引量:5
1
作者 龚才春 黄玉兰 +1 位作者 许洪波 白硕 《计算机研究与发展》 EI CSCD 北大核心 2008年第10期1776-1781,共6页
编辑器的拼写校正、搜索引擎的查询纠正、光学字符识别的结果检查等领域都用到词典近似匹配算法.传统单索引模式很难在高性能的前提下保证高召回率.词典越大问题越严重.提出了大规模词典近似匹配的多重索引模型,首先将背景词典根据单词... 编辑器的拼写校正、搜索引擎的查询纠正、光学字符识别的结果检查等领域都用到词典近似匹配算法.传统单索引模式很难在高性能的前提下保证高召回率.词典越大问题越严重.提出了大规模词典近似匹配的多重索引模型,首先将背景词典根据单词长度划分为若干子词典,对各子词典按照一定策略建立unigram,bigram,trigram,quadgram中的一种或若干种索引,当查找用户模式P的近似匹配时,根据模式P检索特定N-gram索引链,从而得到候选近似匹配集合C,对C中每一个单词W,计算P与W的编辑距离即可输出P的所有最终匹配结果R.实验表明,基于多重索引模型的词典近似匹配算法能够大幅度减少候选近似匹配结果的数量,从而提高词典近似匹配的速度. 展开更多
关键词 模式匹配 近似匹配 多重索引模型 大规模词典 拼写检查
下载PDF
基于整体特征的快速手写体数字字符识别 被引量:17
2
作者 龚才春 刘荣兴 《计算机工程与应用》 CSCD 北大核心 2004年第19期82-83,122,共3页
该文通过模拟人眼识别数字字符的过程,提出了一种基于字符整体特征(凹凸特征)的快速手写体数字字符识别方法。该方法不需要对字符图像做复杂的细化处理,减少了细化形变可能带来的误识和拒识;也不需要进行复杂的笔道特征分析,因此速度非... 该文通过模拟人眼识别数字字符的过程,提出了一种基于字符整体特征(凹凸特征)的快速手写体数字字符识别方法。该方法不需要对字符图像做复杂的细化处理,减少了细化形变可能带来的误识和拒识;也不需要进行复杂的笔道特征分析,因此速度非常快。同时,由于不同人书写的数字字符的整体特征都相同,因此该方法的识别率也非常高。 展开更多
关键词 凹凸分析 手写体数字字符识别 整体特征 快速算法
下载PDF
大规模语料的频繁模式快速发现算法 被引量:4
3
作者 龚才春 贺敏 +2 位作者 陈海强 许洪波 程学旗 《通信学报》 EI CSCD 北大核心 2007年第12期161-166,共6页
提出了一种大规模语料频繁模式快速发现算法,通过采用合适的策略将语料划分为若干子语料,对每个子语料单独进行处理,即可获得原始语料的频繁模式;同时该算法能够避免处理频次在设定阈值以下的模式,进一步减少了内存占用,提高了处理速度... 提出了一种大规模语料频繁模式快速发现算法,通过采用合适的策略将语料划分为若干子语料,对每个子语料单独进行处理,即可获得原始语料的频繁模式;同时该算法能够避免处理频次在设定阈值以下的模式,进一步减少了内存占用,提高了处理速度。实验表明,对3.6G互联网新闻语料发现频次大于100的所有频繁模式中最高消耗内存为1.6GB,单机平均每秒处理文本语料3.28M。 展开更多
关键词 频繁模式 语料划分 重复串
下载PDF
脱机手写体汉字字符的笔顺信息恢复 被引量:2
4
作者 龚才春 刘荣兴 《山东大学学报(理学版)》 CAS CSCD 北大核心 2004年第1期73-75,83,共4页
给出了一种从脱机手写体汉字字符中识别笔顺的法则———统一笔顺法则 ,将脱机识别问题转变为联机识别问题 ,利用人们熟悉的图论知识加以解决 ,大大提高了识别率和识别速度 ,也简化了识别过程 .
关键词 脱机手写体汉字字符识别 笔顺恢复 笔划
下载PDF
面向字符识别的快速小形变细化算法 被引量:1
5
作者 龚才春 刘荣兴 《计算机应用与软件》 CSCD 北大核心 2005年第2期88-89,共2页
本文描述了现有字符细化算法的思想及其缺陷 ,并且在分析细化形变根源的基础上给出了一种面向字符识别的快速细化算法。该算法不仅速度非常快 ,而且不会产生毛刺和伪分支点 ,细化后字符骨架形变很小。
关键词 字符识别 快速小形变细化算法 光学字符识别 模式识别 计算机
下载PDF
“元宇宙”的术语定义及相关问题研究 被引量:11
6
作者 龚才春 杜振雷 +1 位作者 周华 陈国贤 《中国科技术语》 2023年第1期27-35,共9页
近年来,全球掀起了元宇宙的投资和创业热潮,同时元宇宙也成为学术研究热点。“元宇宙”概念的泛化和定义模糊给相关研究、学术交流和产业发展造成了障碍。文章以元宇宙的概念为出发点,梳理了“元宇宙”术语定义的发展过程,对全国科学技... 近年来,全球掀起了元宇宙的投资和创业热潮,同时元宇宙也成为学术研究热点。“元宇宙”概念的泛化和定义模糊给相关研究、学术交流和产业发展造成了障碍。文章以元宇宙的概念为出发点,梳理了“元宇宙”术语定义的发展过程,对全国科学技术名词审定委员会提出的“元宇宙”定义(征求意见稿)进行了详细解读,分析了其定义的主要分歧,并对其做出了进一步思考,为元宇宙领域其他相关术语的定义和研究提供了思路。 展开更多
关键词 元宇宙 术语定义 虚拟世界 数字孪生 数字原生
下载PDF
一种基于大规模语料的新词识别方法 被引量:24
7
作者 贺敏 龚才春 +1 位作者 张华平 程学旗 《计算机工程与应用》 CSCD 北大核心 2007年第21期157-159,共3页
提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词。通过在不同规模的语料上实验发现,此方... 提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词。通过在不同规模的语料上实验发现,此方法可行有效,能够应用到词典编撰,术语提取等领域。 展开更多
关键词 新词 邻接类别 单字成词概率 双字耦合度
下载PDF
Kad网络节点资源探测分析 被引量:5
8
作者 刘祥涛 龚才春 +1 位作者 刘悦 白硕 《中文信息学报》 CSCD 北大核心 2010年第6期85-91,共7页
Kad网络中存在数以亿计的共享资源,而其中有相当一部分可被评定为敏感资源。为深入了解Kad网络上资源尤其是敏感资源的特征,运用Kad网络采集器:Rainbow对节点拥有的文件资源进行探测分析。该文发现:1)文件流行度和文件所对应的文件名数... Kad网络中存在数以亿计的共享资源,而其中有相当一部分可被评定为敏感资源。为深入了解Kad网络上资源尤其是敏感资源的特征,运用Kad网络采集器:Rainbow对节点拥有的文件资源进行探测分析。该文发现:1)文件流行度和文件所对应的文件名数量都近似符合Zipf分布;2)利用同一个"文件内容哈希"(即file-content-hash)的多个文件名的共现词可以更准确地进行敏感判别;3)敏感资源占随机样本的6.34%,且敏感资源中74.8%为video文件。 展开更多
关键词 对等网络 KAD网络 探测分析 敏感资源
下载PDF
元宇宙技术及应用研究进展 被引量:12
9
作者 蒋明 李琪 +2 位作者 龚才春 张峰 刘章珩 《广西科学》 CAS 北大核心 2023年第1期14-26,共13页
元宇宙(Metaverse)是一个虚拟时空的集合,由一系列的增强现实(Augmented Reality,AR)、虚拟现实(Virtual Reality,VR)和互联网(Internet)组成,是一个平行于现实世界运行的人造空间,也被认为是互联网的下一个阶段,是由AR、VR、3D等技术... 元宇宙(Metaverse)是一个虚拟时空的集合,由一系列的增强现实(Augmented Reality,AR)、虚拟现实(Virtual Reality,VR)和互联网(Internet)组成,是一个平行于现实世界运行的人造空间,也被认为是互联网的下一个阶段,是由AR、VR、3D等技术支持的虚拟现实的网络世界。自2021年以来,国内外掀起了研究元宇宙的热潮。本文介绍了元宇宙的起源和定义、发展元宇宙的意义、元宇宙的技术体系、发展面临的问题和风险等;重点分析了元宇宙的主流技术体系和典型应用场景,列举了相关研究成果和观点;最后给出了元宇宙未来的研究方向。 展开更多
关键词 元宇宙 数字经济 数字科技 虚拟现实 区块链 集成创新
下载PDF
元宇宙赋能高校思政教育:理论逻辑、实践路径及风险规避 被引量:2
10
作者 周华 龚才春 《武汉理工大学学报(社会科学版)》 2023年第5期75-80,共6页
元宇宙是人工智能、区块链、大数据、虚拟现实等多项新兴科技的融合运用和集成创新,其技术特征所带来的沉浸性、交互性、高度文明性的社会特征,将赋能未来高校思政教育模式的重大变革。元宇宙赋能高校思政教育是思政教育现代化的要求,... 元宇宙是人工智能、区块链、大数据、虚拟现实等多项新兴科技的融合运用和集成创新,其技术特征所带来的沉浸性、交互性、高度文明性的社会特征,将赋能未来高校思政教育模式的重大变革。元宇宙赋能高校思政教育是思政教育现代化的要求,有其相互契合的理论逻辑关联和实践可行性。元宇宙将会重构高校思政教育的时空场域,形塑高校思政教育的现实新样态,并大大提升高校思政教育的实效。然而,科技是一把双刃剑,规避文化侵蚀、数据伦理、技术至上、精神沉沦等多方面风险也是新时代推进思想政治教育守正创新的应有之义。 展开更多
关键词 元宇宙 思政教育 沉浸式 虚拟现实 守正创新
下载PDF
基于伪相关反馈模型的领域词典生成算法 被引量:2
11
作者 黄玉兰 龚才春 +1 位作者 许洪波 程学旗 《中文信息学报》 CSCD 北大核心 2008年第1期111-115,共5页
本文提出了一种基于伪相关反馈模型的领域词典自动生成算法。将领域词典生成过程视为领域术语的检索过程:假设初始检索出来的前若干个字符串与领域相关,将这些字符串加到领域词典中,重新检索,如此迭代,直到生成的领域词典达到预先设定... 本文提出了一种基于伪相关反馈模型的领域词典自动生成算法。将领域词典生成过程视为领域术语的检索过程:假设初始检索出来的前若干个字符串与领域相关,将这些字符串加到领域词典中,重新检索,如此迭代,直到生成的领域词典达到预先设定的规模。实验表明,本算法经过若干次迭代后生成的领域词典准确率高于已有领域词典生成算法。 展开更多
关键词 计算机应用 中文信息处理 有意串 领域词典 大规模语料 伪相关反馈
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部