期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于粗糙KNN算法的文本分类方法 被引量:5
1
作者 王渊 刘业政 姜元春 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第12期1513-1517,共5页
在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空... 在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空间,将文本向量空间分为核心和混合2大区域;然后改进传统KNN算法的隶属度函数;再针对不同的文本区域,采取差异化的分类策略以提高分类的效率和准确率。实验表明,基于粗糙KNN算法的文本分类方法在提高分类准确率的同时,分类的效率也有很大提高。 展开更多
关键词 文本分类 粗糙集 KNN算法 核心区域 混合区域
下载PDF
结合文字核心区域和扩展生长的藏文古籍文本行切分 被引量:4
2
作者 李金成 王筱娟 +2 位作者 王维兰 林强 胡鹏飞 《激光与光电子学进展》 CSCD 北大核心 2021年第2期105-115,共11页
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆... 藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。 展开更多
关键词 图像处理 藏文古籍文档图像 文本行切分 文字核心区域 扩展生长
原文传递
省级(域)科普工作评估的核心指标——基于访谈资料的质性分析 被引量:3
3
作者 张增一 贾萍萍 +1 位作者 王丽慧 莫扬 《科普研究》 北大核心 2023年第2期19-28,63,110,111,共13页
本研究对来自我国东部、中部和西部共计15位省级科协科普部部长进行深度访谈,累计获得标准化访谈文本13万余字。利用质性分析软件Nvivo11Plus对访谈文本进行开放式编码、主轴式编码和选择式编码。借助矩阵编码,在分析我国东部、中部和... 本研究对来自我国东部、中部和西部共计15位省级科协科普部部长进行深度访谈,累计获得标准化访谈文本13万余字。利用质性分析软件Nvivo11Plus对访谈文本进行开放式编码、主轴式编码和选择式编码。借助矩阵编码,在分析我国东部、中部和西部地区部分省级科协科普部部长对各具体指标科学性、准确性和可获得性方面的意见和态度的基础上,提出了三套分别适用于东部、中部、西部的科普工作评估核心指标体系。这三套核心指标体系不仅包含科普人员、经费、基础设施等传统指标,同时融合了科普创作与传媒、科普新态势等能够体现最新科普动态的定量指标。此外,定性案例也被纳入其中,用以辅助定量指标来对省级(域)科普工作进行更为全面的评估。 展开更多
关键词 省级(域)科普工作评估 核心指标 文本分析 质性分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部