期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
文本相似度计算方法提高诊断名称数据标准化过程中人工判断效率的影响
1
作者 郑景文 《中国卫生产业》 2022年第9期166-169,共4页
目的研究文本相似度计算方法在提高诊断名称数据标准化过程中人工判断效率的价值。方法严格遵照国家标准的疾病分类与代码上存在编码的诊断名称,按疾病名称进行排序,并对其ID进行标记,选择2020年3月—2021年8月使用的23681条诊断名称文... 目的研究文本相似度计算方法在提高诊断名称数据标准化过程中人工判断效率的价值。方法严格遵照国家标准的疾病分类与代码上存在编码的诊断名称,按疾病名称进行排序,并对其ID进行标记,选择2020年3月—2021年8月使用的23681条诊断名称文本数据,利用余弦相似度计算文本相似度,并通过单字与单字组合的穷举分词及频数、逆文本频率指数加权形成文本向量,经函数对计算结果进行校正。结果诊断名称长度为8.58个字符,获得9字组长度,经观察发现3字组后,字组暂停增长,但5字组逐渐减低,从而得知9字组长度未达50万维,可利用计算机处理。通过余弦相似度的计算,选择频数向量成为非标准数据,而标准数据选择频数逆文本频率指数加权的向量,最终将数据标准化。利用疾病诊断名称相似的文本,发现文本向量存在较大差别,其自身即为相似度最大值。通过字组组合的方式,测定不同文本向量,选择高血压进行举例。各类字组组合模式下存在356条诊断名称,其中390次相似度最大值并不是其本身。对于不同的情况实施分析,字组组合模式Ⅰ不一致,Ⅱ~Ⅸ模式一致,记成0、1、1、1、1、1、1、1、1。结论文本相似度计算方法能够提升诊断名称数据标准化,并促进人工判断效率改善。 展开更多
关键词 人工判断效率 文本相似度计算法 诊断名称数据标准化
下载PDF
基于关联规则的Wikidata人物名称数据分析——以诺贝尔文学奖得主为主题 被引量:3
2
作者 贾君枝 冯婕 《图书情报工作》 CSSCI 北大核心 2017年第12期122-128,共7页
[目的 /意义]挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程]提出一种基于人物实体数... [目的 /意义]挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程]提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析。[结果 /结论]分析右部为地点名称、机构名称、时间名称和主题名称等4种不同类型规则的关联特征,实现不同名称数据类型的关系挖掘问题。本研究可为知识的揭示、聚合和关联提供新的视角,探索了数据挖掘技术在名称数据中的应用。 展开更多
关键词 名称数据 关联规则 APRIORI算法 知识揭示 Wikidata
原文传递
中文个人名称规范数据属性分析与关联研究 被引量:1
3
作者 胡媛 《河南图书馆学刊》 2019年第1期112-114,共3页
名称规范控制工作是图书馆重要的业务工作,随着图书馆文献类型的增多,名称规范工作的重要功能更加凸显,但中文名称规范数据属性的不足制约了其功能的发挥。因此,图书馆只有加强中文个人名称规范数据属性分析,做好关联性研究,才能使图书... 名称规范控制工作是图书馆重要的业务工作,随着图书馆文献类型的增多,名称规范工作的重要功能更加凸显,但中文名称规范数据属性的不足制约了其功能的发挥。因此,图书馆只有加强中文个人名称规范数据属性分析,做好关联性研究,才能使图书馆真正回归文化建设的核心地位。文章在梳理我国图书馆中文名称规范理论与实践成果的基础上,进行了数据属性的详尽分析与关联性研究。 展开更多
关键词 名称规范数据 规范数据属性 关联性
下载PDF
中文名称规范数据与Wikidata语义关联实现 被引量:4
4
作者 薛秋红 贾君枝 刘会洲 《情报理论与实践》 CSSCI 北大核心 2019年第10期146-150,共5页
[目的/意义]中文名称规范数据与Wikidata的语义整合可以借助网络平台的优势扩大规范数据的共享范围,增加规范数据的价值。[方法/过程]文章采用语义关联的方法,首先将中文名称规范档的数据进行语义化,然后使用PARIS算法,实现了语义化的... [目的/意义]中文名称规范数据与Wikidata的语义整合可以借助网络平台的优势扩大规范数据的共享范围,增加规范数据的价值。[方法/过程]文章采用语义关联的方法,首先将中文名称规范档的数据进行语义化,然后使用PARIS算法,实现了语义化的中文名称规范数据与Wikidata的实体对齐,最后对实体对齐的结果进行评估,并采用数据可视化的方式进行展示。[结果/结论]实验数据对齐的精度为70%,召回率为80%,取得良好的实验效果。 展开更多
关键词 中文名称规范数据 关联数据 维基百科 维基数据 语义关联
下载PDF
高校图书馆数据库列表及其呈现方式研究 被引量:5
5
作者 丁玉东 《新世纪图书馆》 CSSCI 2014年第11期52-55,共4页
论文通过对"211工程"高校图书馆数据库列表的调查,发现高校图书馆的数据库列表存在数据库名称不统一、列表排序无规律、数据库链接层次太深、数据库介绍页面较为随意、数据库导航较简单等问题,给出了建立多角度的数据库导航... 论文通过对"211工程"高校图书馆数据库列表的调查,发现高校图书馆的数据库列表存在数据库名称不统一、列表排序无规律、数据库链接层次太深、数据库介绍页面较为随意、数据库导航较简单等问题,给出了建立多角度的数据库导航、保持数据库列表的统一性、数据库子库和平台或总库全部列出、完善数据库介绍页面以及设置数据库快速访问入口等建议。 展开更多
关键词 图书馆网站 数据库列表 数据名称
下载PDF
基于神经网络的命名数据网学习型FIB研究 被引量:1
6
作者 刘开华 闫柳 +3 位作者 李卓 宫霄霖 彭鹏 王彬志 《天津大学学报(自然科学与工程技术版)》 EI CSCD 北大核心 2020年第8期825-832,共8页
针对命名数据网转发信息库快速检索差异化名称数据、高效存储转发信息和有效支持最长名称前缀匹配机制的需求和挑战,提出了基于神经网络的命名数据网学习型FIB整体方案,称L-FIB.首先,介绍了L-FIB的索引结构LearningTree,通过使用塔式两... 针对命名数据网转发信息库快速检索差异化名称数据、高效存储转发信息和有效支持最长名称前缀匹配机制的需求和挑战,提出了基于神经网络的命名数据网学习型FIB整体方案,称L-FIB.首先,介绍了L-FIB的索引结构LearningTree,通过使用塔式两级神经网络模型学习索引内容在存储器中的分布情况,实现更均匀的数据映射,降低映射冲突,提高存储效率.其次,研究了L-FIB的存储结构和名称数据检索算法,片内高速存储器部署多个与不同名称前缀组件数相对应的索引结构Learning Tree,片外低速存储器部署多个与索引结构Learning Tree对应的FIB存储池,并通过相应的名称数据检索算法实现对兴趣包的转发信息检索和转发信息更新操作,有效支持了命名数据网的最长名称前缀匹配机制,提高了名称数据检索速度.实验结果表明,L-FIB在误判概率、存储消耗和吞吐量方面的综合性能明显优于其他对比方案.在误判概率低于1%的条件下,L-FIB的索引结构存储消耗仅为58.258 MB,能够部署于高速存储器SRAM上.L-FIB的实际吞吐量约为11.64×10^6数据包/s,可以满足当前命名数据网对数据包快速处理的要求. 展开更多
关键词 命名数据 转发信息库 神经网络 名称数据检索
下载PDF
基于VLOOKUP函数的数据纵向搜索的高效应用——以从考试安排总表中生成各系(部)监考子表为例
7
作者 廖德伟 颜丽 《萍乡学院学报》 2015年第6期79-82,共4页
VLOOKUP函数是Excel里的高级函数,它可实现对数据表格基于首列数据的纵向搜索查询。对于工作中出现的复杂数据表格来说,若要完成数据抽选生成,VLOOKUP函数则显得相当精确高效。本文以萍乡学院期末监考总表抽选生成各系(部)监考子表为例... VLOOKUP函数是Excel里的高级函数,它可实现对数据表格基于首列数据的纵向搜索查询。对于工作中出现的复杂数据表格来说,若要完成数据抽选生成,VLOOKUP函数则显得相当精确高效。本文以萍乡学院期末监考总表抽选生成各系(部)监考子表为例,阐述VLOOKUP函数的搜索功能与使用方法。 展开更多
关键词 纵向搜索 函数公式 数据名称
下载PDF
近代广东海关档案名称规范档的语义模型构建 被引量:4
8
作者 王卉 《图书馆论坛》 CSSCI 北大核心 2021年第5期118-126,共9页
文章针对近代广东海关档案现存的语言、书写及专有名词不断变换问题,提出近代广东海关档案海关档案名称规范档的语义模型,为档案中多样化的相关名称表达提供数据规范。针对近代广东海关档案中不一致的名称,通过规范控制来分析其中的文... 文章针对近代广东海关档案现存的语言、书写及专有名词不断变换问题,提出近代广东海关档案海关档案名称规范档的语义模型,为档案中多样化的相关名称表达提供数据规范。针对近代广东海关档案中不一致的名称,通过规范控制来分析其中的文字表征、发音特征以及相关的表达方式;参考《中国档案主题词表》及近代广东海关档案专有名词词典,从语义逻辑关系出发,构建近代广东海关档案名称规范数据的语义模型。近代广东海关档案名称规范数据语义模型的构建,不仅可以作为其他海关档案开发利用的参考框架,而且为进一步构建海关档案本体提供数据基础。 展开更多
关键词 广东海关档案 名称规范数据 名称规范档 语义模型
下载PDF
利用自发地理信息数据辅助快速成图
9
作者 冉花 张育育 +1 位作者 屈颖 孙苏利 《测绘技术装备》 2021年第3期79-83,共5页
随着我国越来越多地参与国际事务、实施全球战略,对全球地理空间信息数据的需求越来越迫切。由于谷歌等国际通用地图的使用受限,国内地图平台提供的国外地图数据现势性差,国内地理信息相关人员在获得国外测绘数据时遇到越来越多的瓶颈问... 随着我国越来越多地参与国际事务、实施全球战略,对全球地理空间信息数据的需求越来越迫切。由于谷歌等国际通用地图的使用受限,国内地图平台提供的国外地图数据现势性差,国内地理信息相关人员在获得国外测绘数据时遇到越来越多的瓶颈问题,VGI数据有望成为解决这一瓶颈问题的重要手段。通过实例介绍常见自发地理信息的数据结构、分类体系、转换方法及实际应用等内容,希望能为相关人员在解决数据获取限制、加快数据更新使用上提供参考。 展开更多
关键词 自发地理信息 开源地图 地理名称地理数据 数据转换
下载PDF
Access数据库安全五招
10
作者 晓兵 《网管员世界》 2003年第9期65-65,共1页
在用Access做后台数据库时,如果有人通过各种方法知道或者猜到了服务器的Access数据库的路径和数据库名称,那么他就能够下载这个Access数据库文件,这是非常危险的。举例说来,我在网站www.obssession.com中,有一个Access数据库userpa... 在用Access做后台数据库时,如果有人通过各种方法知道或者猜到了服务器的Access数据库的路径和数据库名称,那么他就能够下载这个Access数据库文件,这是非常危险的。举例说来,我在网站www.obssession.com中,有一个Access数据库userpass.mdb,我将其放在虚拟目录下的/gjb/mydatabase目录下,那么在浏览器中输人http://www.obssession.com/gjb/mydatabase/userpass.mdb.就可以下载数据库文件。 展开更多
关键词 ACCESS数据 数据名称 加密 框架网页
下载PDF
基于正则表达式的地学科学数据名称提取方法 被引量:1
11
作者 曹乔卓然 王丝丝 +2 位作者 陈祖刚 李国庆 李静 《地球信息科学学报》 EI CSCD 北大核心 2023年第8期1601-1610,共10页
地学科学数据是地学科技文献重要的支撑材料,大量地学科技文献中包含着研究数据信息,而数据名称一般体现着数据的基本内容,是其中的核心信息。从地学科技文献中自动提取研究数据名称,对于促进优质地学数据共享、复现文献实验与结果以及... 地学科学数据是地学科技文献重要的支撑材料,大量地学科技文献中包含着研究数据信息,而数据名称一般体现着数据的基本内容,是其中的核心信息。从地学科技文献中自动提取研究数据名称,对于促进优质地学数据共享、复现文献实验与结果以及实现科学数据与科技文献之间的关联具有重大意义,可在一定程度上解决当前地学文献中数据信息利用不充分的问题。本研究通过大量阅读地学文献,分析地学科技文献中描述数据来源信息段落的行文、结构特点以及数据名称的表述特征,在总结地学数据名称描述规律的基础上,提出了从地学科技文献中自动抽取地学数据名称的方法。该方法以数据类别特征词为规则触发词,利用正则表达式编写抽取规则,构建正则抽取规则库,从而完成对地学文献中数据名称信息的抽取。最后使用Java语言编写地学数据名称提取程序,以地学文献文本为实验数据材料,开展地学数据名称信息提取实验。实验结果表明,该方法可以有效地提取地学科技文献中的研究数据名称信息,准确率达到62%。 展开更多
关键词 地学科技文献 地学科学数据 数据名称 正则表达式 规则匹配 信息抽取
原文传递
A Study on Indexing Efficiency and Retrieval Accuracy for Author Name Search of Academic Papers
12
作者 Heejun Han Heeseok Choi Jaesoo Kim 《Computer Technology and Application》 2015年第2期57-63,共7页
Most academic information has its creator, that is, a subject who has created the information. The subject can be an individual, a group, or an institution, and can be a nation depending on the nature of the relevant ... Most academic information has its creator, that is, a subject who has created the information. The subject can be an individual, a group, or an institution, and can be a nation depending on the nature of the relevant information. Most web data are composed of a title, an author, and contents. A paper which is under the academic information category has metadata including a title, an author, keyword, abstract, data about publication, place of publication, ISSN, and the like. A patent has metadata including the title, an applicant, an inventor, an attorney, IPC, number of application, and claims of the invention. Most web-based academic information services enable users to search the information by processing the meta-information. An important element is to search information by using the author field which corresponds to a personal name. This study suggests a method of efficient indexing and using the adjacent operation result ranking algorithm to which phrase search-based boosting elements are applied, and thus improving the accuracy of the search results of author name. This method can be effectively applied to providing accurate search results in the academic information services. 展开更多
关键词 Author name search information retrieval INDEXING search algorithm boosting.
下载PDF
支持泛洪攻击检测的命名数据网PIT 被引量:1
13
作者 彭鹏 李卓 +2 位作者 梁纪峰 马天祥 刘开华 《北京邮电大学学报》 EI CAS CSCD 北大核心 2021年第2期61-67,共7页
针对命名数据网待定兴趣转发表中高效的变长名称数据索引、硬件可支持的存储消耗以及兴趣包泛洪攻击检测等问题,提出了基于字符卷积神经网络的认知索引模型(C&I),该模型能够支持路由名称数据的分类、聚合,降低名称数据的存储消耗.同... 针对命名数据网待定兴趣转发表中高效的变长名称数据索引、硬件可支持的存储消耗以及兴趣包泛洪攻击检测等问题,提出了基于字符卷积神经网络的认知索引模型(C&I),该模型能够支持路由名称数据的分类、聚合,降低名称数据的存储消耗.同时,基于C&I提出了支持兴趣包泛洪攻击检测的待定兴趣转发表(PIT)存储结构C&IPIT及其数据检索算法,通过多级存储器部署方式,分别在片上和片下的存储器中部署索引结构及存储空间.实验结果表明,C&I-PIT在名称数据聚合、存储消耗、泛洪攻击检测等方面具有良好的性能. 展开更多
关键词 命名数据 待定兴趣转发表 名称数据索引 字符卷积神经网络 兴趣包泛洪攻击
原文传递
基于双向跳表的命名数据网内容存储池
14
作者 刘开华 周美丽 李卓 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第9期50-56,共7页
针对命名数据网中内容存储池须要快速检索差异化名称数据、高效存储数据信息和有效支持缓存替换策略的设计需求,提出了一种基于双向跳表的命名数据网内容存储池的存储结构学习树-双向跳表(LT-DSL).该存储结构由部署于片上的学习树和部... 针对命名数据网中内容存储池须要快速检索差异化名称数据、高效存储数据信息和有效支持缓存替换策略的设计需求,提出了一种基于双向跳表的命名数据网内容存储池的存储结构学习树-双向跳表(LT-DSL).该存储结构由部署于片上的学习树和部署于片下的双向跳表(DSL)两种数据结构组成.LT-DSL通过重新设计索引数据结构来学习索引内容在存储器中的分布情况,实现了数据的均匀映射,提升了存储效率,降低了存储开销;同时,通过采用全新的名称数据检索算法来快速检索名称数据,LT-DSL有效支持了缓存替换策略,加速了数据处理过程.实验结果表明:相比其他基于跳表的内容存储池方案,LT-DSL在有效支持缓存替换策略和满足网络丢包率低于1%的前提下,进一步提升了数据检索速度,降低了整体存储开销. 展开更多
关键词 命名数据 转发平面 内容存储池 神经网络 跳表 名称数据检索
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部