期刊文献+
共找到551篇文章
< 1 2 28 >
每页显示 20 50 100
Text-to-SQL文本信息处理技术研究综述 被引量:1
1
作者 彭钰寒 乔少杰 +5 位作者 薛骐 李江敏 谢添丞 徐康镭 冉黎琼 曾少北 《无线电工程》 2024年第5期1053-1062,共10页
信号与信息处理的需求日益增加,离不开数据处理技术,数据处理需要数据库的支持,然而没有经过训练的使用者会因为不熟悉数据库操作产生诸多问题。文本转结构化查询语言(Text to Structured Query Language,Text-to-SQL)的出现,使用户无... 信号与信息处理的需求日益增加,离不开数据处理技术,数据处理需要数据库的支持,然而没有经过训练的使用者会因为不熟悉数据库操作产生诸多问题。文本转结构化查询语言(Text to Structured Query Language,Text-to-SQL)的出现,使用户无需掌握结构化查询语言(Structured Query Language,SQL)也能够熟练操作数据库。介绍Text-to-SQL的研究背景及面临的挑战;介绍Text-to-SQL关键技术、基准数据集、模型演变及最新研究进展,关键技术包括Transformer等主流技术,用于模型训练的基准数据集包括WikiSQL和Spider;介绍Text-to-SQL不同阶段模型的特点,详细阐述Text-to-SQL最新研究成果的工作原理,包括模型构建、解析器设计及数据集生成;总结Text-to-SQL未来的发展方向及研究重点。 展开更多
关键词 文本转结构化查询语言 解析器 文本信息处理 数据库 深度学习
下载PDF
中华电子佛典的数据库建设与文字学应用——以《广弘明集》为例
2
作者 王茜 辛睿龙 《山西档案》 北大核心 2024年第6期117-120,共4页
由中华电子佛典协会主持的CBETA中华电子佛典数据库是目前流通最广、使用最多、贡献最大的佛教典籍全文数据库。以《大正新修大藏经》的数字化为中心,介绍中华电子佛典的数据库建设情况,进一步讨论中华电子佛典的文本分类依据,并阐述中... 由中华电子佛典协会主持的CBETA中华电子佛典数据库是目前流通最广、使用最多、贡献最大的佛教典籍全文数据库。以《大正新修大藏经》的数字化为中心,介绍中华电子佛典的数据库建设情况,进一步讨论中华电子佛典的文本分类依据,并阐述中华电子佛典的文本信息标注方式。以《广弘明集》为例,通过梳理和分析XML标记语言在中华电子佛典的一般呈现方式,揭示中华电子佛典提供的佛教文献文本信息,以验证中华电子佛典在文字学研究方面的重要参考利用价值。 展开更多
关键词 中华电子佛典 CBETA 《大正藏》 数据库 《广弘明集》
下载PDF
过刊全文数据库JSTOR及其特色分析 被引量:4
3
作者 郭依群 《情报理论与实践》 CSSCI 北大核心 2003年第3期277-279,共3页
JSTOR is a full text database for back issues of academic journals,especially those related to humane studies,social science and natural science.This article describes the original intention of JSTOR,analyzes the feat... JSTOR is a full text database for back issues of academic journals,especially those related to humane studies,social science and natural science.This article describes the original intention of JSTOR,analyzes the features of its collections,user interface and use value,and discusses how it is introduced to users. 展开更多
关键词 期刊数据库 过刊 全文数据库 jstor 内容特色 用户界面 使用价值
下载PDF
耕地资源数据库文本VSM模糊分类方法
4
作者 李杨 尹飞 惠向晖 《计算机仿真》 2024年第10期478-481,492,共5页
耕地资源数据库包含大量的数据,不同地区、不同类型的数据维度也会有所不同,使得文本分类需要处理的特征数量很大,增加了分类的难度。为了有效改善耕地资源数据库文本分类结果的准确性,提出一种耕地资源数据库文本VSM模糊分类方法。通过... 耕地资源数据库包含大量的数据,不同地区、不同类型的数据维度也会有所不同,使得文本分类需要处理的特征数量很大,增加了分类的难度。为了有效改善耕地资源数据库文本分类结果的准确性,提出一种耕地资源数据库文本VSM模糊分类方法。通过CHI筛选出耕地资源数据库文本的类别特征词,采用PCA方法展开二次降维处理。对降维处理后的文本特征展开分析,采用合适的规则抽取代表主题的特征义原,扩展全部特征义原,同时选择合适的分类器建立模糊VSM模型,通过该模型实现耕地资源数据库文本分类。实验结果表明,采用所提方法可以获取高精度和高效率的文本分类结果,有效提升了文本分类效果。 展开更多
关键词 模糊分类耕地资源数据库 文本分类 数据降维
下载PDF
Oracle Text技术在复杂结构数据库中的应用 被引量:5
5
作者 蒙辉 陈燕 《计算机技术与发展》 2007年第4期38-40,44,共4页
全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不... 全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不足的。文中介绍了Oracle Text全文检索技术的方法和步骤,阐述了其在复杂结构数据库中的具体应用,最后程序实现了所设计的全文检索技术。 展开更多
关键词 ORACLE text 复杂结构数据库 全文检索
下载PDF
基于可搜索加密技术的分布式数据库安全访问多级控制算法
6
作者 郎加云 丁晓梅 《吉林大学学报(信息科学版)》 CAS 2024年第3期531-536,共6页
为解决分布式数据库中明文传输容易被篡改的安全隐患,提出了一种基于可搜索加密技术的分布式数据库安全访问多级控制算法。该算法将授权用户按照安全级别分组,并采用TF-IDF(Tem Frequency-Inverse Document Frequency)算法计算明文关键... 为解决分布式数据库中明文传输容易被篡改的安全隐患,提出了一种基于可搜索加密技术的分布式数据库安全访问多级控制算法。该算法将授权用户按照安全级别分组,并采用TF-IDF(Tem Frequency-Inverse Document Frequency)算法计算明文关键词的权重,然后利用AES(Advanced Encryption Standard)算法和轮函数生成密文的密钥,使用矩阵函数和逆矩阵函数对明文进行加密,并将加密结果上传至主服务器。同时,采用Build Index算法生成密文的索引,根据用户安全级别相关属性信息审查用户是否具有访问密文的权限,审查通过后用户即可发出密文数量与关键词搜索请求,服务器将密文送回用户端并使用对称密钥方式解密,实现访问多级控制。实验结果表明,该方法在加密、解密过程中用时较短,且安全访问控制性能良好。 展开更多
关键词 可搜索加密技术 分布式数据库 安全访问控制 明文加密
下载PDF
基于协同过滤的医院图书馆数据库文本分类优化技术
7
作者 从莉萍 沈剑文 王海生 《微型电脑应用》 2024年第2期146-148,153,共4页
传统医院图书馆数据库文本分类是对指定规模文本的分类,无法针对特定用户的浏览内容实施分类。为此,提出基于协同过滤的医院图书馆数据库文本分类优化方法。将用户浏览数据库文本的特征看做物品,构建半自动编码器的协同过滤模型优化用... 传统医院图书馆数据库文本分类是对指定规模文本的分类,无法针对特定用户的浏览内容实施分类。为此,提出基于协同过滤的医院图书馆数据库文本分类优化方法。将用户浏览数据库文本的特征看做物品,构建半自动编码器的协同过滤模型优化用户物品评分矩阵,使用平均评分修正因子、热门物品惩罚因子改进相似度计算。引入注意力机制构建CNN-SVM分类模型,将用户文本浏览特征作为输入,实现文本分类。测试表明,该方法构建评分矩阵的RMSE最低,推荐图书馆文本阅读特征的MAE值最小,在文本分类上F1值达到96.5%,有较好的文本分类效果。 展开更多
关键词 协同过滤 医院图书馆 数据库 半自动编码器 文本分类
下载PDF
基于MLVDS和USB3.0的大数据高并发传输控制系统设计
8
作者 王育军 《计算机测量与控制》 2024年第4期81-86,128,共7页
为解决网络主机大数据样本单位并发量有限的问题,有效控制大数据高并发传输数据参量,设计了基于多点低压差分信号(MLVDS)和USB3.0的大数据高并发传输控制系统;在Web服务器架构中,接入MLVDS驱动器与并行接收器设备,并联合相关应用元件,... 为解决网络主机大数据样本单位并发量有限的问题,有效控制大数据高并发传输数据参量,设计了基于多点低压差分信号(MLVDS)和USB3.0的大数据高并发传输控制系统;在Web服务器架构中,接入MLVDS驱动器与并行接收器设备,并联合相关应用元件,调度可移动网关的主控模块,完成大数据高并发传输控制系统的硬件结构设计;利用USB3.0控制芯片,完善接口电路组织的连接回路,完成基于USB3.0的控制电路搭建;设置MySQL数据库表单,借助TCP/IP协议,处理大数据并发文本,再联合相关大数据参量,定义INF传输控制指令,实现对传输控制行为的分析;结合相关硬件结构,完成基于MLVDS和USB3.0的大数据高并发传输控制系统的设计;实验结果表明,设计系统可提升大数据样本顺序和逆序并发量的均值水平,解决了大数据样本单位并发量有限的问题,有效控制大数据高并发传输数据参量。 展开更多
关键词 MLVDS驱动器 USB3.0芯片 大数据 高并发传输 传输控制系统 可移动网关 MYSQL数据库 TCP/IP协议 并发文本
下载PDF
JSTOR过刊全文库使用技巧与方法
9
作者 徐立华 刘莉 刘鑫 《医学信息》 2011年第5期1185-1186,共2页
介绍JSTOR的检索途径、检索方法、各种功能及使用价值,旨在为读者提供一些有益的帮助,使过刊得以充分利用。
关键词 jstor 检索方法 电子期刊 全文期刊库
下载PDF
杭州古代桥梁碑刻图文调查及数据库建设研究
10
作者 王学平 郑明玉 《建设科技》 2024年第4期62-64,共3页
本文以杭州古代桥梁碑刻图文为研究对象,通过对碑刻的年代、地域、材质、工艺等方面的考察,以及对其图文内容的解读,揭示杭州古代桥梁及碑刻的发展历程、建筑风格、历史文化价值、艺术鉴赏价值、科技价值。同时,本文还探讨了桥梁碑刻数... 本文以杭州古代桥梁碑刻图文为研究对象,通过对碑刻的年代、地域、材质、工艺等方面的考察,以及对其图文内容的解读,揭示杭州古代桥梁及碑刻的发展历程、建筑风格、历史文化价值、艺术鉴赏价值、科技价值。同时,本文还探讨了桥梁碑刻数据库建设的目标、方法和应用前景,为相关领域的研究者提供有益的参考,为历史文化保护和学术研究提供可靠的资料。 展开更多
关键词 杭州 古代桥梁 碑刻图文 数据库建设
下载PDF
On Multi-Thread Crawler Optimization for Scalable Text Searching
11
作者 Guang Sun Huanxin Xiang Shuanghu Li 《Journal on Big Data》 2019年第2期89-106,共18页
Web crawlers are an important part of modern search engines.With the development of the times,data has exploded and humans have entered a“big data era”.For example,Wikipedia carries the knowledge from all over the w... Web crawlers are an important part of modern search engines.With the development of the times,data has exploded and humans have entered a“big data era”.For example,Wikipedia carries the knowledge from all over the world,records the realtime news that occurs every day,and provides users with a good database of data,but because of the large amount of data,it puts a lot of pressure on users to search.At present,single-threaded crawling data can no longer meet the requirements of text crawling.In order to improve the performance and program versatility of single-threaded crawlers,a high-speed multi-threaded web crawler is designed to crawl the network hyper-scale text database.Multi-threaded crawling uses multiple threads to process web pages in parallel,combining breadth-first and depth-first algorithms to control web crawling.The practice project is based on the Python language to achieve multi-threaded optimization network hyper-large-scale text database-Wikipedia book crawling method,the project is inspired by the article on the Wikipedia article in the Big Data Digest public number. 展开更多
关键词 MULTI-THREADING text database OPTIMIZATION breadth-first search depth-first search.
下载PDF
面向中医药典籍的阅读对照系统设计与实现 被引量:1
12
作者 魏培阳 亓祺 +1 位作者 杜明松 张少乾 《现代电子技术》 2023年第16期85-90,共6页
中医药典籍反映了所处历史时期中医药的发展情况,但其因朝代不同、版本不同而差异较大,这对中医药典籍的异文标注及阅读对比工作提出了新要求。文中运用文本标注工具poplar并结合ElasticSearch构建分布式索引库,提出一种跨平台的中医药... 中医药典籍反映了所处历史时期中医药的发展情况,但其因朝代不同、版本不同而差异较大,这对中医药典籍的异文标注及阅读对比工作提出了新要求。文中运用文本标注工具poplar并结合ElasticSearch构建分布式索引库,提出一种跨平台的中医药典籍阅读对照系统。该系统主要包含典籍阅读、图文对照阅读、异文标注、异文对照阅读及典籍异文全量搜索等功能。系统架构整体基于B/S模式,前端采用Vue,后端采用SpringBoot,数据库采用MySQL。为提升访问效率,采用高速Redis缓存,构建性能高效且便于移植的典籍数据库。中医药文献研究人员的验证及使用结果表明,所设计系统使得异文研究更便捷和规范,同时也为中医药典籍文献的研究提供了较为有力的支撑。 展开更多
关键词 中医药典籍 异文对照阅读 全量搜索 典籍数据库 数据展示系统 数据管理系统
下载PDF
书同文字与再造书契——论古籍数字化时代的字符统一与文本规范
13
作者 李飞跃 《北京师范大学学报(社会科学版)》 CSSCI 北大核心 2023年第5期127-141,共15页
随着古籍的电子化与数据库应用,曾经停废的大量汉字被激活。字体字形多样、字际关系复杂和编码系统不一,严重阻碍了古籍文本的编辑、保存、呈现、转换、检索及深度利用。文本的电子化、规范化及标准化是古籍数字化的起点,也是数字设施... 随着古籍的电子化与数据库应用,曾经停废的大量汉字被激活。字体字形多样、字际关系复杂和编码系统不一,严重阻碍了古籍文本的编辑、保存、呈现、转换、检索及深度利用。文本的电子化、规范化及标准化是古籍数字化的起点,也是数字设施建设和数字人文研究的基础。近代以来新旧字体、正俗字形与字符编码的三次系统性变更,决定了字符集与文本库建设只能以发布的各种国家标准为基础。纵观历史,汉字一直处在不断统一规范的进程中,汉文典籍的一致性让中华文明具有突出的统一性。创建统一字符集和标准文本库将是继秦朝“书同文字”之后的全新规范,也是汉字系统继从刻画到书写,又到数码形态的再次重置。“再造书契”有利于实现古籍数据的统一刻画、深度标引、交互整合和多功能开发,促进古籍文本结构化、知识体系化、平台智能化,推动古籍整理利用的转型升级。 展开更多
关键词 古籍数字化 字符集 文本库 书同文
下载PDF
基于文本挖掘技术的脑卒中文献计量分析:以PubMed数据库为例 被引量:2
14
作者 叶全伟 杨肖光 +2 位作者 叶丽萍 刘静 周萍 《中国卫生质量管理》 2023年第3期25-30,共6页
目的回溯并勾勒2010年-2020年全球脑卒中领域研究的主题演化历程与时空分布规律。方法从PubMed数据库中获取2010年-2020年脑卒中相关文献,利用R 4.1.2的pubmedR软件包批量抓取文献基本信息,通过quanteda软件包构建语料库,使用结构主体... 目的回溯并勾勒2010年-2020年全球脑卒中领域研究的主题演化历程与时空分布规律。方法从PubMed数据库中获取2010年-2020年脑卒中相关文献,利用R 4.1.2的pubmedR软件包批量抓取文献基本信息,通过quanteda软件包构建语料库,使用结构主体模型进行分析,并运用ggplot2软件包进行国家或地区合作网络分析。结果全球脑卒中研究2010年-2013年为快速增长期,增长率为11.94%~17.60%;2014年-2018年为增长平缓期,增长率为3%~4%左右;2019年-2020年再次快速增长,增长率为12.81%、17.96%。中国内地地区在2012年、2020年增长率分别为102.99%、43.85%,在全球两个阶段的高速增长期中均做出了较大贡献。基于文献摘要文本,共归纳出11个主题类别,其中“临床研究”与“卒中康复”占较大比重,合计热度值为46.66%。我国近年研究热点主要集中在“分子遗传病学”与“动物实验”。结论全球脑卒中研究热度持续增长,主题类别逐渐丰富。我国需进一步加强脑卒中前端预防和后端康复研究,优化防治策略。 展开更多
关键词 文本挖掘技术 文献计量分析 脑卒中 PubMed数据库
下载PDF
国家与地方互动视角下我国科技信用监管体系建设与发展研究 被引量:3
15
作者 陈檄 《科技管理研究》 CSSCI 北大核心 2023年第12期49-58,共10页
现有研究缺乏对我国科技信用监管体系的历时性与共时性进行综合考察。为此,以国内有关科研信用研究的106篇文献和103份相关政策文本(国家层面13份、地方层面90份)为样本,从国家与地方互动视角出发,运用文献调研和文本分析方法,对标国家... 现有研究缺乏对我国科技信用监管体系的历时性与共时性进行综合考察。为此,以国内有关科研信用研究的106篇文献和103份相关政策文本(国家层面13份、地方层面90份)为样本,从国家与地方互动视角出发,运用文献调研和文本分析方法,对标国家政策规范,分别从价值理念、组织结构、体制机制、技术工具和政策法规等五方面考察我国科技信用监管体系的建设发展状况。研究发现:我国科技信用监管体系的历时性展现出由国家牵头管理到地方响应实施、再到地方突出重点的模式,国家联合管理与地方共抓落实的共时性具有中国特色。其中,东部省份的政策文本数量大于其他地区,体系建设的深度广度更大,在监管对象细化和探索新途径、新工具等方面做了更多构思;此外,自2007年国家层面的科研诚信建设联席会议制度建立以来,2020年起仅有四川、浙江、北京、江苏、云南五省市分别陆续设立科研诚信建设联席会议,整个体系的央地互动、信息流转不够。基于国家和地方科技信用监管体系总体建设要求,提出推动联席会议制度尽快落地并加强联席会议的稳定连续性、扩充丰富相关体制机制建设内容、建设科研诚信数据库、加强相关配套政策实操性等对策建议。 展开更多
关键词 科技信用 科研诚信 信用监管 监管体系 联席会议制度 诚信数据库 政策文本分析 文献调研分析
下载PDF
智能化语音语料库的设计研究
16
作者 杨政 马延周 《软件》 2023年第2期150-152,共3页
在经济全球化发展趋势下,世界各国对语言的研究越发深入,语言研究方法也越来越多,比如说定性研究、定量研究、两者相结合的研究方法等。现如今建设应用大型语料库作为国内外语言学研究的核心内容,不仅能为自然语言处理领域发展提供基础... 在经济全球化发展趋势下,世界各国对语言的研究越发深入,语言研究方法也越来越多,比如说定性研究、定量研究、两者相结合的研究方法等。现如今建设应用大型语料库作为国内外语言学研究的核心内容,不仅能为自然语言处理领域发展提供基础依据,还可以充分展现人工智能、信息提取、人机对话等技术优势。因此本文研究在了解智能化语音语料库设计原则的基础上,根据语音语料库的核心需求和属性扩张,深层探索智能化语音语料库的设计步骤,以电力行业的语音语料库设计构建情况为例,根据实证分析明确智能化语音语料库的设计应用价值。 展开更多
关键词 智能化 语音语料库 发音文本 语音录制 数据库
下载PDF
基于内容的推荐算法在专题数据库中的应用研究
17
作者 郑志军 《信息与电脑》 2023年第15期116-119,共4页
随着信息技术在各行业的应用以及文献资源的数字化,文献管理方式也逐步转变为专题数据库的信息化管理方式。然而,文献情报数据的爆炸式增长引起的信息过载使得越来越难以在海量文献中找到合适的信息,因此构建一个能够实现相关内容推荐... 随着信息技术在各行业的应用以及文献资源的数字化,文献管理方式也逐步转变为专题数据库的信息化管理方式。然而,文献情报数据的爆炸式增长引起的信息过载使得越来越难以在海量文献中找到合适的信息,因此构建一个能够实现相关内容推荐的专题数据库,实现主动为用户寻找相关专题文献就具有重要的现实意义。基于内容的推荐算法引入专题数据库,使用基于文本嵌入及用户画像的方式为用户推荐专题文献。 展开更多
关键词 专题数据库 推荐算法 文本嵌入 用户画像
下载PDF
The text design for continuous speech database of standard Chinese
18
作者 ZU Yiqing(Institute of Linguistics, Chinese Academy of Social Sciences Beijing 100732) 《Chinese Journal of Acoustics》 1999年第1期56-69,共14页
Well developed continuous speech recognition and synthesis systems demand a high quality continuous speech database which is compact and valid, and whose scientific design would benefit from incorporating linguistic a... Well developed continuous speech recognition and synthesis systems demand a high quality continuous speech database which is compact and valid, and whose scientific design would benefit from incorporating linguistic and phonetic knowledge. It is argued that at the present stage the database should be limited to read speech. To describe those very complex variabilities in continuous speech, the following speech units are proposed: (1) 401syllables without tone; (2) 415 inter-syllabic diphones, (3) 3035 inter-syllabic triphones, (4) 781 inter-syllabic final-initial structures. The 17 basic sefltence patterns in standard Chinese are summarized to cover the most important prosodic phenomena. By using the automatic method,2393 sentences and 388 phrases are selected by above phonetic rules from a large corpus, which includes People's Daily in recent years, TV play scripts and dictionary entries, as the reading text of continuous speech recognition database in standard Chinese. This set of sentences and pbrases covers 99.8% syllables without counting tones, 100% inter-syllable diphones, 99.6% inter-syllable triphones and 100% sentence patterns. 展开更多
关键词 The text design for continuous speech database of standard Chinese
原文传递
清华同方(CNKI)与重庆维普(VIP)网络版中文期刊全文数据库的比较研究 被引量:29
19
作者 韩红 朱江 +2 位作者 王桦 柴苗岭 郑甦 《现代图书情报技术》 CSSCI 北大核心 2003年第6期61-64,共4页
在对清华同方 ( CNKI)、重庆维普 ( VIP)两大网络版中文期刊全文数据库——《中国期刊全文数据库》与《中文科技期刊全文数据库》的收录范围、检索方法进行比较的基础上 ,以流量计费的方式对两大数据库的检索方法以及全文下载的速度、... 在对清华同方 ( CNKI)、重庆维普 ( VIP)两大网络版中文期刊全文数据库——《中国期刊全文数据库》与《中文科技期刊全文数据库》的收录范围、检索方法进行比较的基础上 ,以流量计费的方式对两大数据库的检索方法以及全文下载的速度、费用和结果进行了分析 。 展开更多
关键词 “清华同方” CNKI 《中国期刊全文数据库》 重庆市 “维普” VIP 《中文科技期刊全文数据库》 网络数据库 检索方法 流量计费 下载速度
下载PDF
学位论文全文数据库建库研究及其在钱学森图书馆的实现 被引量:14
20
作者 张惠君 耶健 +3 位作者 高建忠 闫晓弟 李娟 韩萌 《大学图书馆学报》 CSSCI 北大核心 2002年第2期52-54,共3页
对学位论文电子版的获得方式及全文检索的实现进行了研究探讨,并详述了西安交通大学钱学森图书馆学位论文全文数据库的体系结构、远程提交、全文检索的实现等技术要点。
关键词 学位论文 全文数据库 全文检索 远程提交 体系结构 钱学森图书馆
下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部