期刊文献+
共找到302篇文章
< 1 2 16 >
每页显示 20 50 100
Word Embeddings and Semantic Spaces in Natural Language Processing 被引量:1
1
作者 Peter J. Worth 《International Journal of Intelligence Science》 2023年第1期1-21,共21页
One of the critical hurdles, and breakthroughs, in the field of Natural Language Processing (NLP) in the last two decades has been the development of techniques for text representation that solves the so-called curse ... One of the critical hurdles, and breakthroughs, in the field of Natural Language Processing (NLP) in the last two decades has been the development of techniques for text representation that solves the so-called curse of dimensionality, a problem which plagues NLP in general given that the feature set for learning starts as a function of the size of the language in question, upwards of hundreds of thousands of terms typically. As such, much of the research and development in NLP in the last two decades has been in finding and optimizing solutions to this problem, to feature selection in NLP effectively. This paper looks at the development of these various techniques, leveraging a variety of statistical methods which rest on linguistic theories that were advanced in the middle of the last century, namely the distributional hypothesis which suggests that words that are found in similar contexts generally have similar meanings. In this survey paper we look at the development of some of the most popular of these techniques from a mathematical as well as data structure perspective, from Latent Semantic Analysis to Vector Space Models to their more modern variants which are typically referred to as word embeddings. In this review of algoriths such as Word2Vec, GloVe, ELMo and BERT, we explore the idea of semantic spaces more generally beyond applicability to NLP. 展开更多
关键词 Natural Language Processing Vector space Models Semantic spaces word Embeddings Representation Learning Text Vectorization Machine Learning Deep Learning
下载PDF
基于CiteSpace的国内纺织行业知识图谱及其可视化研究 被引量:20
2
作者 刘秀玲 任广春 《丝绸》 CAS CSCD 北大核心 2016年第8期26-34,共9页
纺织行业一直以来都在中国出口贸易中占有很大比重,为了探索近年来中国纺织行业的技术热点与发展趋势,以CNKI数据库收录的18种纺织核心期刊为研究样本,采用共词分析方法,利用Cite Space绘制出科学知识图谱,通过可视化图谱挖掘出纺织行... 纺织行业一直以来都在中国出口贸易中占有很大比重,为了探索近年来中国纺织行业的技术热点与发展趋势,以CNKI数据库收录的18种纺织核心期刊为研究样本,采用共词分析方法,利用Cite Space绘制出科学知识图谱,通过可视化图谱挖掘出纺织行业中的高产机构和核心作者,并根据时区视图、转折点、地标点列表讨论不同阶段里纺织行业的研究热点,根据动态聚类图谱分析纺织行业近10年的发展路径,使得纺织行业的研究状况可以更加直观地表现出来,为今后国内纺织行业的研究提供借鉴。 展开更多
关键词 纺织行业 研究热点 知识图谱 共词分析 CITEspace 可视化
下载PDF
基于word文档的数字水印算法的研究 被引量:8
3
作者 陈青 周黎敏 《微计算机信息》 2010年第23期197-199,共3页
针对目前数字水印技术的研究主要集中在图像、视频和音频方面的现象,分析了几种常用的文本数字水印技术,设计并实现了一种基于文本格式的文本数字水印算法。该算法针对目前使用最广泛的word文档,利用字间距的改变完成水印的嵌入,并通过... 针对目前数字水印技术的研究主要集中在图像、视频和音频方面的现象,分析了几种常用的文本数字水印技术,设计并实现了一种基于文本格式的文本数字水印算法。该算法针对目前使用最广泛的word文档,利用字间距的改变完成水印的嵌入,并通过加密和纠错编码提高水印的鲁棒性和隐蔽性。 展开更多
关键词 数字水印 word文档 字间距
下载PDF
基于MapReduce模型的分布式Word文档破解
4
作者 陈勤 方海英 +1 位作者 褚一平 黄剑军 《计算机系统应用》 2010年第3期179-182,193,共5页
利用Word加密机制中存在的漏洞,实现了与加密密钥长度无关的常量时间破解,同时提出了基于MapReduce架构实现Word文档破解的方案,简化了分布式程序设计。实验表明了该方案的有效性,分布式计算中节点之间的并行消耗低。
关键词 word破解 密钥搜索空间 分布式计算
下载PDF
基于Word文档的数学论文正文格式编排 被引量:1
5
作者 饶超 《湖北文理学院学报》 2008年第11期86-88,共3页
通过Word文档样式的制作以及公式编辑器使用过程中遇到问题的处理,以实现迅速准确地完成数学论文的格式编排工作.
关键词 word文档 样式 公式编辑器 行距
下载PDF
基于LDA和word2vec的英文作文跑题检测 被引量:3
6
作者 曲强 崔荣一 赵亚慧 《计算机应用研究》 CSCD 北大核心 2019年第2期415-419,共5页
针对目前国内的英语作文辅助批阅系统缺少准确而高效的跑题检测算法的问题,提出了一种结合LDA和word2vec的跑题检测算法。该算法利用LDA模型对文档建模并通过word2vec对文档进行训练,利用得到的文档主题和词语之间的语义关系,对文档中... 针对目前国内的英语作文辅助批阅系统缺少准确而高效的跑题检测算法的问题,提出了一种结合LDA和word2vec的跑题检测算法。该算法利用LDA模型对文档建模并通过word2vec对文档进行训练,利用得到的文档主题和词语之间的语义关系,对文档中各主题及其特征词计算概率加权和,最终通过设定合理阈值筛选出跑题作文。实验中通过改变文档的主题数而得到不同的F值,确定了最佳主题数。实验结果表明,所提出的方法比基于向量空间模型的方法更具有效性,可以检测到更多的跑题作文,并且准确率较高,F值达到89%以上,实现了作文跑题检测的智能化处理,可以有效地应用在英语作文教学中。 展开更多
关键词 作文跑题检测 向量空间模型 潜在狄利克雷分配 词语间语义关系
下载PDF
词间空格对汉语母语者和二语者拼音文本阅读的影响——基于眼动的证据 被引量:1
7
作者 江新 张嫚 龚伶俐 《华文教学与研究》 CSSCI 2024年第1期45-55,共11页
本研究采用眼动跟踪技术考察词间空格对汉语母语者和第二语言学习者汉语拼音文本阅读的影响。实验以中国大学生和在中国学习汉语的外国学生为被试,收集他们阅读三种不同空格条件(词间空格、字间空格和无空格)的汉语拼音句子的眼动数据... 本研究采用眼动跟踪技术考察词间空格对汉语母语者和第二语言学习者汉语拼音文本阅读的影响。实验以中国大学生和在中国学习汉语的外国学生为被试,收集他们阅读三种不同空格条件(词间空格、字间空格和无空格)的汉语拼音句子的眼动数据。研究结果显示,与无空格条件相比,词间空格和字间空格条件的注视时间短,注视次数少,首次注视位置距离词中心近;母语者在词间空格和字间空格条件下阅读效率无显著差异,但二语学习者阅读词间空格文本的阅读效率大于字间空格文本;词间空格对于印欧语母语者的促进作用显著大于泰语母语者。这些结果表明,词间空格对汉语二语者有促进作用,词间空格的促进作用受母语文字背景的影响。 展开更多
关键词 汉语拼音 阅读 词间空格 字间空格 眼动
下载PDF
Identification of the Wave-Particles Interaction in Space Plasma Using Higher-Order Statistics
8
作者 Zhao Zhengyu, Shi Xianqing, F. Lefeuvre, A. Masson(College of Electronic Information, Wuhan University, Wuhan 430072, China)(LPCE/CNRS, 45100 Orleans Cedex 02, France) 《Wuhan University Journal of Natural Sciences》 EI CAS 1998年第1期41-45,共5页
The interaction of wave-particles and wave-wave in the space plasmas are essentially non-linear or non-Gaussian processes. Using the higher-order statistical analyses methods (higher-order moments and bi-tri correlati... The interaction of wave-particles and wave-wave in the space plasmas are essentially non-linear or non-Gaussian processes. Using the higher-order statistical analyses methods (higher-order moments and bi-tri correlation or bi-tri spectrum), its physical properties can be described. The question addressed in this paper is that of the usefulness of higher-order statistical analysis for identification of the wave-particles interaction in space plasmas. The signals handled are from the ARCAD-3 ISOPROBE experiment on ELF frequency range, then strong electrostatic turbulence and electron density irregularities. Second and third order statistical analyses are applied: first, on time series associated with each type of measurement, then, on the two types. All results are presented for one typical case. Correlation functions estimated over the corresponding time intervals point out the existence of a, non-linear interaction between these fluctuations and electrostatic filed. 展开更多
关键词 Key words wave particles interaction space plasmas HIGHER order statistics
下载PDF
基于知识图谱分析的学习空间研究回溯与趋势探究
9
作者 李高祥 邹小芳 陶泽发 《贵州师范学院学报》 2024年第4期34-45,共12页
以2013—2023年CNKI收录的433篇“学习空间”为主题的CSSCI期刊文献为研究对象,通过共词分析和社会网络分析,绘制学习空间研究热点知识图谱。分析发现:学习空间研究热点主要涵盖学习空间建设研究、学习空间与教育变革相关理论研究、网... 以2013—2023年CNKI收录的433篇“学习空间”为主题的CSSCI期刊文献为研究对象,通过共词分析和社会网络分析,绘制学习空间研究热点知识图谱。分析发现:学习空间研究热点主要涵盖学习空间建设研究、学习空间与教育变革相关理论研究、网络学习空间研究、信息技术赋能学习空间发展研究等七大领域。其中,学习空间与课堂教学转型研究、智慧学习空间研究、学习空间与教学变革研究,具有进一步发展的空间和潜在的研究重要性;研究经历了起步、快速发展、发展回落三个阶段,学习空间样态呈现出信息化、网络化、智能化和数字化等特征变化。未来学习空间研究需建立新的思维观、设计观、应用观和伦理观,应以学习者为中心,融合多元技术,并注重各领域的深度和联系,加强跨学科实证研究。 展开更多
关键词 学习空间 共词分析 社会网络分析 知识图谱
下载PDF
虚拟空间电子口碑对实体商业中心服务范围竞争实效的影响——以上海主城区为例
10
作者 康宁 张佶 钮心毅 《西部人居环境学刊》 CSCD 北大核心 2024年第3期21-27,共7页
在移动互联网蓬勃发展的时代背景下,移动端应用软件显著推动了零售商业虚拟空间的迅猛扩展。本研究从消费行为需求端出发,使用互联网位置服务数据测度实体商业中心服务范围,探究实体商业中心的竞争实效及其影响因素。研究选取了上海主... 在移动互联网蓬勃发展的时代背景下,移动端应用软件显著推动了零售商业虚拟空间的迅猛扩展。本研究从消费行为需求端出发,使用互联网位置服务数据测度实体商业中心服务范围,探究实体商业中心的竞争实效及其影响因素。研究选取了上海主城区内29个实体商业中心为研究对象,以电子口碑表征虚拟空间的属性,以建成环境表征实体空间的属性,以竞争实效表示实体商业中心服务范围竞争的实际效用。探究电子口碑和建成环境对其的影响。研究发现,实体商业中心的竞争实效不仅受到实体空间的影响,也受到虚拟空间的影响。在建成环境的影响因素中,业态混合度和停车场数量仍起到重要的作用。在电子口碑的影响因素中,优质口碑数量能够显著提升商业中心的竞争实效。时空大数据用于探索虚拟空间属性与实体空间属性相互影响,为适应当前虚实共存的城市商业空间,提升规划决策的科学性和有效性提供了支持。 展开更多
关键词 实体商业中心 虚拟空间 电子口碑 服务范围 互联网位置服务数据 上海
下载PDF
文化空间主导下的中东铁路站区规划研究
11
作者 袁帅 刘松茯 《城市建筑》 2024年第7期90-94,110,共6页
中东铁路是俄国于20世纪初修筑在我国东北地区的铁路,是我国严寒地区仅有的大型线状工业遗产。俄国在铁路沿线修筑了百余座站舍,并形成了不同规模的站区,而后逐渐形成了大小城市(镇),奠定了20世纪我国东北地区的铁路工业基础。文章从列... 中东铁路是俄国于20世纪初修筑在我国东北地区的铁路,是我国严寒地区仅有的大型线状工业遗产。俄国在铁路沿线修筑了百余座站舍,并形成了不同规模的站区,而后逐渐形成了大小城市(镇),奠定了20世纪我国东北地区的铁路工业基础。文章从列斐伏尔区域社会学的文化空间理论切入,旨在确定中东铁路在文化空间理论主导下所形成的站区规划特质,分析其成因,确定其资本主义文化空间性质,并指出其建构逻辑。以期对这一大型线性遗产的保护提供真实性与完整性的理论参考。 展开更多
关键词 中东铁路 站区规划 文化空间主题词
下载PDF
综合交通枢纽内部公共空间公众情绪感知的时空差异与影响因素
12
作者 刘勇 单宗媛 +2 位作者 徐心怡 杨希 何丹 《上海城市规划》 北大核心 2024年第4期140-148,共9页
在信息化时代,如何借助公众情绪感知来优化公共空间品质,成为提升公众既有空间体验的思考之一。结合环境心理学,以上海虹桥综合交通枢纽为例,利用新浪微博数据与自然语言处理技术来分析综合交通枢纽内部公共空间的公众情绪感知,并通过... 在信息化时代,如何借助公众情绪感知来优化公共空间品质,成为提升公众既有空间体验的思考之一。结合环境心理学,以上海虹桥综合交通枢纽为例,利用新浪微博数据与自然语言处理技术来分析综合交通枢纽内部公共空间的公众情绪感知,并通过情绪词频分析法探究公众情绪的影响因素。研究发现:第一,综合交通枢纽内部公共空间的公众情绪感知存在显著的时空差异;第二,时空要素与主观要素均会导致公众在综合交通枢纽内部公共空间不同情绪的感知差异;第三,影响公众情绪感知的因素存在“认知”与“行为”维度的不足。在此基础上,验证了通过社交媒体数据来揭示综合交通枢纽内部公共空间的公众情绪感知的可行性,提出符合公众中高阶情感需求的空间改善与提升策略,以期为综合交通枢纽公共空间营造提供借鉴。 展开更多
关键词 社交媒体 公众情绪 公共空间感知 情绪词频分析 上海虹桥综合交通枢纽
下载PDF
基于局部特征和视觉词袋模型的大豆叶片病害识别
13
作者 郑金松 谷海红 +3 位作者 蒋庆刚 赵靖杰 王贤 韩增光 《中国农机化学报》 北大核心 2024年第8期204-209,共6页
病害检测对提高大豆作物产量至关重要。针对传统视觉法诊断大豆作物病害而导致病害识别效率和分类准确率不高的问题,提出一种基于局部描述符和视觉词袋技术以数据表征大豆叶片图像的分类算法,同时保留有关潜在疾病的视觉信息。采用SIFT... 病害检测对提高大豆作物产量至关重要。针对传统视觉法诊断大豆作物病害而导致病害识别效率和分类准确率不高的问题,提出一种基于局部描述符和视觉词袋技术以数据表征大豆叶片图像的分类算法,同时保留有关潜在疾病的视觉信息。采用SIFT、DSIFT、PHOW和SURF 4种算法对大豆叶片的霜霉病、锈病TAN和锈病RB进行分类识别。结果表明,局部描述符PHOW表现出最佳的分类识别结果,其正确分类率为96.25%。进一步研究PHOW在不同颜色空间下的大豆病害识别效果。结果表明,与灰度图像相比,使用HSV、Opponent颜色空间可有效提升对大豆叶片病害检测的正确分类率,其正确分类率分别可达99.83%和99.58%,验证采用局部描述符和视觉词袋技术识别大豆叶片病害方法的可行性和高效性,并为其他作物的病害识别提供一种通用的分类识别方法。 展开更多
关键词 大豆叶片 病害识别 局部描述符 视觉词袋 颜色空间
下载PDF
创造性类推词“村BA、村超”的生成和认知机制
14
作者 肖涵 《语言与文化研究》 2024年第5期9-14,共6页
本文主要讨论了创造性类推词“村BA、村超”的生成和认知机制。这些新词代表了2023年受到广泛关注的乡村文旅事件,在结构上具有缩略词、混合型字母词的特点,可以用义素分析法、类推造词法来解释,但与以往通过类推方式产生的新词相比具... 本文主要讨论了创造性类推词“村BA、村超”的生成和认知机制。这些新词代表了2023年受到广泛关注的乡村文旅事件,在结构上具有缩略词、混合型字母词的特点,可以用义素分析法、类推造词法来解释,但与以往通过类推方式产生的新词相比具有独特性。在认知机制方面,本文从合成空间理论、关联理论、图形-背景理论等角度对此进行了分析。 展开更多
关键词 缩略词 字母词 合成空间 关联理论 图形-背景
下载PDF
词边界信息在中文词汇学习与识别中的作用:眼动研究的证据 被引量:12
15
作者 白学军 张慢慢 +3 位作者 臧传丽 李馨 陈璐 闫国利 《心理科学进展》 CSSCI CSCD 北大核心 2014年第1期1-8,共8页
空格作为英语等大多数拼音文字阅读中的词边界信息,能帮助读者成功地从文本的一连串的字母中切分出词,促进了词汇的习得和识别。然而在中文里没有明确的词边界信息,那么提供词边界信息(即加入空格)能否促进中文词汇识别或帮助读者学习新... 空格作为英语等大多数拼音文字阅读中的词边界信息,能帮助读者成功地从文本的一连串的字母中切分出词,促进了词汇的习得和识别。然而在中文里没有明确的词边界信息,那么提供词边界信息(即加入空格)能否促进中文词汇识别或帮助读者学习新词?本文将从空格对成人、儿童和留学生在阅读中眼动控制的影响来回顾和总结词边界信息在中文词汇识别与学习中的作用。在此基础上,提出对建立汉字与词汇识别模型、眼动控制模型以及对指导汉语教学工作的启示。 展开更多
关键词 词切分 词空格 词汇识别 词汇学习
下载PDF
一种面向军事文本的领域特征词向量描述方法 被引量:7
16
作者 秦杰 曹雷 +1 位作者 彭辉 赖俊 《计算机工程》 CAS CSCD 北大核心 2016年第8期160-165,共6页
针对军事文本信息中命名实体多、特征词领域性强的特性,提出一种领域特征词向量描述方法。从优化分词和领域特征词筛选方面压缩向量空间,完善时间、地名、部队名称和武器装备4类重要命名实体的提取规则,扩充分词词典库。改进领域相关度... 针对军事文本信息中命名实体多、特征词领域性强的特性,提出一种领域特征词向量描述方法。从优化分词和领域特征词筛选方面压缩向量空间,完善时间、地名、部队名称和武器装备4类重要命名实体的提取规则,扩充分词词典库。改进领域相关度和领域一致度相结合的领域特征词筛选算法,突出领域特征词与常用词汇之间的差别,进一步过滤领域特征词。实验结果表明,优化分词后,该方法能够提取出军事文本中的命名实体和部分专有词汇,降低特征词数量,改进后的领域特征词筛选算法将准确率和召回率分别提高20%和16.7%,提出的领域特征词向量描述方法所生成的特征词向量具有较强的领域性。 展开更多
关键词 军事文本 命名实体 向量空间 分词 领域特征词
下载PDF
中文交互式网络搜索引擎及其自学习能力 被引量:14
17
作者 杜阿宁 方滨兴 +1 位作者 胡铭曾 云晓春 《计算机工程与应用》 CSCD 北大核心 2003年第10期148-150,212,共4页
论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于... 论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于自动机思想分词是INSE提出的新概念,应用于中文分词可以满足最大匹配且速度较快。INSE自学习能力的实现依靠神经网络的BP算法。该算法应用于交互式网络搜索引擎可以提供更加精确的查询结果。 展开更多
关键词 中文交互式网络搜索引擎 自学习能力 Internet WWW 计算机网络 向量空间模型 自动机 分词 神经网络 BP算法 信息库 信息检索 信息资源
下载PDF
基于单词相似度的文本聚类 被引量:9
18
作者 李星毅 曾路平 施化吉 《计算机工程与设计》 CSCD 北大核心 2009年第8期1966-1968,共3页
研究了现有的基于向量空间模型的文本聚类算法,发现这些算法都存在数据维度过高和忽略了单词之间语义关系的缺点。针对这些问题,提出一种基于单词相似度的文本聚类算法,该算法首先利用单词相似度对单词进行分类获得单词间的语义关系,然... 研究了现有的基于向量空间模型的文本聚类算法,发现这些算法都存在数据维度过高和忽略了单词之间语义关系的缺点。针对这些问题,提出一种基于单词相似度的文本聚类算法,该算法首先利用单词相似度对单词进行分类获得单词间的语义关系,然后利用产生的单词类作为向量空间的项表示文本降低了向量空间的维度,最后采用基于划分聚类方法对文本聚类。实验结果表明,相对于传统基于向量空间模型的聚类算法,该算法具有较好的聚类效果。 展开更多
关键词 文本聚类 单词相似度 向量空间模型 单词类向量空间 文本表示
下载PDF
新词词素熟悉性影响视觉词切分线索在新词学习中的促进作用 被引量:9
19
作者 梁菲菲 王永胜 +2 位作者 张慢慢 闫国利 白学军 《心理科学》 CSSCI CSCD 北大核心 2016年第2期258-264,共7页
为考察词素熟悉性是否会影响视觉词切分线索在新词学习中的作用,本研究中新词由两类假词构成:第一类假词由两个高频字(高熟悉性词素)组成,第二类假词由两个低频字(低熟悉性词素)组成。实验采用学习-测试范式,将新词镶嵌在句子中供大学... 为考察词素熟悉性是否会影响视觉词切分线索在新词学习中的作用,本研究中新词由两类假词构成:第一类假词由两个高频字(高熟悉性词素)组成,第二类假词由两个低频字(低熟悉性词素)组成。实验采用学习-测试范式,将新词镶嵌在句子中供大学生被试阅读。结果发现,相比由低熟悉性词素构成的新词,词间空格在由高熟悉词素构成的新词中起到的促进作用更大。表明在汉语阅读过程中,词素熟悉性可能作为一种线索参与词切分。 展开更多
关键词 新词学习 词素熟悉性 词间空格
下载PDF
词间空格促进汉语阅读的新词学习:词素位置的调节作用 被引量:5
20
作者 梁菲菲 王永胜 白学军 《心理学探新》 CSSCI 北大核心 2016年第5期403-408,共6页
采用眼动仪考察词素位置是否是影响词间空格在新词学习中起作用的重要因素。通过以下方式进行操纵:构造两类假词作为新词,第一类新词由低频首字、高频尾字构成;第二类新词由高频首字、低频尾字构成。采用"学习-测试"范式将新... 采用眼动仪考察词素位置是否是影响词间空格在新词学习中起作用的重要因素。通过以下方式进行操纵:构造两类假词作为新词,第一类新词由低频首字、高频尾字构成;第二类新词由高频首字、低频尾字构成。采用"学习-测试"范式将新词放在句子中要求被试阅读。结果发现,相比由高频首字和低频尾字构成的新词,词间空格在由低频首字和高频尾字构成的新词学习中促进作用更大。表明在汉语阅读中词素位置可能作为一种线索参与词切分。 展开更多
关键词 词间空格 新词学习 词素位置
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部