期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
基于分布式语义学的中文语义关系量化研究
1
作者 林植楠 《现代语言学》 2024年第9期527-536,共10页
基于分布式语义学理论的词向量蕴含了丰富的语义信息,一定程度上标志着自然语言处理和计算语言学领域进入了大模型发展时代。由于词向量的可计算属性,逐渐发展出了多种基于词向量的语义计算任务,语义关系辨析便是语义计算任务当中重要... 基于分布式语义学理论的词向量蕴含了丰富的语义信息,一定程度上标志着自然语言处理和计算语言学领域进入了大模型发展时代。由于词向量的可计算属性,逐渐发展出了多种基于词向量的语义计算任务,语义关系辨析便是语义计算任务当中重要的一项。本研究基于fastText中文词向量和腾讯中文词向量的方法计算出表征语义关联强度的余弦相似度值,并得出以下结论:fastText中文词向量和腾讯中文词向量在辨别近义关系、反义关系、上下义关系、部分–整体关系这4种语义关系的任务上表现存在一定差异;通过比较Spearman相关系数,fastText中文词向量在实验数据上表现出其习得了更强的语义相似度特征,腾讯中文词向量则体现出其学习到了更强的语义相关度特征;在反义词辨析任务上,fastText中文词向量和腾讯中文词向量都在高度规约化的反义词对上计算出很高的余弦相似度值。The word embeddings, based on the distributed semantics theory, which contains rich linguistic information, have contributed a lot to the development of large language model (LLM) in the fields of natural language processing and computational linguistics. Due to the computable properties of word embeddings, various semantic computing tasks based on them have gradually emerged, among which semantic relation discrimination is an important task in semantic computation. In our study, we adopt two word-embedding methods, the fastText Chinese word embeddings and the Tencent Chinese word embeddings, to calculate Chinese semantic relations, where the cosine similarity is used to represent the semantic association strength between words. The following are our findings in this study: First, the fastText Chinese embeddings and the Tencent Chinese embeddings show some differences in the task of distinguishing the four types of semantic relation in Chinese, namely, synonymy, antonymy, hyponymy and meronymy;Second, by comparing the Spearman correlation coefficient, the fastText embeddings have acquired more knowledge of semantic similarity between words, while the Tencent Chinese word embeddings have acquired more knowledge of semantic relatedness between words;Third, both the fastText Chinese embeddings and the Tencent Chinese word embeddings give higher values of cosine similarity to highly conventionalized antonyms. 展开更多
关键词 分布式语义学 词向量 语义关系计算 语义相似性 语义相关性
下载PDF
基于概率语义分布的短文本分类 被引量:9
2
作者 马成龙 颜永红 《自动化学报》 EI CSCD 北大核心 2016年第11期1711-1717,共7页
在短文本分类中,面对特征稀疏的短文本,如何充分利用文本中的每一个词语成为关键.本文提出概率语义分布模型的思想,首先通过查询词矢量词典,将文本转换为词矢量数据;其次,在概率语义分布模型的假设下利用混合高斯模型对无标注的文本数... 在短文本分类中,面对特征稀疏的短文本,如何充分利用文本中的每一个词语成为关键.本文提出概率语义分布模型的思想,首先通过查询词矢量词典,将文本转换为词矢量数据;其次,在概率语义分布模型的假设下利用混合高斯模型对无标注的文本数据进行通用背景语义模型训练;利用训练数据对通用模型进行自适应得到各个领域的目标领域语义分布模型;最后,在测试过程中,计算短文本属于领域模型的概率,得到最终的分类结果.实验结果表明,本文提出的方法能够从一定程度上利用短文本所提供的信息,有效降低了对训练数据的依赖性,相比于支持向量机(Support vector machine,SVM)和最大熵分类方法性能相对提高了17.7%. 展开更多
关键词 短文本分类 词矢量 语义分布 高斯混合模型
下载PDF
基于Agent的数据库分布式语义缓存 被引量:1
3
作者 富宇 唐国维 高雅田 《计算机工程》 CAS CSCD 北大核心 2009年第16期48-50,共3页
以大型数据库应用为背景,基于多Agent技术,构建一个分布式数据库访问平台。研究分布式环境下的语义缓存技术,提出一种Agent平台下的智能预取算法,以及一种改进的黑板模型,用于实现多Agent间的通信。在大型数据库系统上的性能测试结果表... 以大型数据库应用为背景,基于多Agent技术,构建一个分布式数据库访问平台。研究分布式环境下的语义缓存技术,提出一种Agent平台下的智能预取算法,以及一种改进的黑板模型,用于实现多Agent间的通信。在大型数据库系统上的性能测试结果表明,该方案对海量数据的统计查询性能有显著提高。 展开更多
关键词 多AGENT系统 分布式语义缓存 预取 黑板模型
下载PDF
英汉语演讲语篇研究——英汉政治演讲语篇中情态副词的语义分布及人际功能对比 被引量:5
4
作者 何咏梅 《内蒙古农业大学学报(社会科学版)》 2010年第1期362-364,371,共4页
政治演讲语篇集中体现人际功能,情态副词是英汉语言中语篇表达人际意义的重要手段。本研究基于自建语料库,以系统功能语法的情态理论为依托,对情态副词在英汉政治演讲语篇中的语义分布及人际功能做了较为系统的对比。研究发现,英语政治... 政治演讲语篇集中体现人际功能,情态副词是英汉语言中语篇表达人际意义的重要手段。本研究基于自建语料库,以系统功能语法的情态理论为依托,对情态副词在英汉政治演讲语篇中的语义分布及人际功能做了较为系统的对比。研究发现,英语政治演讲语篇中更多地使用表概率、表限定于期望值类表强度情态副词,汉语中更多使用表倾向性、表意愿、表超出期望值的强度类情态副词。本研究扩大了英汉语演讲语篇研究的范围。 展开更多
关键词 政治演讲 情态副词 语义分布 人际功能
下载PDF
基于语义分布相似度的主题模型 被引量:2
5
作者 居亚亚 杨璐 严建峰 《计算机应用研究》 CSCD 北大核心 2019年第12期3553-3557,共5页
潜在狄利克雷分布(LDA)以词袋(bag of words,BOW)模型为基础,简化了建模的复杂度,但使得主题的语义连贯性较差,文档表征能力不强。为解决此问题,提出了一种基于语义分布相似度的主题模型。该模型在EM(expectation maximization)算法框架... 潜在狄利克雷分布(LDA)以词袋(bag of words,BOW)模型为基础,简化了建模的复杂度,但使得主题的语义连贯性较差,文档表征能力不强。为解决此问题,提出了一种基于语义分布相似度的主题模型。该模型在EM(expectation maximization)算法框架下,使用GPU(generalized Pólya urn)模型加入单词-单词和文档-主题语义分布相似度来引导主题建模,从语义关联层面上削弱了词袋假设对主题产生的影响。在四个公开数据集上的实验表明,基于语义分布相似度的主题模型在主题语义连贯性、文本分类准确率方面相对于目前流行的主题建模算法表现得更加优越,同时该模型提高了收敛速度和模型精度。 展开更多
关键词 潜在狄利克雷分布 语义分布相似度 主题模型 GPU模型
下载PDF
基于WordNet的语义分布词典建设
6
作者 张会平 吕学强 +1 位作者 施水才 李渝勤 《现代图书情报技术》 CSSCI 北大核心 2007年第3期55-59,共5页
提出一种基于WordNet自动构建语义分布词典的方法。在介绍WordNet系统和Semcor语料库的基础上,设计语义分布词典的结构。分析Sense.idx文件和Taglist文件内容,详细描述以它们为基础自动构建语义分布词典的过程。
关键词 语言资源 语义分布词典 WORDNET Semcor
下载PDF
英汉政治演讲语篇中情态动词的语义分布及功能对比 被引量:2
7
作者 何咏梅 《宁波广播电视大学学报》 2018年第4期39-43,共5页
政治演讲语篇集中体现人际功能,情态动词是英汉语言中语篇表达人际意义的重要手段。本文对情态动词在英汉政治演讲语篇中的语义分布及功能做了系统对比。研究发现,英汉政治演讲语篇中表必然性、表能力类情态动词使用频率相差较小。英语... 政治演讲语篇集中体现人际功能,情态动词是英汉语言中语篇表达人际意义的重要手段。本文对情态动词在英汉政治演讲语篇中的语义分布及功能做了系统对比。研究发现,英汉政治演讲语篇中表必然性、表能力类情态动词使用频率相差较小。英语政治演讲语篇中更多地使用表或然性、表预测类情态动词,说明较客观,预测有理据。汉语中更多使用表义务、表意愿类情态动词,体现了汉语民族以人本为主体的本体型思维方式。 展开更多
关键词 政治演讲 情态动词 语义分布 人际功能
下载PDF
词汇分布语义的语言学基础探微 被引量:1
8
作者 潘俊 吴宗大 《浙江社会科学》 CSSCI 北大核心 2019年第12期99-104,158,159,共8页
词汇分布表示是当前人工智能领域语义表示的主要方法。通过对大规模语料中词汇分布规律的学习,可以得到以数学向量形式表示的词汇,并具有语义可计算和可推导的重要性质。词汇分布语义表示的语言哲学基础是维特根斯坦的词义使用论,主张... 词汇分布表示是当前人工智能领域语义表示的主要方法。通过对大规模语料中词汇分布规律的学习,可以得到以数学向量形式表示的词汇,并具有语义可计算和可推导的重要性质。词汇分布语义表示的语言哲学基础是维特根斯坦的词义使用论,主张词的意义就在于使用。维特根斯坦和索绪尔的语言观有着某种联系,索绪尔认为,语言中一切要素都按照句段关系和联想关系运行,词汇分布语义模型的输入上下文事实上可以归为这两类关系。布龙菲尔德的结构语言学深受索绪尔的影响,最终发展成为海里斯的分布方法论,构成了词汇分布语义的语言学基础。当前以神经语言模型为代表的词汇分布语义,根植于词义使用论学说,并以描写语言学为理论支撑,其本质是对语料中词汇使用模式和偏好的反映,因此可以客观折射社会文化生活的某些特征,同时也不可避免地存在其固有的局限性。 展开更多
关键词 词义 分布语义 自然语言理解 结构主义 描写语言学
下载PDF
“空间分布”语义场中动词集合的构成原则
9
作者 田君 《长春理工大学学报(社会科学版)》 2004年第1期76-78,共3页
以“空间分布”语义场中动词集合为材料,来论证俄语词汇集合的构成原则:词→语义分布类型→体系→小语义场→语义场的词汇集合。
关键词 空间分布 动词集合 语义分布类型 模式
下载PDF
汉语助词“着”语义在英语中的句法分布
10
作者 关敏 《海外英语》 2018年第7期203-204,共2页
汉语助词"着"附着在动词和形容词之后,其历时语法化、句法分布、句法意义、时体标记等方面得到大量研究。该文从"着"的语义出发,采取陆俭明(1999)对"着"的语法意义(动作持续和状态持续),通过观察平行语料... 汉语助词"着"附着在动词和形容词之后,其历时语法化、句法分布、句法意义、时体标记等方面得到大量研究。该文从"着"的语义出发,采取陆俭明(1999)对"着"的语法意义(动作持续和状态持续),通过观察平行语料库,探讨英语译文中"着"语义的句法分布和分布方式,观察其在英语中的时态种类、结构类型。 展开更多
关键词 “着”语义 语义分布 “着”助词特点
下载PDF
一种基于LDA的潜在语义区划分及Web文档聚类算法 被引量:19
11
作者 刘振鹿 王大玲 +2 位作者 冯时 张一飞 方东昊 《中文信息学报》 CSCD 北大核心 2011年第1期60-65,70,共7页
该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作用机制对聚类结果进行修正。与相关... 该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作用机制对聚类结果进行修正。与相关工作比较,该文不仅应用LDA模型表示文档,而且进行了深入的语义分布区域划分,并将分析结果应用于Web文档聚类。实验表明,该文提出的基于LDA的文档类别与语义互作用聚类算法获得了更好的聚类结果。 展开更多
关键词 LDA 潜在语义 语义分布 文档聚类
下载PDF
基于本体的Web使用知识发现模型及应用 被引量:3
12
作者 何丽 严冬梅 韩文秀 《计算机工程》 EI CAS CSCD 北大核心 2006年第14期169-171,201,共4页
本体在Web上的应用能够有效解决Web信息共享的语义问题。该文提出了基于Web本体和服务器日志文件的知识发现模型,主要讨论了用户访问行为的表示、语义用户分布的定义及发现算法。最后介绍了Web使用知识发现模型在Web个性化系统中的应用。
关键词 语义WEB 本体 WEB使用挖掘 语义用户分布
下载PDF
基于语料库的海事英语语篇中连接词分析 被引量:4
13
作者 吕弘 顾金香 《大连海事大学学报(社会科学版)》 2009年第6期109-112,共4页
连接词是实现语篇有效衔接的手段之一。采用基于语料库的定性和定量相结合的方法对海事英语语篇从词汇密度、词频、位置分布和语义分布4个方面进行研究,得出海事英语语篇中连接词的使用特点。
关键词 语料库 海事英语语篇 连接词 词汇密度 词频 位置分布 语义分布
下载PDF
语义语法对句末助词研究的理论价值 被引量:6
14
作者 赵春利 方甲珂 《华文教学与研究》 CSSCI 2019年第1期13-23,共11页
文章主要根据语义语法理论借鉴分布验证的理念和语义地图的方法解决句末助词研究中存在的问题。首先,从历时发展的角度,阐明现代汉语句末助词在语法研究中的地位,并着重指出句末助词研究所存在的问题。其次,从正反验证的角度,把分布理... 文章主要根据语义语法理论借鉴分布验证的理念和语义地图的方法解决句末助词研究中存在的问题。首先,从历时发展的角度,阐明现代汉语句末助词在语法研究中的地位,并着重指出句末助词研究所存在的问题。其次,从正反验证的角度,把分布理念从形式和意义的对应性角度分成句法分布和语义分布,从而提升句末助词语义提取的科学性。第三,从方法论角度,针对句末助词研究中存在的问题和句末助词自身的特点,借鉴注重系统性、连续性和层次性的语义地图分析方法,揭示多功能句末助词的内部语义分类及其关联性。最后,阐明运用语义语法理论解决句末助词研究问题的理论价值。 展开更多
关键词 语义地图 语义语法 句法分布 语义分布
下载PDF
基于无监督学习的部分-整体关系获取 被引量:9
15
作者 贾真 何大可 +1 位作者 尹红风 李天瑞 《西南交通大学学报》 EI CSCD 北大核心 2014年第4期590-596,共7页
针对面向中文自由文本的部分-整体关系抽取问题,提出一种基于无监督学习的方法.首先提出子模式提取算法,从领域文本集中获取概念对和概念对所在上下文模式,利用概念对和概念对上下文模式建立分布式语义模型;然后采用协同聚类算法将具有... 针对面向中文自由文本的部分-整体关系抽取问题,提出一种基于无监督学习的方法.首先提出子模式提取算法,从领域文本集中获取概念对和概念对所在上下文模式,利用概念对和概念对上下文模式建立分布式语义模型;然后采用协同聚类算法将具有相同语义关系的概念对聚合成簇,通过训练L1正则化逻辑回归模型提取簇的特征并得到代表每个簇语义关系的概念对上下文模式;最后根据模式识别表达部分-整体关系的簇,从而获取部分-整体关系概念对.实验结果表明,该方法取得较好的性能,F度量达到68.97%,优于传统聚类方法(55.77%)和模式匹配方法(61.95%). 展开更多
关键词 本体 无监督学习 部分-整体关系 分布式语义模型 协同聚类
下载PDF
基于联系数的区间二元语义模糊多属性群决策方法 被引量:12
16
作者 吴群 吴澎 周礼刚 《重庆工商大学学报(自然科学版)》 2016年第1期1-8,25,共9页
针对区间二元语义评价信息的不确定性,考虑区间二元语义变量取值的分布情况,定义了二元语义联系变量、二元语义正态分布变量,研究了它们的运算法则,并提出了二元语义联系变量信息集结算子;针对决策矩阵元素为区间二元语义变量属性权重... 针对区间二元语义评价信息的不确定性,考虑区间二元语义变量取值的分布情况,定义了二元语义联系变量、二元语义正态分布变量,研究了它们的运算法则,并提出了二元语义联系变量信息集结算子;针对决策矩阵元素为区间二元语义变量属性权重完全未知的模糊多属性群决策问题,利用二元语义正态分布变量的方差,通过构建优化模型确定最优属性权重,提出了基于二元语义联系变量信息集成算子的模糊多属性决策方法,最后通过实例分析了方法的可行性和有效性. 展开更多
关键词 多属性群决策 区间二元语义变量 二元语义联系变量 二元语义正态分布变量 信息集成算子
下载PDF
声调意义的疆域——汉语普通话单音名词声调理据研究 被引量:3
17
作者 张立昌 《齐鲁学刊》 CSSCI 北大核心 2014年第1期155-160,共6页
词语的声调不仅是区别意义的手段,而是与词语所表达的意义有关。声调的高低、长短、发声力度的强弱都与词语所指事物的形状、形态、质地、程度等方面有着密切的联系,这使得意义在声调中的分布一定呈现互补性。声调在本质上并不是简单的... 词语的声调不仅是区别意义的手段,而是与词语所表达的意义有关。声调的高低、长短、发声力度的强弱都与词语所指事物的形状、形态、质地、程度等方面有着密切的联系,这使得意义在声调中的分布一定呈现互补性。声调在本质上并不是简单的别义标记,而是汉语使用者在语言的创造与使用过程中,结合自己的语言实际,利用声调自身特征以及声调对于词语语音及发音过程的影响,以实现最大限度的模拟自然事物特征的努力的结果。 展开更多
关键词 汉语普通话 声调 象似性 语义分布 理据
下载PDF
语义仓储构建技术研究进展 被引量:1
18
作者 邹益民 张智雄 +1 位作者 钱力 王颖 《情报学报》 CSSCI 北大核心 2013年第1期13-21,共9页
如何对海量的RDF数据进行存储、查询、存取和推理是RDF数据管理研究领域最关心的问题之一,文章界定了语义仓储的概念及其与关系数据库管理系统的区别,根据语义存储介质和组织方式的不同对语义仓储进行了分类,结合实际的案例对基于内... 如何对海量的RDF数据进行存储、查询、存取和推理是RDF数据管理研究领域最关心的问题之一,文章界定了语义仓储的概念及其与关系数据库管理系统的区别,根据语义存储介质和组织方式的不同对语义仓储进行了分类,结合实际的案例对基于内存、基于传统数据库和原生方式存储模式的语义仓储的优缺点、适用范围和不同存储模式之间的区别和联系进行了分析,在语义仓储的分布式存储策略上,对集中式语义仓储和自组织语义仓储这两种网络结构的组织形式和应用系统做了综述,还对语义仓储测试基准及应用系统的研究进展进行了分析,讨论存在的问题及未来可能的研究方向。 展开更多
关键词 RDF存储 语义仓储 存储模式 分布式语义仓储 测试基准
下载PDF
一种面向领域的Web服务语义聚类方法 被引量:5
19
作者 赵一 李昭 +2 位作者 陈鹏 何泾沙 何克清 《小型微型计算机系统》 CSCD 北大核心 2019年第1期81-88,共8页
目前,互联网中发布的Web服务大都通过自然语言进行描述,这种非结构化的描述方式为机器进行自动分析与处理带来了极大的困难.如何提高服务发现的效率和精确率,已成为服务计算领域的研究热点之一.服务聚类是服务发现的重要支撑技术,通过... 目前,互联网中发布的Web服务大都通过自然语言进行描述,这种非结构化的描述方式为机器进行自动分析与处理带来了极大的困难.如何提高服务发现的效率和精确率,已成为服务计算领域的研究热点之一.服务聚类是服务发现的重要支撑技术,通过将语义相似的服务加以聚类和组织,有助于改进服务发现的效果.当前的服务聚类技术主要采用LDA(潜式狄里克雷分布)和K-means等模型在同一领域下进行工作,利用这些方法进行服务聚类时还存在一定的局限性,例如,未充分利用词汇间的语义关系进行降维,从而导致服务发现的效果不够理想.针对该问题,本文使用神经网络模型(word2vec模型)获得服务描述中的同义词表并生成领域特征词集,来最大限度的降低服务特征向量维度;在此基础上,提出S-LDA(Semantic Latent Dirichlet Allocation)模型对同一领域的服务进行聚类,由此构建了一个面向领域的Web服务聚类框架(Domain Semantic aided Web Service Clustering,DSWSC).在ProgrammableWeb网站上发布的服务数据集开展的实验表明,与LDA和K-means等方法相比,本文方法在熵、聚类纯度和F指标上均取得了明显效果,有助于提高服务搜索的准确率. 展开更多
关键词 语义潜式狄里克雷分布 Word2vec web服务聚类
下载PDF
致使动词的语义地图 被引量:2
20
作者 李静波 《东北亚外语研究》 2017年第1期28-33,共6页
语义地图是语言类型学的一个重要理论,在分析多功能语言形式方面具有其他理论难以替代的作用。它不仅能够清晰直观地展示出某个语言形式的语义分布情况,还具有很强的预测能力。使役动词大多具有丰富的语义,是构建语义地图的一种较为理... 语义地图是语言类型学的一个重要理论,在分析多功能语言形式方面具有其他理论难以替代的作用。它不仅能够清晰直观地展示出某个语言形式的语义分布情况,还具有很强的预测能力。使役动词大多具有丰富的语义,是构建语义地图的一种较为理想的语言形式。本文在语义地图理论指导下,使用了汉语、日语、英语等十种语言材料,分析归纳了各语言中使役动词的语义分布情况,初步建立了人类语言中致使动词的语义地图模型。作为语言共性的一种表现方式,本文所建立的模型展示了人类语言中致使动词语义分布的普遍规律。 展开更多
关键词 语言类型学 致使动词 语义地图 语义分布 多功能形式
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部