期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于协议语义序列的应用层交互行为异常检测 被引量:2
1
作者 石旺 杨英杰 +1 位作者 唐慧林 董丽鹏 《计算机应用研究》 CSCD 北大核心 2015年第10期3060-3064,共5页
为了有效检测出应用层异常交互行为,提出了一种基于协议语义序列的检测方法。首先利用协议语义序列对应用层交互行为进行描述,并对存在的异常交互情形进行分析;然后提出基于协议语义序列的异常检测方法,利用报文的方向和时序关系构建出... 为了有效检测出应用层异常交互行为,提出了一种基于协议语义序列的检测方法。首先利用协议语义序列对应用层交互行为进行描述,并对存在的异常交互情形进行分析;然后提出基于协议语义序列的异常检测方法,利用报文的方向和时序关系构建出标准语义序列集,并获取正常行为特征,根据异常交互情形定义检测规则,利用序列比对和决策树算法实现了对应用层交互行为的异常检测。实验结果表明,该方法具有较高的检测率和较低的误报率。 展开更多
关键词 应用层交互行为 协议语义序列 检测规则 序列比对 异常检测
下载PDF
医学语篇常见搭配框的语义序列分析 被引量:2
2
作者 张继东 夏梦茹 《厦门理工学院学报》 2015年第6期74-80,共7页
基于Hunston的语义序列分析理论,以上海交大科技英语语料库(JDEST)的医学语料库为源库,对英语医学语篇常见搭配框the*of,a*of和be*to的前后搭配词、中间搭配词进行归类分析,发现医学语篇搭配框的搭配词多涉及医学治疗、诊断、药物使用... 基于Hunston的语义序列分析理论,以上海交大科技英语语料库(JDEST)的医学语料库为源库,对英语医学语篇常见搭配框the*of,a*of和be*to的前后搭配词、中间搭配词进行归类分析,发现医学语篇搭配框的搭配词多涉及医学治疗、诊断、药物使用、医学研究过程、作用、评价等医疗过程和医学研究的词汇,搭配框架的语义是有规律可循的,更是受体裁影响的。英语学习者可以不同的语义序列区分不同的语类特征,以便于掌握医学语篇的语义特点和语篇特征。 展开更多
关键词 医学语篇 语义序列 搭配框架 搭配词 语料库
下载PDF
海事英语常见搭配框架语义序列分析
3
作者 吕程程 王倩文 《英语广场(学术研究)》 2020年第5期42-43,共2页
本文依据Hunston的语义序列分析理论,基于大连海事大学海事英语语料库(Maritime English Corpus,简称MEC),对常见搭配框架be*to,the*of,a*of的中间高频搭配词进行语义分析。研究发现,海事英语中对以上三个搭配框架形成了有海事特色的语... 本文依据Hunston的语义序列分析理论,基于大连海事大学海事英语语料库(Maritime English Corpus,简称MEC),对常见搭配框架be*to,the*of,a*of的中间高频搭配词进行语义分析。研究发现,海事英语中对以上三个搭配框架形成了有海事特色的语义序列,中间搭配词多与海上作业描述、海事条约规定和海事安全等相关,这反映出海事语篇搭配框架的语义特点。学习者可以对不同语篇进行搭配框架语义序列分析,增进对不同语类篇章的深入理解。 展开更多
关键词 海事英语 语义序列 搭配框架
下载PDF
语义通信的数学理论
4
作者 牛凯 张平 《通信学报》 EI CSCD 北大核心 2024年第6期7-59,共53页
自从1948年经典信息论诞生以来,在其指导下,现代通信技术已经逼近了理论性能极限,例如信息熵H(U)、信道容量C=max_(p(x))I(X;Y)以及率失真函数R(D)=min_(p(x|x):Ed(x,x)≤D)I(X;X)。长期以来,由于经典信息论只研究语法信息,限制了通信... 自从1948年经典信息论诞生以来,在其指导下,现代通信技术已经逼近了理论性能极限,例如信息熵H(U)、信道容量C=max_(p(x))I(X;Y)以及率失真函数R(D)=min_(p(x|x):Ed(x,x)≤D)I(X;X)。长期以来,由于经典信息论只研究语法信息,限制了通信科学的进一步发展。近年来,研究语义信息处理与传输的通信技术获得了学术界的普遍关注,语义通信开辟了未来通信技术发展的新方向,但还缺乏一般性的数学指导理论。为了解决这一难题,构建了语义信息论的理论框架,对语义信息的度量体系与语义通信的理论极限进行了系统性阐述。首先,通过深入分析各类信源的数据特征,以及各种下游任务的需求,总结归纳出语义信息的普遍属性——同义性。由此指出语义信息是语法信息的上级概念,是许多等效或相似语法信息的抽象特征,表征隐藏在数据或消息背后的含义或内容。将语义信息与语法信息之间的关系命名为同义映射,这是一种“一对多”映射,即一个语义符号可以由许多不同的语法符号表示。基于同义映射f这一核心概念,引入语义熵H_(s)(U)作为语义信息的基本度量指标,表示为信源概率分布与同义映射的泛函。在此基础上,引入上/下语义互信息I^(s)(X;Y)(I_(s)(X;Y)),语义信道容量C_(s)=max_(f_(xy))max_(p_((x)))I^(s)(X;Y)以及语义率失真函数R_(s)(D)=min_({f_(x),f_(x)})min_(p(x|x):Ed_(s)(x,x)≤D)I_(s)(X;X),从而构建了完整的语义信息度量体系。这些语义信息度量是经典信息度量的自然延伸,都由同义映射约束,如果采用“一对一”映射,则可以退化为传统的信息度量。由此可见,语义信息度量体系包含语法信息度量,前者与后者具有兼容性。其次,证明了3个重要的语义编码定理,以揭示语义通信的性能优势。基于同义映射,引入新的数学工具——语义渐近均分(AEP),详细探讨了同义典型序列的数学性质,并应用随机编码和同义典型序列译码/编码,证明了语义无失真信源编码定理、语义信道编码定理和语义限失真信源编码定理。类似于经典信息论,这些基本编码定理也都是存在性定理,但它们指出了语义通信系统的性能极限,在语义信息论中起着关键作用。由同义映射和这些基本编码定理可以推断,语义通信系统的性能优于经典通信系统,即语义熵小于信息熵H_(s)(U)≤H(U),语义信道容量大于经典信道容量C_(s)≥C,以及语义率失真函数小于经典率失真函数R_(s)(D)≤R(D)。最后,讨论了连续条件下的语义信息度量。此时,同义映射转换为连续随机变量分布区间的划分方式。相应地,划分后的子区间被命名为同义区间,其平均长度定义为同义长度S。特别是对于限带高斯信道,得到了一个新的信道容量公式C_(s)=B log[S^(4)(1+P/N_(0)B)],其中,平均同义长度S表征了信息的辨识能力。这一容量公式是经典信道容量的重要扩展,当S=1时,该公式退化为著名的香农信道容量公式。综上所述,语义信息论依据同义映射这一语义信息的本质特征,构建了语义信息的度量体系,引入新的数学工具,证明了语义编码的基本定理,论证了语义通信系统的性能极限,揭示了未来语义通信的巨大性能潜力。 展开更多
关键词 同义映射 语义 上/下语义互信息 语义信道容量 语义失真 语义率失真函数 语义典型序列 同义典型序列 同义长度
下载PDF
语义序列与学科文化探索 被引量:7
5
作者 杨越森 苏杭 卫乃兴 《外语教学与研究》 CSSCI 北大核心 2019年第4期508-520,639,共14页
本文采用语义序列路径探讨学科话语中高频复现短语型式与学科文化的联系。参照Becher等人提出的学科分类,本文选取了语言学、管理学、物理学和计算机科学分别代表纯理型软学科、应用型软学科、纯理型硬学科和应用型硬学科,以中国学者学... 本文采用语义序列路径探讨学科话语中高频复现短语型式与学科文化的联系。参照Becher等人提出的学科分类,本文选取了语言学、管理学、物理学和计算机科学分别代表纯理型软学科、应用型软学科、纯理型硬学科和应用型硬学科,以中国学者学术话语为语料,聚焦学术话语中的两个高频报道型式V that和it be V-ed that,构建了相应的语义序列分析框架。语料分析显示,四类学科共享部分语义序列,软硬学科、纯理与应用型学科的语义序列既呈现出规律性的特征,也有错综的表征,显示了学科性质和文化的复杂性。本研究揭示了短语学视角下的语义序列分析对探究学科文化的可行性和有效性,为学术话语、学科属性等研究提供了新的研究范式或视角。此外,语义序列分析对学术写作教学颇有助益,可帮助学科从业人员更好地了解学科文化特征,进而规范和优化学术英语表达。 展开更多
关键词 语义序列 学科文化 报道型式 学术话语
原文传递
语料库驱动的语义序列研究——以搭配框架为例 被引量:12
6
作者 杨素香 《外语教学理论与实践》 CSSCI 北大核心 2012年第4期28-35,共8页
Hunston(2008)提出了语义序列的概念、构成及其研究方法。语义序列指在语料库中有规则地出现的一系列意义成分。本文以Hunston(2008)所论为方法框架,以英语搭配框架"the*of"为研究焦点,以语料库驱动的方法探讨语料库证据显示... Hunston(2008)提出了语义序列的概念、构成及其研究方法。语义序列指在语料库中有规则地出现的一系列意义成分。本文以Hunston(2008)所论为方法框架,以英语搭配框架"the*of"为研究焦点,以语料库驱动的方法探讨语料库证据显示的不同语类如医学英语和传记英语的语义序列。结果显示,医学英语形成与医疗、疾病、变化等有关的语义序列,而传记英语形成与生平、经历、时间等有关的语义序列。因此,语义序列能够反映语篇特征,对语类区分和预测具有重要意义。 展开更多
关键词 语料库驱动 搭配框架 语义序列 医学英语 传记英语
原文传递
介词主题词的话语意义分析及语义序列研究 被引量:3
7
作者 张立英 《外国语》 CSSCI 北大核心 2016年第1期55-63,共9页
本文提出了一种介词主题词驱动的话语意义分析方法,旨在通过索引行型式提取特定语篇中的语义序列,并将其应用于自建语料库。结果显示,该方法所提取的语义序列可揭示语篇的宏观特征和历时变化。短语学研究表明,语言中存在大量词汇共选生... 本文提出了一种介词主题词驱动的话语意义分析方法,旨在通过索引行型式提取特定语篇中的语义序列,并将其应用于自建语料库。结果显示,该方法所提取的语义序列可揭示语篇的宏观特征和历时变化。短语学研究表明,语言中存在大量词汇共选生成的多词序列或短语单位。本研究补充了短语学的研究成果,表明特定语篇中同样存在大量由意义共现生成的语义序列,而语义序列是短语单位的又一重要属性。语义序列研究可拓宽语料库短语学研究范围,丰富扩展意义单位研究。 展开更多
关键词 主题性 语义序列 索引行型式 型式-意义 话语分析方法
原文传递
生物序列的语义分析与第二密码规则的探索(续)
8
作者 沈世镒 余涛 +1 位作者 开波 阮吉寿 《工程数学学报》 CSCD 北大核心 2004年第6期862-870,共9页
本文继续讨论蛋白质一级结构序列的语义结构,利用组合分析与图论方法讨论 Swiss - Prot 数据 库的组合结构,给出 Swiss - Prot 数据库中蛋白质一级结构序列的关键词与核心词的定义、搜索 算法与特性参数。并由此给出蛋白质一级结... 本文继续讨论蛋白质一级结构序列的语义结构,利用组合分析与图论方法讨论 Swiss - Prot 数据 库的组合结构,给出 Swiss - Prot 数据库中蛋白质一级结构序列的关键词与核心词的定义、搜索 算法与特性参数。并由此给出蛋白质一级结构序列的核心词词典,并由此讨论数据库的复杂性问题、同源蛋白质的分类、预测与比对等问题。 展开更多
关键词 生物序列结构的语义分析 第二密码规则 蛋白质一级序列结构数据库的组合图论分析 非线性复杂与核心词词典
下载PDF
生物序列的语义分析与第二密码规则的探索
9
作者 沈世镒 《工程数学学报》 CSCD 北大核心 2004年第5期665-674,679,共11页
生物序列(如DNA、RNA与蛋白质一级结构序列等)都是由一系列小分子团(如核苷酸、氨基酸等)排列组成,如把这些小分子团作为符号单元,那么这些生物序列就是生物序列就是生物学的语言文字,对这些语言文字的结构分析为生物序列的语义分析。... 生物序列(如DNA、RNA与蛋白质一级结构序列等)都是由一系列小分子团(如核苷酸、氨基酸等)排列组成,如把这些小分子团作为符号单元,那么这些生物序列就是生物序列就是生物学的语言文字,对这些语言文字的结构分析为生物序列的语义分析。生物序列语义分析的内容包括词法与语法的分析,它们是在分子水平基础上的生物语言分析,有关的变化规则我们称之为生物序列中的第二密码规则。本文以Swiss-Prot数据库为基础,利用频率统计、组合分析与信息的度量关系等数学工具,分析蛋白质一级结构序列中的词法规则,给出了关于蛋白质一级结构序列的几种稳定性的度量指标及其相应的稳定性理论,并探讨了它们在蛋白质演变与蛋白质工程中可能产生的应用。 展开更多
关键词 生物序列结构的语义分析 第二密码规则 蛋白质~级序列结构数据库的信息、统计分析 稳定性度量与原理
下载PDF
室内用户语义位置模式挖掘研究--以商场为例 被引量:2
10
作者 张心悦 王光霞 +2 位作者 吴月 马嘉琳 王思 《测绘与空间地理信息》 2016年第2期12-16,共5页
结合室内轨迹数据的特点,研究了室内移动对象语义轨迹序列处理方法,以及利用LDA主题模型与用户历史轨迹进行室内商场用户分类的方法。提出了通过关联规则分析挖掘用户语义位置模式的方法,并以北京某大型商场的实际用户轨迹数据为例,对... 结合室内轨迹数据的特点,研究了室内移动对象语义轨迹序列处理方法,以及利用LDA主题模型与用户历史轨迹进行室内商场用户分类的方法。提出了通过关联规则分析挖掘用户语义位置模式的方法,并以北京某大型商场的实际用户轨迹数据为例,对所提出的方法进行了实验验证。 展开更多
关键词 语义轨迹序列 室内轨迹 主题模型 用户分类 语义模式挖掘
下载PDF
一种增量式文本软聚类算法 被引量:3
11
作者 冯中慧 鲍军鹏 沈钧毅 《西安交通大学学报》 EI CAS CSCD 北大核心 2007年第4期398-401,411,共5页
针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,... 针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,同时将每次选择的具有最小熵重叠值的候选类作为一个结果聚类,这样在整个聚类的过程中大大减小了文本向量空间的维数,缩短了计算时间.由于所提算法的语义序列只与文本自身相关,所以它适用于增量式聚类.实验结果表明,算法的聚类精度高于同条件下的其他聚类算法,尤其适合于长文本集的软聚类. 展开更多
关键词 语义序列 增量式聚类 软聚类 文本聚类
下载PDF
异构社交平台中用户身份解析 被引量:1
12
作者 刘俊岭 刘颖 +3 位作者 马晨旭 赵巧娜 孙焕良 许景科 《数据采集与处理》 CSCD 北大核心 2022年第5期1101-1114,共14页
跨社交平台的用户身份解析是社交网络一个重要的研究方向,其可以有效集成不同平台的同一用户信息。现有的用户身份解析工作大多针对类型相似的社交平台,平台间的信息相对对称,通过用户在不同平台上的档案属性、空间位置、网络关系等信... 跨社交平台的用户身份解析是社交网络一个重要的研究方向,其可以有效集成不同平台的同一用户信息。现有的用户身份解析工作大多针对类型相似的社交平台,平台间的信息相对对称,通过用户在不同平台上的档案属性、空间位置、网络关系等信息的相似度来判别是否为同一用户。然而,在两个异构社交平台中用户信息是不对称的,难以直接获取到用于用户身份解析的相应属性信息。本文研究跨评论类与活动类平台间的用户身份解析方法。为了解决两类社交平台的用户信息属性不对称问题,把用户信息按档案属性、语义序列、特征词序列3类信息组织,从各自的社交平台中抽取相应的信息建立映射关系,提出了综合3类信息的集成匹配算法。考虑了用户活动的时间偏移现象,采用反向传播学习的方法获取时间偏移权重,提出了基于反向传播学习的语义序列与特征词序列相似性度量方法。同时,设计了总体相似度度用于用户身份解析。利用真实数据集进行了充分的实验,实验结果表明了所提出用户身份解析算法的有效性。 展开更多
关键词 社会网络 用户身份解析 特征词序列 语义序列
下载PDF
利用语料库驱动方法的程式化语言研究评述
13
作者 李凤华 《北京航空航天大学学报(社会科学版)》 2012年第6期94-98,共5页
对于英语中利用语料库驱动方法进行的程式化语言研究进行评述,对比分析其理论基础、研究角度等方面的异同,发现意义单位、语义序列、语法模式以核心词为中心,揭示程式化词语序列中词与意义、词与语法之间的关系;词束没有核心词,强调语... 对于英语中利用语料库驱动方法进行的程式化语言研究进行评述,对比分析其理论基础、研究角度等方面的异同,发现意义单位、语义序列、语法模式以核心词为中心,揭示程式化词语序列中词与意义、词与语法之间的关系;词束没有核心词,强调语篇功能和语域差异。此外,意义单位重视语义特点和意义的完整性,语义序列和语法模式则强调词汇语法模式,但是语法模式是比语义序列更为抽象的概括。 展开更多
关键词 语料库 程式化语言 核心词 语义序列 语法模式 词束
下载PDF
复杂中文文本的实体关系抽取研究 被引量:1
14
作者 王苑 徐德智 陈建二 《计算机科学》 CSCD 北大核心 2009年第8期208-211,共4页
实体关系抽取是信息抽取研究领域中的重要研究课题之一。针对已有方法在处理复杂文本上的不足,提出了复杂中文文本的实体关系抽取方法。结合中文文本的语法特征,提出了7条抽取关系特征序列的启发式规则,并采用语义序列核和KNN机器学习... 实体关系抽取是信息抽取研究领域中的重要研究课题之一。针对已有方法在处理复杂文本上的不足,提出了复杂中文文本的实体关系抽取方法。结合中文文本的语法特征,提出了7条抽取关系特征序列的启发式规则,并采用语义序列核和KNN机器学习算法结合的方法来分类和标注关系的类型。通过对ACE评测定义下的两个子类的实体关系抽取,关系抽取的平均F值达到了76%,明显高于传统的基于特征向量和最短依存路径核的方法。 展开更多
关键词 实体关系抽取 语法特征 启发式规则 语义序列
下载PDF
关于汉语“连…也/都…”句式的思考 被引量:1
15
作者 杨晓明 韩闽红 《北京邮电大学学报(社会科学版)》 2007年第4期65-70,共6页
汉语学者对"连"字句的描述是:对"连"和"也/都"中间的成分进行强调,本文从对外汉语教学的角度出发,认为"连"字句还应该对所强调部分——"极端项"关涉的序列进行关照,这是由"连&q... 汉语学者对"连"字句的描述是:对"连"和"也/都"中间的成分进行强调,本文从对外汉语教学的角度出发,认为"连"字句还应该对所强调部分——"极端项"关涉的序列进行关照,这是由"连"字句周遍性语义决定的。 展开更多
关键词 周遍性 语义序列 极端项
下载PDF
“四字骈语”的词汇化 被引量:10
16
作者 安华林 《北华大学学报(社会科学版)》 2007年第5期62-67,共6页
"四字骈语"介于四字并列的自由短语和固定短语之间,是研究自由结构词汇化很好的窗口。出现明显的转义是四字骈语词汇化的根本动因,语义等级越低,词汇化的程度越弱,语义等级序列也是词汇化程度序列。四字语音模式、成分的非独... "四字骈语"介于四字并列的自由短语和固定短语之间,是研究自由结构词汇化很好的窗口。出现明显的转义是四字骈语词汇化的根本动因,语义等级越低,词汇化的程度越弱,语义等级序列也是词汇化程度序列。四字语音模式、成分的非独立性、高使用度,以及与成语的类比认同等多种语言内外部因素,共同促成了四字骈语的词汇化。 展开更多
关键词 四字骈语 语法化 词汇化 制约因素 语义等级序列
下载PDF
学习者英语中语法词的短语学特征:以of为例 被引量:9
17
作者 甄凤超 王华 《外语教学与研究》 CSSCI 北大核心 2012年第3期389-401,479-480,共13页
语料库语言学框架下的短语学研究主要以词汇词为主,很少关注语法词。本研究以"中国学习者英语语料库"为数据来源,以of为例,分析语法词的结构模式及其表达的意义,并且对比不同英语水平的学习者在使用语法词的结构模式及其意义... 语料库语言学框架下的短语学研究主要以词汇词为主,很少关注语法词。本研究以"中国学习者英语语料库"为数据来源,以of为例,分析语法词的结构模式及其表达的意义,并且对比不同英语水平的学习者在使用语法词的结构模式及其意义上的差异。文章首先分析了of的不同结构模式,其次选择nofn模式做语义序列的分析。研究结果显示,语法词具有明显的短语学特征,完全可以作为切入点对结构模式和意义进行实证性语言学研究。另外,学习者之间的差异主要表现在:首先,随着英语水平的提高,学习者会掌握更多的of短语模式和更复杂的语义序列;其次,学习者较容易掌握nofn结构中的"属性+of+实物/现象、数量+of+实物/现象、过程+of+对象"的语义序列,并且呈现出一定的习得顺次。 展开更多
关键词 语法词 短语学 结构模式 语义序列
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部