期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
The reflection of hierarchical cluster analysis of co-occurrence matrices in SPSS 被引量:5
1
作者 Qiuju ZHOU Fuhai LENG Loet LEYDESDORFF 《Chinese Journal of Library and Information Science》 2015年第2期11-24,共14页
Purpose: To discuss the problems arising from hierarchical cluster analysis of co-occurrence matrices in SPSS, and the corresponding solutions. Design/methodology/approach: We design different methods of using the S... Purpose: To discuss the problems arising from hierarchical cluster analysis of co-occurrence matrices in SPSS, and the corresponding solutions. Design/methodology/approach: We design different methods of using the SPSS hierarchical clustering module for co-occurrence matrices in order to compare these methods. We offer the correct syntax to deactivate the similarity algorithm for clustering analysis within the hierarchical clustering module of SPSS. Findings: When one inputs co-occurrence matrices into the data editor of the SPSS hierarchical clustering module without deactivating the embedded similarity algorithm, the program calculates similarity twice, and thus distorts and overestimates the degree of similarity. Practical implications: We offer the correct syntax to block the similarity algorithm for clustering analysis in the SPSS hierarchical clustering module in the case of co-occurrence matrices. This syntax enables researchers to avoid obtaining incorrect results. Originality/value: This paper presents a method of editing syntax to prevent the default use of a similarity algorithm for SPSS's hierarchical clustering module. This will help researchers, especially those from China, to properly implement the co-occurrence matrix when using SPSS for hierarchical cluster analysis, in order to provide more scientific and rational results. 展开更多
关键词 Co-occurrence matrices Hierarchical cluster analysis SPSS Similarity algorithm The syntax editor
下载PDF
基于微信公众号文章的失真健康信息识别方法比较与优化 被引量:2
2
作者 王雷 宋士杰 朱庆华 《情报学报》 CSSCI CSCD 北大核心 2023年第2期127-135,共9页
近年来,大量失真健康信息以微信公众号文章的方式在社交平台上广为传播,严重影响了用户对健康知识的获取和利用健康信息做医疗决策的效果。为了抑制失真健康信息的传播,有必要对失真健康信息进行自动化的识别与检测。本文以科普中国、... 近年来,大量失真健康信息以微信公众号文章的方式在社交平台上广为传播,严重影响了用户对健康知识的获取和利用健康信息做医疗决策的效果。为了抑制失真健康信息的传播,有必要对失真健康信息进行自动化的识别与检测。本文以科普中国、丁香医生等公众号发布的健康类文章和经过辟谣的健康类文章为样本,通过分词、去停用词、语法特征提取和文本分类等步骤对失真健康信息进行识别,并通过分类准确率、精确率、召回率、训练时间等性能指标选出效果最佳的分类器。另外,针对文本分类中“一词多义”和“多词一义”的问题,本文通过LDA(latent Dirichlet allocation)主题分析提取文本的语义特征,进而提出一种“语法+语义”的特征提取方法,经过实验验证,各性能指标比基于语义的特征提取方法以及以往相关模型都有了一定的提升。本文为微信公众号文章中失真健康信息的识别提出了一种新的方法和工具,有利于对失真健康信息开展进一步的监测和治理。 展开更多
关键词 失真健康信息 语法特征 语义特征 LDA主题分析 算法评价 算法改进
下载PDF
基于改进编辑距离和依存文法的汉语句子相似度计算 被引量:22
3
作者 刘宝艳 林鸿飞 赵晶 《计算机应用与软件》 CSCD 北大核心 2008年第7期33-34,47,共3页
句子相似度计算在中文自然语言处理领域有着广泛的应用背景。要准确地刻画一个句子所表达的意思,必须深入到语义层面级并结合语法结构信息,提出了一种基于改进编辑距离和依存文法的汉语句子相似度计算方法。依存文法考虑到句子内部的结... 句子相似度计算在中文自然语言处理领域有着广泛的应用背景。要准确地刻画一个句子所表达的意思,必须深入到语义层面级并结合语法结构信息,提出了一种基于改进编辑距离和依存文法的汉语句子相似度计算方法。依存文法考虑到句子内部的结构和词语之间的相互作用关系,而编辑距离由于《同义词词林》的应用可以兼顾同义词之间的替换,因此该方法与其他方法相比,描述句子的信息更加全面,试验结果表明该方法是有效的。 展开更多
关键词 相似度计算 依存文法 改进编辑距离 句法分析
下载PDF
多媒体查询语言UMQL语法分析器的设计与实现 被引量:2
4
作者 吴宗大 曹忠升 +1 位作者 王元珍 黄达文 《小型微型计算机系统》 CSCD 北大核心 2010年第2期271-275,共5页
通用多媒体查询语言UMQL是多媒体信息检索的有效工具.讨论UMQL语法分析器的设计与实现.根据UMQL的语法特点,分别以正则式、巴克斯范式和逻辑代数定义该语言的词法、文法和语义规则集,设计一个层次化的UMQL语法分析模型.基于该模型并结... 通用多媒体查询语言UMQL是多媒体信息检索的有效工具.讨论UMQL语法分析器的设计与实现.根据UMQL的语法特点,分别以正则式、巴克斯范式和逻辑代数定义该语言的词法、文法和语义规则集,设计一个层次化的UMQL语法分析模型.基于该模型并结合编译原理的相关理论知识,设计实现UMQL语法分析器,并探讨其各部件实现的关键技术.该语法分析器能有效检测UMQL查询中的语法语义错误,并给出相应的错误提示信息. 展开更多
关键词 多媒体查询语言 语法分析 文法 语义
下载PDF
传递闭包的算法及应用 被引量:3
5
作者 侯云山 许中华 刘宏兵 《信阳师范学院学报(自然科学版)》 CAS 1999年第3期347-349,共3页
传递闭包是一种重要的关系运算。它在数据结构、编译理论和关系数据库中都有广泛的应用。本文详细地探讨关系的传递闭包的概念。
关键词 传递闭包 WARSHALL算法 语法分析 SQL
下载PDF
基于改进线图分析算法的浅层汉语句法分析器的设计与实现 被引量:4
6
作者 吴江宁 朱国华 《计算机应用研究》 CSCD 北大核心 2007年第9期164-167,共4页
针对传统的汉语句法分析算法进行改进,采用了自底向上与自顶向下相结合的线图分析方法,分析、设计和实现了一个汉语句法分析原型系统。该系统实现了基于最大词长匹配算法的分词模块、基于统计方法的词性标注模块和基于改进的线图分析算... 针对传统的汉语句法分析算法进行改进,采用了自底向上与自顶向下相结合的线图分析方法,分析、设计和实现了一个汉语句法分析原型系统。该系统实现了基于最大词长匹配算法的分词模块、基于统计方法的词性标注模块和基于改进的线图分析算法的句法分析模块。最后对系统进行小规模中文文本试验测试,测试结果表明利用改进的分析算法,使得句法分析效率和分析结果的准确率均有一定程度的提高。 展开更多
关键词 文本信息处理 汉语句法分析 线图分析法 句法解析器 句法结构
下载PDF
一种改进Viterbi算法的应用研究 被引量:7
7
作者 李荣 郑家恒 《计算机工程与设计》 CSCD 北大核心 2007年第3期530-531,571,共3页
为降低现代汉语句法分析的难度,以北大和哈工大语料为基础,利用改进的Viterbi算法对汉语真实文本进行了短语识别研究。提出了在隐马尔可夫模型(HMM)框架下,训练阶段依据统计概率信息,以极大似然法获取HMM参数,识别阶段用一种改进的Vite... 为降低现代汉语句法分析的难度,以北大和哈工大语料为基础,利用改进的Viterbi算法对汉语真实文本进行了短语识别研究。提出了在隐马尔可夫模型(HMM)框架下,训练阶段依据统计概率信息,以极大似然法获取HMM参数,识别阶段用一种改进的Viterbi算法进行动态规划,识别同层短语;在此基础上,运用逐层扫描算法和改进Viterbi算法相结合的方法来识别汉语嵌套短语。实验结果表明,识别正确率在封闭测试中可达93.52%,在开放测试中达到77.529%,证明该算法对短语识别问题具有良好的适应性和实用性。 展开更多
关键词 隐马尔可夫模型 VITERBI算法 层次分析 短语识别 句法分析
下载PDF
汉语自然语言检索中的句法分析方法 被引量:1
8
作者 汤艳莉 耿骞 《情报理论与实践》 CSSCI 北大核心 2004年第3期245-248,共4页
对汉语自然语言检索中的句法分析方法进行了探讨。自然语言检索中的一项重要工作就是对用户提问进行处理 ,而句法分析既是对用户提问进行处理的必须环节 ,也是对源文本分析的一个重要方法。本文探讨了基于局部分析的方法 ,并给出了相关... 对汉语自然语言检索中的句法分析方法进行了探讨。自然语言检索中的一项重要工作就是对用户提问进行处理 ,而句法分析既是对用户提问进行处理的必须环节 ,也是对源文本分析的一个重要方法。本文探讨了基于局部分析的方法 ,并给出了相关的数据结构和处理流程。 展开更多
关键词 汉语 自然语言检索 句法分析 用户提问 数据结构 算法 信息检索 概率语法
下载PDF
基于多线程LL(1)分析表自动生成的并行算法 被引量:1
9
作者 闫昭 刘磊 《吉林大学学报(信息科学版)》 CAS 2009年第1期85-89,共5页
为解决编译系统工作中由于文法非终结符数量庞大造成的生成LL(1)分析表速度缓慢的问题,描述了多处理机环境下的LL(1)分析表自动生成的一种并行处理方法,并讨论了LL(1)分析表生成的并行算法的设计思想和实现策略。在采用LL(1)方法实现自... 为解决编译系统工作中由于文法非终结符数量庞大造成的生成LL(1)分析表速度缓慢的问题,描述了多处理机环境下的LL(1)分析表自动生成的一种并行处理方法,并讨论了LL(1)分析表生成的并行算法的设计思想和实现策略。在采用LL(1)方法实现自顶向下语法分析的并行编译中,LL(1)分析表的生成一直处于关键地位,由于文法中的终结符和非终结符个数很多,分析表的构造成为提高语法分析速度的瓶颈问题,因此考虑采用LL(1)分析表的并行生成。算法采用多线程的工作模式,并借助于线程间的通讯机制实现,此并行处理方法对编译的并行处理和提高效率有理论和现实意义。 展开更多
关键词 文法 LL(1)语法分析 并行算法 并行编译
下载PDF
基于神经网络语法分析 被引量:3
10
作者 雷向东 《计算机工程与应用》 CSCD 北大核心 2001年第17期138-139,共2页
文章提出了基于神经网络理论适用于LR文法的语法分析,与传统LR分析器相比,神经网络LR分析器具有较高的性能。
关键词 神经网络 语法分析 LR文法 语法分析器 符号处理
下载PDF
自然语言处理的句法分析和规则索引 被引量:12
11
作者 杨宪泽 《科技通报》 北大核心 2002年第6期470-473,478,共5页
在自动翻译的设计中 ,句法分析是核心问题 .本文的研究背景是自然语言处理系统 ,其工作有两部分 :第一部分讨论了句法分析 ;第二部分提出了规则索引算法 .
关键词 自然语言处理 句法分析 规则索引 自动翻译 语法规则 规则索引算法
下载PDF
运用互信息匹配及关键词分析的语音对话系统 被引量:4
12
作者 俞一彪 赵鹤鸣 周旭东 《小型微型计算机系统》 CSCD 北大核心 2003年第1期147-150,共4页
介绍应用于“虎丘”旅游服务的非特定人语音对话系统 .该系统运用互信息匹配模型 MIM进行音节识别 ,并提出了关键词句法模型及相应的分析算法 KBP进行语句分析和识别 .实验表明 ,互信息匹配模型 MIM的应用使连续语音音节识别率达到 78% ... 介绍应用于“虎丘”旅游服务的非特定人语音对话系统 .该系统运用互信息匹配模型 MIM进行音节识别 ,并提出了关键词句法模型及相应的分析算法 KBP进行语句分析和识别 .实验表明 ,互信息匹配模型 MIM的应用使连续语音音节识别率达到 78% ,而关键词句法分析的运用使系统总体语句识别率提高了 65 % 。 展开更多
关键词 语音对话系统 互信息 关键词分析 KBP
下载PDF
探究制度的结构和内容:制度语法工具研究述评 被引量:3
13
作者 林迪芬 《公共管理评论》 CSSCI 2021年第3期141-159,共19页
制度语法是一种解剖制度结构和内容的分析工具。自1995年问世以来,制度语法工具已经在多个研究议题和不同政策领域中得到较为广泛的应用,日益成为公共管理学科富有潜力的分析工具之一。本文首先考察了制度语法工具的产生背景,接着概述... 制度语法是一种解剖制度结构和内容的分析工具。自1995年问世以来,制度语法工具已经在多个研究议题和不同政策领域中得到较为广泛的应用,日益成为公共管理学科富有潜力的分析工具之一。本文首先考察了制度语法工具的产生背景,接着概述了制度语法工具的核心要件——ADICO句法,以及辅助要件——规则类型学和制度层次学。新近的研究主题主要集中在对制度语法工具的理论修正与拓展、编码系统的完善、实证案例分析等方面。在此基础上,本文建议未来应加强制度语法工具的理论研究,应推动制度语法工具与其他理论框架的结合。此外,制度文本的编码技术还需持续更新,研究数据来源应进一步丰富。最后,本文提出在中国情境下开展制度语法工具研究的意义和建议。 展开更多
关键词 制度语法工具 制度表述 ADICO句法 规则类型学 制度层次学
下载PDF
基于GLR算法的英语长难句句法分析的探讨 被引量:1
14
作者 郑燕娥 郑志明 《安阳师范学院学报》 2015年第2期32-35,共4页
英语长难句是英汉翻译的一大障碍点,其复杂结构的有效识别和分析直接关系到英汉翻译质量。基于此,对英语长难句的句法分析技术进行研究,提出基于GLR算法的长难句拆分策略。将长难句拆分为不同层次的片断,利用GLR算法识别与分析各片断中... 英语长难句是英汉翻译的一大障碍点,其复杂结构的有效识别和分析直接关系到英汉翻译质量。基于此,对英语长难句的句法分析技术进行研究,提出基于GLR算法的长难句拆分策略。将长难句拆分为不同层次的片断,利用GLR算法识别与分析各片断中的简单短语,提炼出句子的主干结构,为生成译文做好铺垫;同时对错误拆分的情形进行纠正,从而有效提高了句法分析的合理性。实验结果表明,该拆分策略在长难句的句子结果拆分上具有较好的合理性。 展开更多
关键词 长难句拆分策略 GLR算法 句法分析
下载PDF
自然语言查询系统中的句法分析与算法实现 被引量:2
15
作者 马晓娜 杨承磊 《山东建筑工程学院学报》 2005年第1期76-81,共6页
为了让更多的不熟悉计算机技术的用户使用他们熟悉的方式从数据库中查询信息,利用汉语自然语言进行查询成为当前的一个热点问题。由于汉语语句的复杂性,建立自然语言理解的形式化模型一直是研究的难点。本文针对当前研究的热点和难点问... 为了让更多的不熟悉计算机技术的用户使用他们熟悉的方式从数据库中查询信息,利用汉语自然语言进行查询成为当前的一个热点问题。由于汉语语句的复杂性,建立自然语言理解的形式化模型一直是研究的难点。本文针对当前研究的热点和难点问题,通过分析数据库中常用的SQL句型,把查询语句划分为六类,提出了受限汉语规则和基于受限汉语的上下文无关文法来尝试解决自然语言处理中的语句理解问题,并给出了详细的算法描述。 展开更多
关键词 人工智能 自然语言处理 上下文无关文法 句法分析
下载PDF
基于合一的链接文法
16
作者 亓超 张美娜 +1 位作者 迟呈英 战学刚 《计算机应用与软件》 CSCD 北大核心 2008年第4期263-264,283,共3页
以词汇主义形式语法为基础,建立了链接文法与合一理论相结合的句法分析新方法。在封闭测试中,基于合一的链接文法句法分析精确率和召回率相比传统链接文法分别提高了9.6%和14.1%。实验表明方法具有一定独创性和高效性。
关键词 链接文法 合一运算 特征结构 句法分析
下载PDF
基于特征表达式的算法识别技术
17
作者 方霞 吕红 +2 位作者 尹青 张杰 王丽娜 《计算机工程》 CAS CSCD 北大核心 2011年第24期32-35,共4页
以代码逆向分析得到的高级语言为基础,提取特征表达式作为算法的特征模式。综合考虑高级语言中表达式的恢复程度,设计严格相容与变形相容2种识别策略,在此基础上提出一种基于抽象语法树的算法特征表达式识别方法,利用该方法可较好地识... 以代码逆向分析得到的高级语言为基础,提取特征表达式作为算法的特征模式。综合考虑高级语言中表达式的恢复程度,设计严格相容与变形相容2种识别策略,在此基础上提出一种基于抽象语法树的算法特征表达式识别方法,利用该方法可较好地识别目标代码中包含的算法,提高代码的分析效率。 展开更多
关键词 代码逆向分析 算法识别 抽象语法树 特征表达 相容
下载PDF
基于ABNF规则的SIP消息解析模块设计 被引量:2
18
作者 朱云 《舰船电子工程》 2007年第6期161-164,共4页
SIP消息的解析比较复杂,是整个SIP协议栈开发的基础,也是决定SIP协议栈效率的重要组成部分。其中对于需要大量文本字符串查找和匹配操作的解码正确性检查部分更是重要的操作部分,它需要耗费大量的CPU时间。传统的单线程算法实现解码速... SIP消息的解析比较复杂,是整个SIP协议栈开发的基础,也是决定SIP协议栈效率的重要组成部分。其中对于需要大量文本字符串查找和匹配操作的解码正确性检查部分更是重要的操作部分,它需要耗费大量的CPU时间。传统的单线程算法实现解码速度缓慢,采用并行多进程的Tomita算法,可以有效地提高SIP消息的解析速度,在消除歧义方面也有很大的改善。 展开更多
关键词 SIP协议 词法解析 Tomita算法
下载PDF
基于LR算法的汉语句法分析系统 被引量:1
19
作者 姚文琳 《山东轻工业学院学报(自然科学版)》 CAS 1999年第3期6-10,共5页
本文提出并实现了基于LR算法的汉语句法分析方法。阐述了如何利用汉语属性文法,借助于自底向上的分析方法和属性计算,对汉语句子进行有效的句法分析,生成正确的语法分析树。该算法克服了自顶向下的分析方法必定存在回溯、分析代价... 本文提出并实现了基于LR算法的汉语句法分析方法。阐述了如何利用汉语属性文法,借助于自底向上的分析方法和属性计算,对汉语句子进行有效的句法分析,生成正确的语法分析树。该算法克服了自顶向下的分析方法必定存在回溯、分析代价大的缺陷。 展开更多
关键词 句法分析 LR算法 属性文法 汉字处理 汉语
下载PDF
算符优先语法分析中句型分界符的处理
20
作者 戴祖旭 刘吉定 《武汉理工大学学报》 CAS CSCD 2003年第11期100-102,共3页
算符优先语法分析过程中要处理句型分界符与文法终结符之间的优先关系 ,但这类优先关系不能由现有的构造算符优先表的算法直接得到。文中提出了一种方案 ,通过拓广算符优先文法 ,使句型分界符成为拓广文法的一个终结符 ,再对拓广文法施... 算符优先语法分析过程中要处理句型分界符与文法终结符之间的优先关系 ,但这类优先关系不能由现有的构造算符优先表的算法直接得到。文中提出了一种方案 ,通过拓广算符优先文法 ,使句型分界符成为拓广文法的一个终结符 ,再对拓广文法施行构造算符优先表算法 ,可同时得到原文法终结符与句型分界符之间的算符优先关系。 展开更多
关键词 语法分析 算符优先表 句型分界符 拓广文法
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部