期刊文献+
共找到62篇文章
< 1 2 4 >
每页显示 20 50 100
Novel Representations of Word Embedding Based on the Zolu Function
1
作者 Jihua Lu Youcheng Zhang 《Journal of Beijing Institute of Technology》 EI CAS 2020年第4期526-530,共5页
Two learning models,Zolu-continuous bags of words(ZL-CBOW)and Zolu-skip-grams(ZL-SG),based on the Zolu function are proposed.The slope of Relu in word2vec has been changed by the Zolu function.The proposed models can ... Two learning models,Zolu-continuous bags of words(ZL-CBOW)and Zolu-skip-grams(ZL-SG),based on the Zolu function are proposed.The slope of Relu in word2vec has been changed by the Zolu function.The proposed models can process extremely large data sets as well as word2vec without increasing the complexity.Also,the models outperform several word embedding methods both in word similarity and syntactic accuracy.The method of ZL-CBOW outperforms CBOW in accuracy by 8.43%on the training set of capital-world,and by 1.24%on the training set of plural-verbs.Moreover,experimental simulations on word similarity and syntactic accuracy show that ZL-CBOW and ZL-SG are superior to LL-CBOW and LL-SG,respectively. 展开更多
关键词 Zolu function word embedding continuous bags of words word similarity accuracy
下载PDF
Identification of Sarcasm in Textual Data: A Comparative Study 被引量:1
2
作者 Pulkit Mehndiratta Devpriya Soni 《Journal of Data and Information Science》 CSCD 2019年第4期56-83,共28页
Purpose:Ever increasing penetration of the Internet in our lives has led to an enormous amount of multimedia content generation on the internet.Textual data contributes a major share towards data generated on the worl... Purpose:Ever increasing penetration of the Internet in our lives has led to an enormous amount of multimedia content generation on the internet.Textual data contributes a major share towards data generated on the world wide web.Understanding people’s sentiment is an important aspect of natural language processing,but this opinion can be biased and incorrect,if people use sarcasm while commenting,posting status updates or reviewing any product or a movie.Thus,it is of utmost importance to detect sarcasm correctly and make a correct prediction about the people’s intentions.Design/methodology/approach:This study tries to evaluate various machine learning models along with standard and hybrid deep learning models across various standardized datasets.We have performed vectorization of text using word embedding techniques.This has been done to convert the textual data into vectors for analytical purposes.We have used three standardized datasets available in public domain and used three word embeddings i.e Word2Vec,GloVe and fastText to validate the hypothesis.Findings:The results were analyzed and conclusions are drawn.The key finding is:the hybrid models that include Bidirectional LongTerm Short Memory(Bi-LSTM)and Convolutional Neural Network(CNN)outperform others conventional machine learning as well as deep learning models across all the datasets considered in this study,making our hypothesis valid.Research limitations:Using the data from different sources and customizing the models according to each dataset,slightly decreases the usability of the technique.But,overall this methodology provides effective measures to identify the presence of sarcasm with a minimum average accuracy of 80%or above for one dataset and better than the current baseline results for the other datasets.Practical implications:The results provide solid insights for the system developers to integrate this model into real-time analysis of any review or comment posted in the public domain.This study has various other practical implications for businesses that depend on user ratings and public opinions.This study also provides a launching platform for various researchers to work on the problem of sarcasm identification in textual data.Originality/value:This is a first of its kind study,to provide us the difference between conventional and the hybrid methods of prediction of sarcasm in textual data.The study also provides possible indicators that hybrid models are better when applied to textual data for analysis of sarcasm. 展开更多
关键词 Machine learning Artificial neural networks Word embedding Text vectorization accuracy
下载PDF
词频对学习判断的影响 被引量:6
3
作者 贾宁 张石磊 陈洁彬 《心理学探新》 CSSCI 2010年第6期32-35,共4页
该研究通过自定步速的联结学习任务,考察在学习高频词对和低频词对时即时学习判断的绝对准确性,以及学习判断准确性与回忆成绩的相关。实验结果显示:(1)即时学习判断等级与回忆成绩存在显著差异,即时学习判断在预测回忆成绩时出现显著... 该研究通过自定步速的联结学习任务,考察在学习高频词对和低频词对时即时学习判断的绝对准确性,以及学习判断准确性与回忆成绩的相关。实验结果显示:(1)即时学习判断等级与回忆成绩存在显著差异,即时学习判断在预测回忆成绩时出现显著的高估;(2)词频对高估程度有显著影响,高频词对的高估程度大于低频词对;(3)不论是高频词对还是低频词对,学习判断准确性与回忆成绩都有高相关,验证了元记忆假设。 展开更多
关键词 学习判断 绝对准确性 词频
下载PDF
基于主题的Web文本聚类方法 被引量:3
4
作者 张万山 肖瑶 +1 位作者 梁俊杰 余敦辉 《计算机应用》 CSCD 北大核心 2014年第11期3144-3146,3151,共4页
针对传统Web文本聚类算法没有考虑Web文本主题信息导致对多主题Web文本聚类结果准确率不高的问题,提出基于主题的Web文本聚类方法。该方法通过主题提取、特征抽取、文本聚类三个步骤实现对多主题Web文本的聚类。相对于传统的Web文本聚... 针对传统Web文本聚类算法没有考虑Web文本主题信息导致对多主题Web文本聚类结果准确率不高的问题,提出基于主题的Web文本聚类方法。该方法通过主题提取、特征抽取、文本聚类三个步骤实现对多主题Web文本的聚类。相对于传统的Web文本聚类算法,所提方法充分考虑了Web文本的主题信息。实验结果表明,对多主题Web文本聚类,所提方法的准确率比基于K-means的文本聚类方法和基于《知网》的文本聚类方法要好。 展开更多
关键词 多主题 WEB文本 聚类 特征词 准确率
下载PDF
基于深度神经网络模型的中文分词方案 被引量:11
5
作者 许峰 张雪芬 忻展红 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2019年第9期1662-1666,共5页
针对目前已有的分词算法和程序在处理海量网络文本分词时性能下降的问题,本文提出了一种基于深度神经网络模型的中文分词方案。该方案利用基于长短期记忆网络的编码-解码模型对数据模型进行训练,并采用得到的模型进行分词。为了提升分... 针对目前已有的分词算法和程序在处理海量网络文本分词时性能下降的问题,本文提出了一种基于深度神经网络模型的中文分词方案。该方案利用基于长短期记忆网络的编码-解码模型对数据模型进行训练,并采用得到的模型进行分词。为了提升分词性能,进一步提出了一种基于词向量的修正方法,对采用上述模型的分词结果进行修正。对典型微博语料数据集的实验结果表明,提出基于模型的分词性能相对于传统的分词软件的分词性能有了较大提升。采用提出的词向量修正方法修正后的分词准确率和F值略优于未修正的分词准确率和F值,从而验证了论文提出的分词方案的有效性。 展开更多
关键词 中文分词 长短期记忆网络 编码-解码模型 词向量 准确率 F值
下载PDF
一种能改善DDS输出精度的技术 被引量:4
6
作者 屈八一 米婕 +3 位作者 陈瑞洁 董绍峰 陈晓龙 周渭 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2018年第3期58-62,共5页
为改善直接数字式频率合成技术中存在对频率控制字取整造成的实际输出频率和拟产生频率有微小差异的问题.文中对直接数字式频率合成器中的相位累加过程进行了控制,实现了一种可输出精确频率的直接数字式频率合成技术.利用实际输出频率... 为改善直接数字式频率合成技术中存在对频率控制字取整造成的实际输出频率和拟产生频率有微小差异的问题.文中对直接数字式频率合成器中的相位累加过程进行了控制,实现了一种可输出精确频率的直接数字式频率合成技术.利用实际输出频率和理论频率之间的相位差变化特性优化设计控制过程.实验结果表明该技术方案有效,能将直接数字式频率合成技术中尾数频率的影响减小至1/104,而控制过程对输出信号的相位噪声和频率稳定度等指标几乎无影响. 展开更多
关键词 直接数字式频率合成 频率精度 频率合成器 小数频率控制字
下载PDF
基于本体的旱区农业垂直搜索引擎研究 被引量:4
7
作者 王超 李书琴 肖红 《农机化研究》 北大核心 2013年第8期184-187,191,共5页
针对西北旱区农业发展落后、农业科技推广受限、农业信息检索准确度差等问题,在分析研究通用搜索引擎工作原理的基础上,设计并实现了基于本体的旱区农业垂直搜索引擎模型。采用面向文本的知识发现技术构建农业领域本体,实现基于本体的... 针对西北旱区农业发展落后、农业科技推广受限、农业信息检索准确度差等问题,在分析研究通用搜索引擎工作原理的基础上,设计并实现了基于本体的旱区农业垂直搜索引擎模型。采用面向文本的知识发现技术构建农业领域本体,实现基于本体的网络信息采集及过滤、查询扩展、结果排序和相关词推荐。试验证明,基于本体的旱区农业垂直搜索引擎可以提高农业信息检索的查准率,优化检索结果。 展开更多
关键词 旱区农业 搜索引擎 本体 查准率 查询扩展
下载PDF
世博会与公共艺术 被引量:1
8
作者 周进 张勇 《南京艺术学院学报(美术与设计)》 北大核心 2007年第3期44-46,共3页
本文梳理了历届世博会的公共艺术精华,认为世博会的公共艺术形成与发展经历了三个阶段:即从早期的艺术沙龙展览到后来的地标建筑与大型壁画艺术,最终形成独立的公共艺术主题展览。
关键词 世博会 公共艺术 艺术沙龙 地标建筑 主题公园
下载PDF
搜索引擎广告用户行为预测与特征分析 被引量:7
9
作者 王海雷 贺一骏 +1 位作者 俞学宁 张铭 《计算机应用研究》 CSCD 北大核心 2013年第5期1413-1418,共6页
介绍了搜索引擎广告系统的基本运作模式。通过对广告四元组的特征提取、特征值平滑等操作,将广告记录解析成为训练数据,并将数据分为训练集和测试集,使用支持向量机算法并利用训练集训练出的模型将测试集分类,从而预测出用户的行为。通... 介绍了搜索引擎广告系统的基本运作模式。通过对广告四元组的特征提取、特征值平滑等操作,将广告记录解析成为训练数据,并将数据分为训练集和测试集,使用支持向量机算法并利用训练集训练出的模型将测试集分类,从而预测出用户的行为。通过对特征的分析,得出对用户行为预测准确率影响最大的特征是点击率。实验证明,在使用该模型中所有特征的情况下,分类的准确率能够达到83.17%。 展开更多
关键词 搜索广告 支持向量机 点击率 准确率 广告质量特征 相似度特征
下载PDF
高分辨率卫星遥感影像姿态角系统误差检校 被引量:31
10
作者 袁修孝 余翔 《测绘学报》 EI CSCD 北大核心 2012年第3期385-392,共8页
简要介绍高分辨率卫星遥感影像的严格几何处理模型,提出较为严密的影像姿态角系统误差检校模型。通过对SPOT-5、CBERS-02B两种卫星遥感影像的试验证实模型的正确性和方法的有效性。对影像姿态角系统误差进行补偿后,可明显提高卫星遥感... 简要介绍高分辨率卫星遥感影像的严格几何处理模型,提出较为严密的影像姿态角系统误差检校模型。通过对SPOT-5、CBERS-02B两种卫星遥感影像的试验证实模型的正确性和方法的有效性。对影像姿态角系统误差进行补偿后,可明显提高卫星遥感影像对地目标定位的精度,且优于影像姿态角常差检校的效果,目标点平面定位精度达到了±(2~3)像素的水平。 展开更多
关键词 高分辨率卫星遥感影像 严格几何处理模型 姿态角系统误差检校 对地目标定位 精度
下载PDF
《左传》“君子曰”与儒家君子之学 被引量:10
11
作者 葛志毅 《河北学刊》 CSSCI 北大核心 2010年第6期27-33,共7页
受春秋时代理性主义思潮的影响,孔子提出了儒家的君子概念。《左传》"君子曰"系对所载人物史事所作的史论,《公羊》、《穀梁》二传则多假君子的名义作解经语。虽有如此不同,但它们同属儒家君子之学的内容。君子之学是对儒家... 受春秋时代理性主义思潮的影响,孔子提出了儒家的君子概念。《左传》"君子曰"系对所载人物史事所作的史论,《公羊》、《穀梁》二传则多假君子的名义作解经语。虽有如此不同,但它们同属儒家君子之学的内容。君子之学是对儒家伦理道德期望的集中概括。 展开更多
关键词 《左传》 君子曰 君子解经语 君子之学
下载PDF
《酉阳杂俎》语词训释 被引量:1
12
作者 刘传鸿 《南京师范大学文学院学报》 2002年第2期170-175,共6页
唐段成式《酉阳杂俎》中有些词语有较特殊的意义 ,它们或为一般辞书所未发 ,或虽有解释但可作适当的补充 ,本文即选择其中的 1
关键词 《酉阳杂俎》 语词 训诂 笔记小说
下载PDF
文献检索中提高查全率与查准率的方法探讨 被引量:26
13
作者 李育嫦 《图书馆学研究》 2002年第11期92-93,95,共3页
本文结合作者的文献检索工作实践,以中国期刊同专题全文数据库的检索为例,从选择主题词与配置合适的逻辑关系两方面探讨了提高文献检索查全率与查准率的方法。
关键词 查全率 查准率 文献检索 主题词 扩检 缩检 中国期刊网专题全文数据库
下载PDF
《酉阳杂俎》疑难词考释 被引量:1
14
作者 刘传鸿 《语言研究》 CSSCI 北大核心 2003年第3期88-89,共2页
本文对《酉阳杂俎》中的2个词语“羊”、“墨尿”进行了考释。
关键词 酉阳杂俎:疑难词 训释
下载PDF
《辞通》的历史贡献及其检讨 被引量:2
15
作者 杨文全 《四川师范学院学报(哲学社会科学版)》 2002年第4期1-8,共8页
《辞通》是一部类聚古代异文别体同义的双音词词典 ,全书收词近 4万条 ,连说解共约 30 0余万字 ,是我国 2 0世纪 30年代汉语辞书中少有的代表性著作之一 ,其收词、书证及诠释方法均颇具特色。本文从现代辞书史和学术史的角度对此作了全... 《辞通》是一部类聚古代异文别体同义的双音词词典 ,全书收词近 4万条 ,连说解共约 30 0余万字 ,是我国 2 0世纪 30年代汉语辞书中少有的代表性著作之一 ,其收词、书证及诠释方法均颇具特色。本文从现代辞书史和学术史的角度对此作了全面检讨 ,以期为当前语文性辞书的编纂提供某种借鉴和启示。 展开更多
关键词 收词范围 释词原则 书下特点 释义方法
下载PDF
基于查询模板的特定领域中文问答系统的研究与实现 被引量:3
16
作者 刘亮亮 林乐宇 《江苏科技大学学报(自然科学版)》 CAS 北大核心 2011年第2期163-168,共6页
随着网络信息的爆炸性增长,传统的搜索引擎已经不能满足人们的需求,从而促使对问答系统(Question AnsweringSystem,QAS)的研究.文中介绍了基于查询模板的问答系统框架结构,定义了关键词词典和查询模板的结构,并且介绍了基于关键词词典... 随着网络信息的爆炸性增长,传统的搜索引擎已经不能满足人们的需求,从而促使对问答系统(Question AnsweringSystem,QAS)的研究.文中介绍了基于查询模板的问答系统框架结构,定义了关键词词典和查询模板的结构,并且介绍了基于关键词词典的分词算法、查询模板存储结构以及模板匹配算法.在此基础上实现了基于铁路领域的问答系统,实验结果表明该系统具有很高的准确率和识别率. 展开更多
关键词 问答系统 查询模板 分词 句型解析树 模板匹配
下载PDF
试论说明文语言的准确性 被引量:1
17
作者 王元祥 《遵义师范学院学报》 2005年第4期24-26,共3页
语言的准确性是说明文教学的重要内容之一。说明文语言的准确性,体现在数据的使用、概念的限制、语序的安排和修辞的运用等方面。
关键词 说明语言的准确性 数据的使用 概念的限制 语序的安排 修辞的运用
下载PDF
智能答疑系统的研究与设计 被引量:3
18
作者 闫宏印 闫冬冬 《电脑开发与应用》 2010年第5期12-14,共3页
针对当前答疑系统存在的一些问题,提出了一种基于自然语言理解的实用智能答疑系统实现方案,分析与研究了该系统所涉及的关键技术,对中文分词词库作出了改进,设计关系词典开展了语义分析,采用改进的TF-IDF函数,提高了答疑系统的精确性和... 针对当前答疑系统存在的一些问题,提出了一种基于自然语言理解的实用智能答疑系统实现方案,分析与研究了该系统所涉及的关键技术,对中文分词词库作出了改进,设计关系词典开展了语义分析,采用改进的TF-IDF函数,提高了答疑系统的精确性和准确性。 展开更多
关键词 智能答疑 自然语言 分词 精确性
下载PDF
大学生英语写作中用词不当现象及对策 被引量:1
19
作者 侯杰 《沈阳工程学院学报(社会科学版)》 2012年第2期239-240,271,共3页
有些大学生英语词汇量不小,语法知识掌握得也较好,但是对在英语写作中如何贴切地用词仍感到很棘手,常常用词不当。这主要是因为在用词的准确性、简洁性和变化性等方面,汉语思维很大地影响了我国大学生的英语写作,对此应采取"三多&q... 有些大学生英语词汇量不小,语法知识掌握得也较好,但是对在英语写作中如何贴切地用词仍感到很棘手,常常用词不当。这主要是因为在用词的准确性、简洁性和变化性等方面,汉语思维很大地影响了我国大学生的英语写作,对此应采取"三多"的策略,即多读、多记、多写,以提高英语写作水平。 展开更多
关键词 英语写作 用词不当 准确性 简洁性 变化性
下载PDF
浅谈外交语言的准确性与模糊性 被引量:1
20
作者 祝爱华 《科技信息》 2010年第15X期217-217,181,共2页
外交语言是准确性与模糊性的统一体。既要求准确,多使用中性词,书面语,也崇尚模糊性,讲究委婉,留有回旋余地,有时为了政治立场的需要还会偷换概念,此外外交语言还具有笼统性。
关键词 准确性 中性词 书面词 模糊性
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部