期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于词-主题-文本异质网络的短文本分类方法
1
作者 徐涛 赵星甲 卢敏 《计算机应用与软件》 北大核心 2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学... 针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。 展开更多
关键词 -主题-文本异质网络 共现 文本-主题分布 文本分类
下载PDF
基于语料库的大学生英语写作中的文本导向词块研究
2
作者 吕茂丽 魏晓莲 《英语广场(学术研究)》 2023年第26期58-62,共5页
为探究大学生在英语写作中所使用文本导向词块的特征,本文借助中国学生万篇英语作文语料库(TECCL)和语料分析工具AntConc4.1.2对6869篇大学生英语作文进行统计,聚焦分析其中四词和五词文本导向词块的结构特征和功能特征。结果发现,在结... 为探究大学生在英语写作中所使用文本导向词块的特征,本文借助中国学生万篇英语作文语料库(TECCL)和语料分析工具AntConc4.1.2对6869篇大学生英语作文进行统计,聚焦分析其中四词和五词文本导向词块的结构特征和功能特征。结果发现,在结构特征上,介词结构是使用频率最高的结构类型,而名词结构和动词结构明显使用频率不高,且文本导向词块的使用表现出核心词匮乏的情况;在功能特征上,文本导向词块实施了附加、因果和引用等语篇功能和逻辑关系,但存在误用、文本衔接不紧密和连贯性不足等问题。此结果产生的原因一方面是大学生对特定词块的过度依赖,另一方面是大学生对文本导向词块功能和用法掌握不当。此研究对大学英语学习者和英语写作教学有一定的启示意义。 展开更多
关键词 文本导向 大学生英语写作 语料库
下载PDF
信天游词文本中的重复手法研究 被引量:1
3
作者 惠嘉 《青海社会科学》 CSSCI 2012年第2期167-171,共5页
重复是信天游和小调这两种陕北民歌体裁都极为常用的表现手法,也在一定程度上使两种体裁的边界更加模糊。重复根据单位的不同可以区分为复辞和反复,前者以字、词为重复单位,后者以章句为重复单位。而信天游词文本中对前者的倾向和对后... 重复是信天游和小调这两种陕北民歌体裁都极为常用的表现手法,也在一定程度上使两种体裁的边界更加模糊。重复根据单位的不同可以区分为复辞和反复,前者以字、词为重复单位,后者以章句为重复单位。而信天游词文本中对前者的倾向和对后者的缺失,则呈现出其非叙事性这一不同于小调的体裁特征。 展开更多
关键词 信天游文本 小调文本 重复 体裁特征
下载PDF
侗族款词文本与语境
4
作者 朱汶苑 张琪亚 《教育文化论坛》 2018年第2期100-105,共6页
文化语境是款词文本形成的关键,而每一个款词文本都是其它款词文本的镜子,每一款词文本都是对其它款词文本的吸收与转化。文章论述款词文本的形式演变、款词文本的互文性以及在文本的不同生存语境中分析款词文本的形成、审美价值和文化... 文化语境是款词文本形成的关键,而每一个款词文本都是其它款词文本的镜子,每一款词文本都是对其它款词文本的吸收与转化。文章论述款词文本的形式演变、款词文本的互文性以及在文本的不同生存语境中分析款词文本的形成、审美价值和文化价值。 展开更多
关键词 侗款 文本 语境
下载PDF
苏轼情绪转化策略的质性文本分析--基于苏轼词情绪文本数据的研究
5
作者 陈金美 《温州职业技术学院学报》 2022年第3期87-92,共6页
从词汇的角度,结合情感词典对苏轼词中的情绪词文本展开质性文本分析。经过多次编码、分析发现:苏轼在其词作中表达的情绪感受是丰富多样且频繁的,消极负向情绪较积极正向的多,运用的情绪转化策略包括认知重评、允许接受、注意转移、人... 从词汇的角度,结合情感词典对苏轼词中的情绪词文本展开质性文本分析。经过多次编码、分析发现:苏轼在其词作中表达的情绪感受是丰富多样且频繁的,消极负向情绪较积极正向的多,运用的情绪转化策略包括认知重评、允许接受、注意转移、人际支持、情境选择、表达抑制、着眼未来、学道修禅、对比凸显九种,较多使用允许接受、转移注意、认知重评、人际支持四种转化策略来调节消极情绪感受。 展开更多
关键词 苏轼 情绪文本 质性文本分析 情绪感受 转化策略
下载PDF
PubMed主题词检索与自由词检索的检索效率比较研究 被引量:13
6
作者 胡德华 梁丽明 《情报科学》 CSSCI 北大核心 2006年第5期717-721,共5页
PubMed检索系统是由美国NCBI研制推出的免费医学文献检索系统,由于其资源权威而丰富,检索功能强大,界面友好,一直以来,都是很多医学工作者查找文献必选的检索系统。PubMed提供了多种检索方法,因此对这些检索方法进行比较,对于提高用户... PubMed检索系统是由美国NCBI研制推出的免费医学文献检索系统,由于其资源权威而丰富,检索功能强大,界面友好,一直以来,都是很多医学工作者查找文献必选的检索系统。PubMed提供了多种检索方法,因此对这些检索方法进行比较,对于提高用户的检索效率是十分必要的。本文通过对PubMed检索系统所提供的主题词检索、自由词检索这两种用户常用的检索方式进行选词测试,比较它们的检索效率,从而了解这两种检索方法的特点,并为用户进行检索提供建议。 展开更多
关键词 PUBMED 主题 文本词 自由
下载PDF
功能翻译论视角下的文博翻译策略及方法探究——以贵州省博物馆基本陈列“多彩贵州”解说词为例
7
作者 陈红新 《贵博论丛》 2023年第1期299-309,共11页
贵州省博物馆的英文讲解旨在为公众提供贵州历史民族文化知识、传播中华文化、进行文化交流,是贵州对外宣传文化的重要组成部分。英文讲解词文本翻译应当避免复杂的词汇,更加注重功能和社会文化因素,注意结合减译、增译、音译加注法等方... 贵州省博物馆的英文讲解旨在为公众提供贵州历史民族文化知识、传播中华文化、进行文化交流,是贵州对外宣传文化的重要组成部分。英文讲解词文本翻译应当避免复杂的词汇,更加注重功能和社会文化因素,注意结合减译、增译、音译加注法等方法,在连贯性原则的基础上,保持讲解词文本的翻译具有可读性。翻译者需要根据文本的具体情况选择翻译策略和方法,实现传播贵州文化的目的。 展开更多
关键词 功能翻译理论 讲解文本翻译 贵州省博物馆 翻译策略和方法
下载PDF
戈夫曼词现过渡与自动标引
8
作者 王知津 《现代图书情报技术》 1983年第2期32-34,共3页
关键词 戈夫曼 自动标引 文本词 人工标引 高频 过渡点 人工智力 频分布 低频
下载PDF
电子词典的现状与发展趋势 被引量:10
9
作者 章宜华 黄建华 《辞书研究》 CSSCI 北大核心 1996年第6期67-82,共16页
电子词典的现状与发展趋势章宜华,黄建华电子词典的提出始于本世纪40年代末期美国人对机器翻译的研究,在50─60年代中期曾引起人们的高度重视,但后来由于种种原因一直停滞不前。进入80年代后,电子词典进入了活跃期。随着P... 电子词典的现状与发展趋势章宜华,黄建华电子词典的提出始于本世纪40年代末期美国人对机器翻译的研究,在50─60年代中期曾引起人们的高度重视,但后来由于种种原因一直停滞不前。进入80年代后,电子词典进入了活跃期。随着PC机的普及,特别是近几年来CD─R... 展开更多
关键词 电子 现状与发展 英汉 显示窗 句型结构 计算机 多媒体技术 检索入口 文本词 同义
下载PDF
面向手语信息处理的维吾尔文本采集的研究 被引量:1
10
作者 艾山江·亚生 阿里甫·库尔班 张丹丹 《现代电子技术》 北大核心 2019年第12期136-139,143,共5页
从自然语言处理以及深度学习的基本理念、原则出发,为基于中国手语的维吾尔文本信息处理研究提供数据资源,为面向手语信息的手语合成研究,为手语新闻文本编辑研究提供科学依据,对维吾尔文本进行自动分词、自动分句研究,并利用Word2Vec... 从自然语言处理以及深度学习的基本理念、原则出发,为基于中国手语的维吾尔文本信息处理研究提供数据资源,为面向手语信息的手语合成研究,为手语新闻文本编辑研究提供科学依据,对维吾尔文本进行自动分词、自动分句研究,并利用Word2Vec方法进一步建立文本词元库,通过这样保证训练语料的多元化及通用性。最后,利用词干提取方法以及分割字母的方式将维吾尔文本信息转换成手语文本信息,并在此基础上初步采集面向手语信息处理的维吾尔文本信息。实验表明该研究达到了预期目标。 展开更多
关键词 深度学习 Word2Vec方法 手语合成 文本词元库 干提取 字母分割
下载PDF
歧义切分与专有名词识别软件 被引量:4
11
作者 刘开瑛 《语言文字应用》 CSSCI 北大核心 2001年第3期9-15,共7页
关键词 中文文本自动切 中文信息处理 理论意义 应用价值 歧义字段切分 专有名识别 识别软件 汉语
下载PDF
双语词典中本词与释义的文体色彩对应问题
12
作者 张锦文 《肇庆学院学报》 1996年第2期15-15,共1页
本文所谓双语词典中本词(词目)与释义的文体色彩对应问题,是指英汉双语词典在把具有修辞色彩的方言、口语、俚语、轻蔑语等英文本词(词目)及其短语或例句译为汉语时,通常出现的只顾及表达原文基本意思,而未顾及(有时候甚至忽路了)原文... 本文所谓双语词典中本词(词目)与释义的文体色彩对应问题,是指英汉双语词典在把具有修辞色彩的方言、口语、俚语、轻蔑语等英文本词(词目)及其短语或例句译为汉语时,通常出现的只顾及表达原文基本意思,而未顾及(有时候甚至忽路了)原文与译文之间的文体色彩对应的现象。 展开更多
关键词 文体色彩 英汉双语 释义 对应问题 《现代汉语典》 译文 修辞色彩 文本词 典编纂 牛津大学出版社
下载PDF
高职高专英语教材中词汇编排的特殊要求
13
作者 张静 《太原大学学报》 2010年第4期97-100,共4页
高职高专英语教材中,教学词汇的选择、练习的编排有别于本科英语教材的价值判断和心理活动。目前高职高专英语教材在词汇编写方面没有充分考虑高职高专学生和本科学生英语词汇认知方面的差异,更缺乏对此类教材词汇编写的特殊性的认识。... 高职高专英语教材中,教学词汇的选择、练习的编排有别于本科英语教材的价值判断和心理活动。目前高职高专英语教材在词汇编写方面没有充分考虑高职高专学生和本科学生英语词汇认知方面的差异,更缺乏对此类教材词汇编写的特殊性的认识。高职英语教材中词汇的编写应以心理语言学和语义学等理论为指导,以学生外语学习的心理认知规律为基础,在客观地对学生的词汇认知障碍进行评估后,再进行科学的词汇选取和编排。 展开更多
关键词 汇表 心理 汇复现率 的超文本特征
下载PDF
基于词袋模型与几何不变特征的笔迹鉴别 被引量:1
14
作者 李新德 阿依夏木·力提甫 +1 位作者 杨天 熊闻心 《计算机应用与软件》 北大核心 2022年第7期154-158,180,共6页
针对手写笔迹的高度相似性与随机性提出一种利用几何矩定量表示字符形状特征的笔迹鉴别方法。该算法先搭建文本依存的词袋模型,提取几何矩的八个不变特征。在分类决策层利用因子分离与特征融合方法,实现文本独立的笔迹分类。该算法在IA... 针对手写笔迹的高度相似性与随机性提出一种利用几何矩定量表示字符形状特征的笔迹鉴别方法。该算法先搭建文本依存的词袋模型,提取几何矩的八个不变特征。在分类决策层利用因子分离与特征融合方法,实现文本独立的笔迹分类。该算法在IAM数据集中的首选(Top-1)鉴别率已达到96.7%,取得了同类研究中前四的成绩。实验结果表明,基于词袋模型和矩特征的笔迹鉴别方法在维吾尔文以及英文数据集上具有较好的分类与鉴别能力。 展开更多
关键词 笔迹鉴别 文本 独立特征 融合矩特征
下载PDF
基于反馈式文本分类技术自动识别项目标签
15
作者 谢波 何凤 《现代信息科技》 2021年第17期100-102,106,共4页
为对广东省投资项目在线审批监管平台积累的近40万个固定资产投资项目的产业类别进行分类,利于政府内部统计管理。在专家识别的人工打标签的方法基础上,进一步采用了线性支持向量机等分类算法,并基于反馈式文本分类机器学习原理再次识... 为对广东省投资项目在线审批监管平台积累的近40万个固定资产投资项目的产业类别进行分类,利于政府内部统计管理。在专家识别的人工打标签的方法基础上,进一步采用了线性支持向量机等分类算法,并基于反馈式文本分类机器学习原理再次识别了所有项目的标签类别,项目标签分类准确率由82%提升到91%。结果表明,反馈式文本分类技术,显著提高了项目分类的准确性。 展开更多
关键词 项目标签 文本分类、向量 分类器 线性支持向量机 反馈学习
下载PDF
语境参数视角下主题词范畴的翻译机制——以莫言代表作《生死疲劳》的主题词“死”为例 被引量:2
16
作者 张伟华 《外国语文》 北大核心 2015年第6期127-133,共7页
范畴分为三类:典型范畴概念、域内范畴概念和跨域范畴概念。通过分析《生死疲劳》中523个主题词"死"的英译,结果发现在语境参数因子的参照下,49.2%的主题词"死"被译为典型范畴概念,译者采用直译、替代和少数修辞的... 范畴分为三类:典型范畴概念、域内范畴概念和跨域范畴概念。通过分析《生死疲劳》中523个主题词"死"的英译,结果发现在语境参数因子的参照下,49.2%的主题词"死"被译为典型范畴概念,译者采用直译、替代和少数修辞的翻译策略;5.7%的主题词"死"被译为域内范畴概念,译者采用语义转换的翻译策略;34.4%的主题词"死"被译为跨域范畴概念,译者考虑到文化、语体风格、认知模式、西方受众心理等因素,采用了元韵、婉言、转喻、潜喻、拟人、省略、反译、归化、词类转换等各种各样的修辞手法和翻译策略,以提升译文的可读性和欣赏价值;另有10.7%的主题词"死"被整段删除。 展开更多
关键词 和主题密切相关.“主题”也叫关键 指的是与某一标准(参照语料库)相比 在一定文本中出现频率显著偏高的 偏高的程度即该主题的“关键性”(王华、甄凤超 2007).它是能代表作品内容特征 并对反映主题思想起关键作用的.《生死疲劳》运用魔幻现实主义的手法 通过各种动物的生死轮回来反映农村的变革 微观范畴概念“死”是不可或缺的主题之一.根据Antconc软件统计 在这部38万余字的长篇小说中 “死”共计出现523次.在21万余的葛浩文译本Life And 主题 范畴 语境参数 修辞 翻译
下载PDF
基于二进制烟花算法的特征选择方法 被引量:5
17
作者 路永和 陈泳珊 《情报学报》 CSSCI CSCD 北大核心 2017年第3期249-259,共11页
文本分类中的特征选择方法对分类性能有重要的影响。烟花算法是一种解决优化问题的群体智能优化方法,而特征选择的本质是离散空间的优化组合问题。本文采用二进制编码方式,将烟花算法应用到特征选择上,通过改进二进制烟花算法及其参数设... 文本分类中的特征选择方法对分类性能有重要的影响。烟花算法是一种解决优化问题的群体智能优化方法,而特征选择的本质是离散空间的优化组合问题。本文采用二进制编码方式,将烟花算法应用到特征选择上,通过改进二进制烟花算法及其参数设置,从而达到提高分类性能的目的。实验数据使用中英文两种语料库,其中英文数据使用路透社的21578经典文本分类语料库(Reuters21578)的R8单标签语料集;中文数据使用复旦语料库,每种语料库随机抽取训练文本和测试文本各为1800篇。分别使用KNN、SVM分类器在预选维数为300维、600维、900维、1200维、2000维、3000维、4000维、5000维、10000维中进行实验。结果表明:采用二进制烟花算法对特征词选择进行优化后,其效果优于传统的特征选择方法,且具有良好的稳定性。 展开更多
关键词 文本分类 特征选择 二进制烟花算法 信息增益 卡方统计量
下载PDF
基于R平台的体检数据分析研究 被引量:3
18
作者 熊辉 何振峰 《福建电脑》 2017年第11期73-75,共3页
随着大数据时代的到来,对各类数据的分析研究显得尤为重要。文中首先对R平台shiny包的ui端及server端的数据传递方式进行了简要的介绍,并描述数据的采集及预处理思路及过程。然后在R平台结合shiny包使用机器学习算法对数据建立交互式模... 随着大数据时代的到来,对各类数据的分析研究显得尤为重要。文中首先对R平台shiny包的ui端及server端的数据传递方式进行了简要的介绍,并描述数据的采集及预处理思路及过程。然后在R平台结合shiny包使用机器学习算法对数据建立交互式模型,可视化分析结果,并使用文本词云算法对数据进行分析,得到数据整体特性并进行直观的图形展示。 展开更多
关键词 数据预处理 机器学习算法 数据建模 文本词
下载PDF
语义互联网时代迫切需要汉语的词式文本 被引量:3
19
作者 彭泽润 陆丙甫 黄昌宁 《中国语文》 CSSCI 北大核心 2014年第5期467-478,480,共12页
语义互联网时代很快到来,汉语网络信息传播迫切需要现代化的文本,汉语应该做好词式文本改革准备。词式文本再现了口语的词界信息,有利于汉语使用者强化词意识,有利于汉语理解,特别是信息处理的效率。用词式文本取代字式文本是人类书面... 语义互联网时代很快到来,汉语网络信息传播迫切需要现代化的文本,汉语应该做好词式文本改革准备。词式文本再现了口语的词界信息,有利于汉语使用者强化词意识,有利于汉语理解,特别是信息处理的效率。用词式文本取代字式文本是人类书面语的共同趋势。应该从语言学理论对字和词的普遍认识高度来看待人类普遍使用的词式文本。从网络汉语输入的实践来看,汉语已经具备实行词式文本的条件。 展开更多
关键词 语义互联网 界信息 文本 书写
原文传递
提高MEDLINE数据库检索效率的技术方法 被引量:1
20
作者 郑静 《医学情报工作》 2002年第3期149-150,共2页
通过用MeSH树状结构表、文本词(自由词)、主题词、缩略语、同义词、截词法、索引以及限定某个字段等在MEDLINE中检索,进行综合对比、分析,提出如何提高检索效率。
关键词 MEDLINE 检索方法 检索效率 Mesh树状结构表 文本词 主题 查全率 查准率
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部