题名 基于词语关联的文本特征词提取方法
被引量:10
1
作者
廖浩
李志蜀
王秋野
张意
机构
四川大学计算机学院
出处
《计算机应用》
CSCD
北大核心
2007年第12期3009-3012,共4页
文摘
文本的特征描述是文本自动处理的基础工作之一,目前的文本特征描述一般采用加权VSM模型,该模型大都使用统计的和经验的加权算法,文本每一维特征的权重就是其TFIDF值,这种方法难以突出对文本内容起到关键性作用的特征,而且不能很好地揭示文本中词与词的关系。针对此缺点,提出了一种新的基于关键词语和词语共现频率的特征选择和权重计算方法。该方法在TF-IDF方法的基础上利用了文本的结构信息,同时运用互信息理论提取出对文本内容起到关键性作用的词语;权重计算则综合了词语位置、词语关系和词语频率等信息,突出了文本中关键词语的贡献,弥补了单纯使用TF-IDF权重函数进行计算的一些缺陷,并使文本的特征向量蕴涵了词与词的相关信息。通过采用KNN分类器进行实验,结果显示该方法比传统TF-IDF方法的平均分类准确率有明显提高。
关键词
词语关联
词共现率
向量空间模型
特征提取
权重计算
Keywords
word relationship
word co-occurrence
Vector Space Model (VSM)
feature selection
term weighting
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 词共现分析在构建概念空间中的应用研究综述
被引量:3
2
作者
冀玉静
李军莲
李芳
机构
中国医学科学院医学信息研究所
出处
《医学信息学杂志》
CAS
2010年第10期49-52,共4页
基金
中国医学科学院医学信息研究所/图书馆基本科研业务费专项课题"基于词共现的可视化中文医学概念空间研究"(项目编号:08R0125)
文摘
利用共现分析构建概念空间,实现语义检索,是当前信息组织和检索领域研究热点之一。阐明概念空间的定义、意义、应用及构建方法,介绍词共现分析技术的内涵、应用前提、演进历程、步骤与方法,从多个角度系统综述词共现分析在构建概念空间、本体、揭示语义关系等方面的应用状况,为构建基于概念空间的信息检索可视化系统研究奠定基础。
关键词
词共现分析
概念空间
本体
语义关系
Keywords
Co - word analysis
Concept space
Ontology
Semantic relationship
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 《周礼·考工记》时空词语关系
3
作者
李亚明
机构
中国广播电视出版社
出处
《重庆文理学院学报(社会科学版)》
2007年第4期71-75,共5页
文摘
在整理《考工记》时间和空间词语的基础上,根据中国传统训诂学的训诂原理、语义观念以及词汇语义学原理,运用义素二分法(Dichotomy of Sememe)①,类聚、梳理并分析《考工记》时间和空间词语的相容、相入和相距关系,提出《考工记》各种时空词语之间有序地联系在一起,形成一种多层、多向、往复不断的网络,体现了事物联系的普遍性。
关键词
考工记
时间
空间
词语关系
Keywords
Kao gong ji(The Artificers' Record)
time
space
word 's relationship
分类号
H131
[语言文字—汉语]
题名 《周礼·考工记》时空词语关系
4
作者
李亚明
机构
中国广播电视出版社总编室
出处
《红河学院学报》
2007年第6期110-114,120,共6页
文摘
《周礼.考工记》是迄今所见中国最早的手工业技术文献,所记工艺分六类三十个工种,包括攻木之工、攻金之工、攻皮之工、设色之工、刮摩之工、抟埴之工等,分别记述木工、金工、皮革、染色、制陶和城市规划等内容。《考工记》各种时空词语之间有序地联系在一起,形成一种多层、多向、往复不断的网络,体现了事物联系的普遍性。
关键词
号工记
时间
空间
词语关系
Keywords
Kaogongji (The Artificers' Record)
time
space
word ' s relationship
分类号
H03
[语言文字—语言学]
题名 一种结合关键词与共现词对的向量空间模型
被引量:4
5
作者
唐守忠
齐建东
机构
北京林业大学信息学院
出处
《计算机工程与科学》
CSCD
北大核心
2014年第5期971-976,共6页
基金
十二五科技支撑课题(2011BAH10B04)
文摘
提出了一种结合关键词特征和共现词对特征的向量空间模型。首先,通过分词和去除停用词提取文本中的候选关键词,利用文本频率筛选关键词特征。然后,基于获得的关键词特征两两构造候选共现词对,定义支持度和置信度筛选共现词对特征。最后,结合关键词特征和共现词对特征构建向量空间模型。文本分类实验结果表明,提出的模型具有更强的文本分类能力。
关键词
向量空间模型
共现词对
语义相关性
文本分类
Keywords
vector space model
co-occurrence word
semantical relationship
text classification
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 论越剧创腔中的句式变化法
被引量:1
6
作者
金钦夫
机构
常山县文化局
出处
《文化艺术研究》
2010年第2期100-119,共20页
文摘
越剧创腔,不像歌曲写作那样,常以歌曲主题发展的手法,发展旋律,布局结构,塑造音乐形象,达到歌曲要表现的情感和形象;越剧创腔,它是通过越剧基腔的句式变化,遵循基腔上下句旋律、落音、字位、调式万变不离其宗的前提下,受角色情感的冲击,通过演唱语音润色、夸张,迫使基腔的旋律、落音、节奏、板式的发展变化创新。越剧创腔中的句式变化法,是越剧唱腔写作中的基本大法。越剧流派唱腔的产生,都是当年的越剧名角,掌握运用了创腔的句式变化,经上百部剧目演出实践的积累,在琴师或作曲的帮助下,创造了越剧一代风华流派唱腔经典流传至今。文中的创腔句式变化法,都是从越剧流派唱腔和越剧作曲家创作成果中总结概括出来的越剧创腔句式变化法。
关键词
越剧
句式变化
化法
流派唱腔
旋律
歌曲写作
作曲家
主题发展
音乐形象
情感
创作成果
布局结构
上下句
总结
语音
演出
演唱
塑造
手法
实践
Keywords
singing and tune of Yue Opera
relationship between tune and word spacing
change of sentence patterns in music composition for Yue Opera
分类号
J8
[艺术—戏剧戏曲]
题名 语言音乐学研究的回顾与思考
被引量:1
7
作者
肖志丹
机构
湖南师范大学
湖南女子学院
出处
《中国音乐》
北大核心
2023年第5期189-199,共11页
基金
2020年度国家社科基金冷门绝学研究专项学者个人项目“中国与东南亚瑶族《盘王大歌》系列传世唱本整理与研究”(项目编号:20VJXG022)的阶段成果
2023年度湖南省社会科学成果评审委员会课题《跨学科视域中湘南过山瑶民歌的语言音乐学研究》(课题编号:XSP2023YSC049)的阶段成果。
文摘
语言音乐学是跨涉于语言学与音乐学两个领域之间,讨论语言与音乐两种文化符号之相似性、差异性以及互生关系的分支学科,兼及声学、心理学、音乐治疗、音乐科技、音乐社会学等领域的关联探讨。国外语言与音乐关系研究强调成果的科学性、实用性和功能性的整合,国内语言音乐学研究注重多种路径和研究模式的实践探索。但语言音乐学作为一门新兴学科,当下还需从研究的族群对象、类型属性、文化层级、方法手段及功能回馈上不断拓展深耕,即多关注少数民族声乐类型及当代音乐的研究范畴,以科学与人文接通的思维,从表层的形态分析拓展至深层的社会文化语境的思考,并将研究成果回馈于教育实践与社会应用。
关键词
语言音乐学
语言与音乐
腔词关系
跨学科
Keywords
Linguistic-musicology
Language and Music
The relationship between tune and word
Interdisciplinary
分类号
J60-05
[艺术—音乐]
题名 基于句中词语间关系的文本向量化算法
被引量:4
8
作者
许阳
刘功申
孟魁
机构
上海交通大学信息安全工程学院
出处
《信息安全与通信保密》
2014年第4期84-88,共5页
基金
国家自然科学基金资助项目(批准号:61272441
61171173)
文摘
文本向量化是将文本转化为向量的代数模型建立过程,在文本处理领域具有重要的应用价值,是文本数据挖掘算法的关键环节。在著名的PageRank算法基础上,提出一种基于句中词语间关系的文本向量化算法。通过引入语义层面的词语关联来克服传统的基于词频统计数据的向量化方法语义敏感度不佳的缺陷。在不同的语料测试集上的实验表明,基于句中词语间关系的文本向量化算法有更高的准确率。
关键词
向量模型
文本表示
PAGERANK
词语关系
Keywords
vector space model
text representation
PageRank
word relationship
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]