期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
崔骃四考 被引量:3
1
作者 林家骊 孙宝 《浙江大学学报(人文社会科学版)》 CSSCI 北大核心 2013年第6期141-154,共14页
崔骃生平与作品作年至少还存在四方面问题可进一步考订清楚:其一,崔骃在太学时期与班固有同学之谊的可能不大,傅毅与班固非同学之谊而是师生之谊;其二,崔骃在太学时期所作《明帝颂》、《冬至袜铭》、《缝铭》、《樽铭》、《达旨》等作... 崔骃生平与作品作年至少还存在四方面问题可进一步考订清楚:其一,崔骃在太学时期与班固有同学之谊的可能不大,傅毅与班固非同学之谊而是师生之谊;其二,崔骃在太学时期所作《明帝颂》、《冬至袜铭》、《缝铭》、《樽铭》、《达旨》等作品的作年大致可以确定;其三,崔骃《北征颂》存在别称的可能,或为《武都赋》,或为《武赋》;其四,崔骃《四巡颂》具有弥补《后汉书》相关记载不完备的史料价值,尤其是《西巡颂》详细描述了汉章帝西巡的过程,可补史阙,《东巡颂》对于祭祀屈原的记载也丰富了汉代楚辞学史的内容。 展开更多
关键词 崔骃 班固 《文馆词林》 《北征颂》 《四巡颂》
下载PDF
基于知网与词林的词语语义相似度计算 被引量:63
2
作者 朱新华 马润聪 +1 位作者 孙柳 陈宏朝 《中文信息学报》 CSCD 北大核心 2016年第4期29-36,共8页
该文提出了一种综合知网与同义词词林的词语语义相似度计算方法。知网部分根据义原层次结构的特征,采用了顶部平缓而底部陡峭的曲线单调递减的边权重策略,改进了现有的义原相似度算法;词林部分采用以词语距离为主要因素、分支节点数和... 该文提出了一种综合知网与同义词词林的词语语义相似度计算方法。知网部分根据义原层次结构的特征,采用了顶部平缓而底部陡峭的曲线单调递减的边权重策略,改进了现有的义原相似度算法;词林部分采用以词语距离为主要因素、分支节点数和分支间隔为微调节参数的方法,改进了现有的词林词语相似度算法。然后再根据词语的分布情况,采用综合考虑知网与同义词林的动态加权策略计算出最终的词语语义相似度。该方法充分利用了词语在知网与词林中的语义信息,极大地扩充了可计算词语的范围,同时也提高了词语相似度计算的准确率。 展开更多
关键词 语义相似度 知网 同义词词林 语义距离
下载PDF
知网与同义词词林的信息融合研究 被引量:28
3
作者 梅立军 周强 +1 位作者 臧路 陈祖舜 《中文信息学报》 CSCD 北大核心 2005年第1期63-70,共8页
本文主要探讨了将知网 (HowNet)和同义词词林进行信息融合的方法。我们针对知网对词的概念描述和同义词词林对词的语义分类的特点 ,提出了一种词典信息融合的方法 :首先为词林的每个词集确定一个与知网中DEF类似的概念描述 ,在此基础上... 本文主要探讨了将知网 (HowNet)和同义词词林进行信息融合的方法。我们针对知网对词的概念描述和同义词词林对词的语义分类的特点 ,提出了一种词典信息融合的方法 :首先为词林的每个词集确定一个与知网中DEF类似的概念描述 ,在此基础上对两部词典中同时收录且均只有一个义项的词语进行双向意义联结 ,最后根据分类算法对两部词典中同时收录非单一义项的词语进行双向意义联结。实验表明 ,本文提出的处理策略达到了 93%的信息融合正确率 ,融合后形成的新词典兼有词林的分类学信息和知网的概念描述信息。 展开更多
关键词 计算机应用 中文信息处理 词典信息融合 知网 同义词词林 分类
下载PDF
《同义词词林》在中文实体关系抽取中的作用 被引量:25
4
作者 刘丹丹 彭成 +1 位作者 钱龙华 周国栋 《中文信息学报》 CSCD 北大核心 2014年第2期91-99,共9页
语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的中文语义关系抽取的有效性,深入探讨了不同级别的语义信息和一词多义等现象对关系抽取的影响,详细分析了... 语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的中文语义关系抽取的有效性,深入探讨了不同级别的语义信息和一词多义等现象对关系抽取的影响,详细分析了词汇语义信息和实体类型信息之间的冗余性。在ACE2005中文语料库上的关系抽取实验表明,在未知实体类型的前提下,语义信息能显著提高抽取性能;而在已知实体类型的情况下,语义信息也能明显提高某些关系类型的抽取性能,这说明《词林》语义信息和实体类型信息在中文语义关系抽取中具有一定的互补性。 展开更多
关键词 中文实体关系抽取 树核函数 同义词词林 语义信息
下载PDF
网络评论倾向性分析 被引量:13
5
作者 丁建立 慈祥 黄剑雄 《计算机应用》 CSCD 北大核心 2010年第11期2937-2940,共4页
Web2.0的兴起使得包括新闻评论、产品评论在内的各种网络评论大量涌现,针对评论信息的监管和利用中的问题多种多样,重点研究其中的网络评论倾向性分析。以知网为基本的语义字典,提出一种改进的词汇相似度计算方法,在此基础上融合同义词... Web2.0的兴起使得包括新闻评论、产品评论在内的各种网络评论大量涌现,针对评论信息的监管和利用中的问题多种多样,重点研究其中的网络评论倾向性分析。以知网为基本的语义字典,提出一种改进的词汇相似度计算方法,在此基础上融合同义词词林对词汇的倾向性计算做出改进,进而利用相关语言学知识实现了从细粒度的词汇到粗粒度的评论的倾向性判断。实验表明,该方法对于真实网络环境下的网络评论倾向性分析具有较高的准确率。 展开更多
关键词 知网 同义词词林 网络评论 倾向性分析
下载PDF
基于同义词词林的中文文本主题词提取 被引量:11
6
作者 程涛 施水才 +1 位作者 王霞 吕学强 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期145-148,共4页
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下... 中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下位词的出现对于词语权重的影响。实验表明。 展开更多
关键词 主题词提取 同义词词林 权值 同义词
下载PDF
基于同义词词林的词语相似度计算方法 被引量:177
7
作者 田久乐 赵蔚 《吉林大学学报(信息科学版)》 CAS 2010年第6期602-608,共7页
为解决词语相在语义网自适应学习系统中相似度计算不清的问题,以同义词词林为基础,提出并实现了一种基于同义词词林的词语相似度计算方法,充分分析并利用了同义词词林的编码及结构特点。该算法同时考虑了词语的相似性,和词语的相关性。... 为解决词语相在语义网自适应学习系统中相似度计算不清的问题,以同义词词林为基础,提出并实现了一种基于同义词词林的词语相似度计算方法,充分分析并利用了同义词词林的编码及结构特点。该算法同时考虑了词语的相似性,和词语的相关性。进行人工测试,替换测试以及与当前流行的基于"知网"的词语相似度算法对比测试的结果表明,该算法与人们思维中的相似度值基本一致,有较高的准确性。 展开更多
关键词 词语相似度 同义词词林 自适应学习系统
下载PDF
基于路径与深度的同义词词林词语相似度计算 被引量:28
8
作者 陈宏朝 李飞 +1 位作者 朱新华 马润聪 《中文信息学报》 CSCD 北大核心 2016年第5期80-88,共9页
该文提出了一种基于路径与深度的同义词词林词语语义相似度计算方法。该方法通过两个词语义项之间的最短路径以及它们的最近公共父结点在层次树中的深度计算出两个词语义项的相似度。在处理两个词语义项的最短路径与其最近公共父结点的... 该文提出了一种基于路径与深度的同义词词林词语语义相似度计算方法。该方法通过两个词语义项之间的最短路径以及它们的最近公共父结点在层次树中的深度计算出两个词语义项的相似度。在处理两个词语义项的最短路径与其最近公共父结点的深度时,为提高路径与深度计算的合理性,为分类树中不同层之间的边赋予不同的权值,同时通过两个义项在其最近公共父结点中的分支间距动态调节词语义项间的最短路径,从而平衡两个词语的相似度。该方法修正了目前相关算法只能得出几个固定的相似度值,所有最近公共父结点处于同一层次的义项对之间的相似度都相同的不合理现象,使词语语义相似度的计算结果更为合理。实验表明,该方法对MC30词对的相似度计算值与人工判定值相比,取得了0.856的皮尔逊相关系数,该结果高于目前大多数词语相似度算法与MC30的相关度。 展开更多
关键词 同义词词林 路径 深度 分支间距 最近公共父结点
下载PDF
实体词语义信息对中文实体关系抽取的作用研究 被引量:7
9
作者 段利国 徐庆 +1 位作者 李爱萍 崔敏君 《计算机应用研究》 CSCD 北大核心 2017年第1期141-146,共6页
为了探索从外部词典提取的实体词语义信息在中文实体关系抽取上的作用,提出了知网语义树和《同义词词林》编码树两种新特征,并连同已有的最短路径依存树、知网第一基本义原、《同义词词林》编码、实体大类和实体小类特征一起探究了其对... 为了探索从外部词典提取的实体词语义信息在中文实体关系抽取上的作用,提出了知网语义树和《同义词词林》编码树两种新特征,并连同已有的最短路径依存树、知网第一基本义原、《同义词词林》编码、实体大类和实体小类特征一起探究了其对抽取性能的影响。实验数据表明,作为单一特征时,提出的两种新特征性能虽然不如实体大类和实体小类特征,但是比最短路径依存树、知网第一基本义原、《同义词词林》编码好;作为组合特征时,最短路径依存树和两种新特征的组合特征取得了最好的性能。由此可以得出结论,从非语料中获取的最短路径依存树、知网语义树和《同义词词林》编码树特征可以代替从语料中获取的实体大类和实体小类特征,可以用于下一步开放域的关系抽取。 展开更多
关键词 《同义词词林》 知网 树核函数 关系抽取
下载PDF
词汇语义信息对中文实体关系抽取影响的比较 被引量:11
10
作者 刘丹丹 彭成 +1 位作者 钱龙华 周国栋 《计算机应用》 CSCD 北大核心 2012年第8期2238-2244,共7页
提出一种将《同义词词林》和《知网》的语义信息融合到基于树核函数的中文关系抽取方法,并比较和分析了两种语义信息对中文实体关系抽取的影响,同时探讨了这两种语义信息与实体类型信息之间的相互关系。实验结果表明,该方法能在一定程... 提出一种将《同义词词林》和《知网》的语义信息融合到基于树核函数的中文关系抽取方法,并比较和分析了两种语义信息对中文实体关系抽取的影响,同时探讨了这两种语义信息与实体类型信息之间的相互关系。实验结果表明,该方法能在一定程度上提高中文关系抽取的性能;同时,《同义词词林》能补充实体类型信息的不足,因而无论是否加入实体类型信息,其语义信息都能大幅度地提高大部分关系类型的抽取性能;而《知网》则和实体类型信息存在冲突,因此在已知实体类型信息的前提下,仅能提高个别关系类型的抽取性能。 展开更多
关键词 中文实体关系抽取 树核 《同义词词林》 《知网》 语义信息
下载PDF
《文馆词林》阙题残篇考证 被引量:4
11
作者 姜维公 《古籍整理研究学刊》 2004年第1期65-70,共6页
在日藏弘仁本《文馆词林》中,有一作者与题名不明的残篇。对作品流传情况、文体及内容进行考察,发现都与马融的《上林颂》相合。最后,马融的生活时代与残篇文字所表达出来的年代相合。这个残篇很可能就是马融的《上林颂》。
关键词 《文馆词林》 马融 《上林颂》
下载PDF
基于改进k-means算法的中文词义归纳 被引量:8
12
作者 张宜浩 金澎 孙锐 《计算机应用》 CSCD 北大核心 2012年第5期1332-1334,共3页
汉语中一词多义现象普遍存在,词义归纳就是对在不同语境中具有相同语义的词进行归类,本质上是一聚类问题。目前广泛采用无指导的聚类方法对词义归纳进行研究,提出一种改进的k-means算法,该算法主要从初始簇中心的选取以及簇均值的计算... 汉语中一词多义现象普遍存在,词义归纳就是对在不同语境中具有相同语义的词进行归类,本质上是一聚类问题。目前广泛采用无指导的聚类方法对词义归纳进行研究,提出一种改进的k-means算法,该算法主要从初始簇中心的选取以及簇均值的计算两个方面进行改进,在一定程度上克服了其对"噪声"和孤立点数据的敏感。在特征表示上用同义词词林中词的分类编号来降低特征维度。实验表明改进k-means算法在性能上有较大的提升,F-Score达到了75.8%。 展开更多
关键词 词义归纳 K-MEANS算法 聚类 同义词词林
下载PDF
基于《同义词词林》深度的词义相似度计算研究 被引量:13
13
作者 杨泉 孙玉泉 《计算机工程与应用》 CSCD 北大核心 2020年第17期48-54,共7页
针对词义相似度计算问题,在《同义词词林》的基础上,从语言学角度分析了《词林》中词语间的组织关系,阐述了父结点深度对词义相似度的决定性作用。统计了各层结点及原子词群大小的分布情况。提出了仅使用父结点深度的计算模型和父结点... 针对词义相似度计算问题,在《同义词词林》的基础上,从语言学角度分析了《词林》中词语间的组织关系,阐述了父结点深度对词义相似度的决定性作用。统计了各层结点及原子词群大小的分布情况。提出了仅使用父结点深度的计算模型和父结点深度与其分支信息相结合的计算模型。运用上述两种方法的词义相似度计算结果与Miller的人工标注值之间的皮尔逊相关系数达到0.854和0.857,根方误差达到1.003和0.991。 展开更多
关键词 词义相似度 《同义词词林》 深度 鱼群算法
下载PDF
基于同义词词林信息特征的语义角色自动标注 被引量:7
14
作者 李国臣 吕雷 +2 位作者 王瑞波 李济洪 李茹 《中文信息学报》 CSCD 北大核心 2016年第1期101-107 114,共8页
该文使用同义词词林语义资源库,以词林中编码信息为基础构建新的特征,使用条件随机场模型,研究了汉语框架语义角色的自动标注。该文在先前的基于词、词性、位置、目标词特征的基础上,在模型中加入不同的词林信息特征,以山西大学的汉语... 该文使用同义词词林语义资源库,以词林中编码信息为基础构建新的特征,使用条件随机场模型,研究了汉语框架语义角色的自动标注。该文在先前的基于词、词性、位置、目标词特征的基础上,在模型中加入不同的词林信息特征,以山西大学的汉语框架语义知识库为实验语料,研究了各词林信息特征分别对语义角色边界识别与分类的影响。实验结果表明,词林信息特征可以显著提高语义角色标注的性能,并且主要作用在语义角色分类上。 展开更多
关键词 语义角色标注 同义词词林 条件随机场 正交表
下载PDF
结合语义扩展度和词汇链的关键词提取算法 被引量:19
15
作者 刘端阳 王良芳 《计算机科学》 CSCD 北大核心 2013年第12期264-269,291,共7页
针对影响关键词提取质量的一词多义现象、同义词现象以及文章主题准确全面表达的难点,提出了一种基于语义的关键词提取算法KESELC,利用《同义词词林》语义词典和统计信息计算语义相似度和相关度,进而得出语义扩展度及其计算方法,将语义... 针对影响关键词提取质量的一词多义现象、同义词现象以及文章主题准确全面表达的难点,提出了一种基于语义的关键词提取算法KESELC,利用《同义词词林》语义词典和统计信息计算语义相似度和相关度,进而得出语义扩展度及其计算方法,将语义扩展度和词汇链方法相结合,对文本分别作预处理、多义词词义消歧、同义词合并、词汇链构建、有效特征选取及对权重综合计算的处理,提取出的关键词不仅避免了同义词冗余表达,而且较准确全面地覆盖文本的主题。通过实验对比分析,验证了基于KESELC的方法比基于TFIDF的方法以及基于词汇链的方法具有较优的提取效果,具有一定的实际应用价值。 展开更多
关键词 同义词词林 语义扩展度 词汇链 关键词提取 语义分析
下载PDF
基于同义词词林和规则的中文远程监督人物关系抽取方法 被引量:6
16
作者 谢明鸿 冉强 王红斌 《计算机工程与科学》 CSCD 北大核心 2021年第9期1660-1667,共8页
远程监督是一种根据知识库自动对齐实体进行大规模语料标注的方法,但过强的假设导致获取的语料混有大量的噪声。针对这一问题,提出了一种基于同义词词林和规则的中文远程监督人物关系抽取方法,该方法基于多示例学习思想将人物关系句子... 远程监督是一种根据知识库自动对齐实体进行大规模语料标注的方法,但过强的假设导致获取的语料混有大量的噪声。针对这一问题,提出了一种基于同义词词林和规则的中文远程监督人物关系抽取方法,该方法基于多示例学习思想将人物关系句子划分为包(bag)级,利用同义词词林对人物关系触发词做词频统计,确定最大词频候选关系和次大词频候选关系,再结合特定的人物关系判别规则判断人物关系。对bag判断出某个人物关系后,再对其进一步进行多关系预测,最终得到人物关系预测结果。在大规模的中文远程监督人物关系抽取公开数据集(IPRE)上的实验结果表明,所提方法得到的结果具有较好的F1值,并且能识别远程监督数据测试集标签所没标注出的人物关系。 展开更多
关键词 同义词词林 规则 远程监督 人物关系 关系抽取
下载PDF
面向中文客户评论的产品属性抽取方法研究 被引量:4
17
作者 陈炯 张虎 +1 位作者 曹付元 张永奎 《计算机工程与设计》 CSCD 北大核心 2012年第3期1245-1250,共6页
针对现有的中文客户评论产品属性识别方法存在的不足,通过采用词法分析、句法分析、同义词词林等多项技术和资源,挖掘真实语料中蕴藏的语言知识,提出了一种基于模板的产品属性识别方法。该方法对评论语料进行词法、句法分析和人工标注,... 针对现有的中文客户评论产品属性识别方法存在的不足,通过采用词法分析、句法分析、同义词词林等多项技术和资源,挖掘真实语料中蕴藏的语言知识,提出了一种基于模板的产品属性识别方法。该方法对评论语料进行词法、句法分析和人工标注,从标注结果中综合分析和归纳评论句的全局语言规则,提取属性词和评价词之间的词性和依存关系序列,借助同义词词林构建产品属性模板,使用属性模板识别产品属性。对比实验结果表明了提出方法的有效性。 展开更多
关键词 在线客户评论 产品属性抽取 依存句法分析 模板 同义词词林
下载PDF
基于语义词典和词汇链的关键词提取算法 被引量:14
18
作者 刘端阳 王良芳 《浙江工业大学学报》 CAS 2013年第5期545-551,共7页
关键词提取是文本挖掘领域中研究的核心技术之一.针对影响关键词提取质量的一词多义现象、同义词现象、文章主题准确全面表达的难点,提出了一种基于语义的关键词提取方法 KETCLC,将《同义词词林》语义词典和词汇链方法相结合,对文本分... 关键词提取是文本挖掘领域中研究的核心技术之一.针对影响关键词提取质量的一词多义现象、同义词现象、文章主题准确全面表达的难点,提出了一种基于语义的关键词提取方法 KETCLC,将《同义词词林》语义词典和词汇链方法相结合,对文本分别作预处理、多义词词义消歧、同义词合并、词汇链构建、有效特征选取及对权重综合计算改进的处理,提取出的关键词不仅避免了同义词冗余表达,而且较准确全面地覆盖文本的主题.实验结果表明:基于KETCLC方法比基于TFIDF以及基于词汇链的方法具有较优的提取效果,具有一定的实际应用价值. 展开更多
关键词 同义词词林 词汇链 关键词提取 语义分析 共现率
下载PDF
动态调整的Web文档增量聚类算法 被引量:2
19
作者 闵可锐 唐悦 +2 位作者 胡运发 赵泽宇 闫华 《计算机辅助工程》 2006年第3期110-113,共4页
介绍Web文档聚类的应用,针对现有文档聚类算法缺乏动态更新能力、经验参数过多以及缺乏对新词的把握等不足,提出动态调整的Web文档增量聚类(DynamicallyAdjustedIncrementalWebDocumentClustering,DAIWDC)算法,并使用同义词词林优化结果... 介绍Web文档聚类的应用,针对现有文档聚类算法缺乏动态更新能力、经验参数过多以及缺乏对新词的把握等不足,提出动态调整的Web文档增量聚类(DynamicallyAdjustedIncrementalWebDocumentClustering,DAIWDC)算法,并使用同义词词林优化结果.该算法在实验中达到了88%的正确率和75%的全面率,表明其具有较高的实用价值. 展开更多
关键词 增量算法 文档聚类 同义词词林
下载PDF
基于数据场和全局序列比对的大规模中文关联数据模型 被引量:4
20
作者 王汀 徐天晟 冀付军 《中文信息学报》 CSCD 北大核心 2016年第3期204-212,共9页
目前关联数据的研究工作主要集中在实例级别上展开,而在模式级别(Schema-Level)上的关联数据构建则易被忽视。本体映射是解决本体异构问题的重要途径和手段,同时,本体映射也可视为模式级别关联数据构建的典型情景。特别是在中文知识库方... 目前关联数据的研究工作主要集中在实例级别上展开,而在模式级别(Schema-Level)上的关联数据构建则易被忽视。本体映射是解决本体异构问题的重要途径和手段,同时,本体映射也可视为模式级别关联数据构建的典型情景。特别是在中文知识库方面,中文知识是关联数据网中的重要组成部分,但现有的中文本体映射系统在面对大规模本体映射任务时,显得效率较低且可用性不高,目前仍缺乏针对中文大规模本体映射的相关系统。为了解决在模式级别上的中文大规模关联数据构建问题,提出了一种新的基于数据场和序列比对思想的大规模中文关联数据构建模型。首先,基于改进的融合概念相似度和相异度的拟核力场势函数对大规模中文本体映射规模进行约简和压缩;其次,通过引入序列比对算法,对组合概念进行相似度的度量;最后,将本系统与相似度计算相关典型算法进行比较,表明其具备一定的可用性和较高的总体性能。 展开更多
关键词 语义网 关联数据 本体映射 同义词词林 相似度计算
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部