期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
中文领域本体学习中术语的自动抽取 被引量:14
1
作者 温春 王晓斌 石昭祥 《计算机应用研究》 CSCD 北大核心 2009年第7期2652-2655,共4页
提出一种领域术语自动抽取的混合策略,首先进行多字词候选术语抽取和分词,然后合并其结果,最后通过领域相关度和领域主题一致度抽取出最终领域术语。在多字词抽取和最终领域术语抽取阶段分别对现有方法进行了改进,降低了字符串分解的时... 提出一种领域术语自动抽取的混合策略,首先进行多字词候选术语抽取和分词,然后合并其结果,最后通过领域相关度和领域主题一致度抽取出最终领域术语。在多字词抽取和最终领域术语抽取阶段分别对现有方法进行了改进,降低了字符串分解的时间复杂度并提高了领域术语抽取的准确率和召回率。实验表明,术语抽取准确率为90.64%,优于现有的抽取方法。 展开更多
关键词 领域术语抽取 领域主题一致度 领域本体学习 多字词候选术语 字符串分解
下载PDF
利用标签的层次化搜索结果聚类方法 被引量:5
2
作者 张云 冯博琴 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第4期18-21,38,共5页
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元... 为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元组,再将2元组扩展为n元组,对所有元组进行去冗余、重要性排序,从而获得候选聚类标签.最后,基于该标签对返回结果中的文档进行分配与聚集,形成层次化聚类结果.实验结果表明,所提方法可以通过获得的准确、可读性较好的聚类标签,帮助用户有效地浏览搜索引擎返回的结果.与Vivisimo、STC、Lingo算法比较,以及在多个评价指标上的综合实验结果也表明,该方法是有效的. 展开更多
关键词 搜索结果聚类 词共现 候选聚类标签 层次化聚类
下载PDF
面向机器阅读理解的候选句抽取算法 被引量:3
3
作者 郭鑫 张庚 +1 位作者 陈千 王素格 《计算机科学》 CSCD 北大核心 2020年第5期198-203,共6页
使机器理解人类自然语言是人工智能在认知领域的终极目标,机器阅读理解是自然语言处理技术中继语音识别、语义理解之后的一大挑战,要求计算机具有一定的背景常识,全面理解给定文本材料,并根据材料内容对相应的问题作答。随着深度学习的... 使机器理解人类自然语言是人工智能在认知领域的终极目标,机器阅读理解是自然语言处理技术中继语音识别、语义理解之后的一大挑战,要求计算机具有一定的背景常识,全面理解给定文本材料,并根据材料内容对相应的问题作答。随着深度学习的快速发展,阅读理解成为当前人工智能的热点研究方向,涉及机器学习、信息检索、语义计算等核心技术,在聊天机器人、问答系统、智能化教育等多个领域具有广泛的应用前景。文中聚焦微阅读模式,根据问题或选项从给定文本材料中抽取包含答案的候选句,缩小推理范围,为进一步实现机器阅读理解提供技术支持。传统基于特征的方法耗费大量人力,文中将答案候选句抽取看成一种语义相关度计算问题,提出了一种答案候选句排序方法,即Att-BiGRU/BiLSTM模型。首先,利用双向长短期记忆和门控循环单元来编码句子中表达的语义信息;其次,设计Atten结构,结合相异性和相似性对语义相关度进行建模;最后,采用Adam算法来学习模型的参数。在SemEval-SICK数据集上的实验结果显示,该模型在测试集上的pearson指标超过了基线方法BiGRU将近0.67,在MSE指标上超过BiGRU方法16.83%,收敛速度更快,表明双向和Atten结构能大大提高候选句抽取的精度。 展开更多
关键词 长短期记忆模型 门控循环单元 候选句抽取 语义相关度计算
下载PDF
应届考生考前心理状况与紧张原因的调查研究 被引量:1
4
作者 朱小蔓 乔建中 吴蓉 《南京师大学报(社会科学版)》 CSSCI 北大核心 2001年第1期93-98,共6页
在“考前一学期”和“考前一周”的调查中发现 ,应届考生的考前心理状况在绝大多数方面都处于较好水平 ,而且比较稳定。其中 ,男生普遍优于女生 ,理科学生普遍优于文科学生。在应届考生中 ,心理紧张普遍存在 ;随着高考的邻近 ,考生的心... 在“考前一学期”和“考前一周”的调查中发现 ,应届考生的考前心理状况在绝大多数方面都处于较好水平 ,而且比较稳定。其中 ,男生普遍优于女生 ,理科学生普遍优于文科学生。在应届考生中 ,心理紧张普遍存在 ;随着高考的邻近 ,考生的心理紧张也随之发生显著变化 ,这不仅表现为紧张程度明显增强 。 展开更多
关键词 应届考生 考前一学期 家长心理 考前一周 高考 考前心理状况 问卷调查 紧张心理 成因 时间
下载PDF
基于交互式特征融合的嵌套命名实体识别 被引量:3
5
作者 廖涛 黄荣梅 +1 位作者 张顺香 段松松 《计算机工程》 CAS CSCD 北大核心 2022年第12期119-126,133,共9页
现有命名实体识别模型在字嵌入过程中多采用字符向量、字向量等不同单词表示向量的拼接或累加方式提取信息,未考虑不同单词表示特征之间的相互依赖关系,导致单词内部特征信息获取不足。提出一种基于交互式特征融合的嵌套命名实体识别模... 现有命名实体识别模型在字嵌入过程中多采用字符向量、字向量等不同单词表示向量的拼接或累加方式提取信息,未考虑不同单词表示特征之间的相互依赖关系,导致单词内部特征信息获取不足。提出一种基于交互式特征融合的嵌套命名实体识别模型,通过交互的方式构建不同特征之间的通信桥梁,以捕获多特征之间的依赖关系。采用交互机制得到包含不同单词表示信息的字嵌入向量,基于双向长短时记忆网络提取单词的表示特征,并对不同单词的表示特征进行交互,捕获特征之间的相互依赖关系。为进一步提取序列特征的上下文信息,采用基于特征交互的多头注意力机制捕获句子上下文的依赖关系。在此基础上,采用二元序列标记法过滤非实体区域,得到粗粒度候选区间,并对其进行细粒度划分以判断实体类别。实验结果表明,该模型的召回率和F1值为72.4%和71.2%,相比现有的嵌套命名实体识别模型,F1值平均提高了1.72%。 展开更多
关键词 嵌套命名实体识别 双向长短时记忆网络 特征交互 多头注意力 候选区间
下载PDF
以译促学 提升中医药博士英语教学 被引量:1
6
作者 赵霞 王珊珊 +1 位作者 沈艺 熊淋宵 《中国中医药现代远程教育》 2014年第7期74-75,共2页
本文讨论以翻译为切入点,通过常用中医语句汉译英练习,为学生过渡到学术论文写作做好准备的实践活动,并通过这种输出性技能培养,促进"说"、"读"等其他技能的发展,从而全面提升英语水平,使学生具备一定的中医英语能... 本文讨论以翻译为切入点,通过常用中医语句汉译英练习,为学生过渡到学术论文写作做好准备的实践活动,并通过这种输出性技能培养,促进"说"、"读"等其他技能的发展,从而全面提升英语水平,使学生具备一定的中医英语能力,体现"中医特色"。 展开更多
关键词 中医术语 博士英语 翻译 教学
下载PDF
山西历代科举鼎甲考 被引量:1
7
作者 孙仁义 《晋城职业技术学院学报》 2011年第1期3-13,共11页
山西处黄河中游,有中华民族"文化摇篮"之称,有得天独厚的历史文化积淀。中国科举隋大业元年(605年)始,清光绪三十一年(1905年)终,历经1300年,横跨唐、五代、宋、辽、金、元、明、清。作为一种考试制度延续上千年的历史,这在... 山西处黄河中游,有中华民族"文化摇篮"之称,有得天独厚的历史文化积淀。中国科举隋大业元年(605年)始,清光绪三十一年(1905年)终,历经1300年,横跨唐、五代、宋、辽、金、元、明、清。作为一种考试制度延续上千年的历史,这在中国和世界历史上都绝无仅有。历代科举中,山西共产生3000余名进士,有40余人进入鼎甲。本文尝试对山西历代的状元、榜眼、探花的情况进行小考。 展开更多
关键词 山西 科举 教育 鼎甲
下载PDF
面向网络文本的信息可信度评估方法研究 被引量:2
8
作者 李璐旸 李渝勤 +2 位作者 刘挺 秦兵 王轩 《智能计算机与应用》 2013年第5期31-34,38,共5页
随着网络信息的膨胀性增长,不可信的信息在网络中日益增多,阻碍误导用户对可信信息的获取。研究网络文本的可信度评估方法,对句子级命题提取多维网络分布特征,通过线性组合计算可信度值,从而判断命题的可信度。在可信度评估过程中,文中... 随着网络信息的膨胀性增长,不可信的信息在网络中日益增多,阻碍误导用户对可信信息的获取。研究网络文本的可信度评估方法,对句子级命题提取多维网络分布特征,通过线性组合计算可信度值,从而判断命题的可信度。在可信度评估过程中,文中方法通过词语结构特征提取可信信息的候选信息,并在候选信息的可信度计算中加入对信息源的可信度分析判断,提高了信息可信度的评估准确度。 展开更多
关键词 信息可信度 替换项 候选答案 可信度计算
下载PDF
面向中文书籍的书后索引项提取
9
作者 田梦 李宁 +2 位作者 吕淑琪 田英爱 许洁 《计算机工程与设计》 北大核心 2019年第1期261-267,共7页
为提升索引编制的准确率与效率,改善基于关键词的提取算法无法很好地提取与书籍主题相关并且具有索引价值的索引项的问题,提出综合评价方式进行书后索引项的提取。利用候选索引项在知识库中的类别和引用关系,借鉴网页排名(PageRank)算... 为提升索引编制的准确率与效率,改善基于关键词的提取算法无法很好地提取与书籍主题相关并且具有索引价值的索引项的问题,提出综合评价方式进行书后索引项的提取。利用候选索引项在知识库中的类别和引用关系,借鉴网页排名(PageRank)算法计算候选索引项的领域重要度;对书籍内部信息进行全面分析,利用统计、位置等特征计算候选索引项的书籍内部重要度;构建综合评价模型评价候选索引项作为书后索引项的适合程度。实验结果表明,所提方法在准确率、召回率和F值方面比未改进的算法有显著提高。 展开更多
关键词 书后索引 候选索引项提取 书后索引项提取 网页排名算法 特征评价
下载PDF
出国留学短期英语强化教学的提升策略研究——基于对出国访问学者英语有效交际能力的作用和影响
10
作者 张瑞 《教育教学论坛》 2023年第40期138-142,共5页
通过对277名出国访问学者和29名从事出国留学短期英语强化教学工作的教师的问卷调查,结合对6名正在国外访学的中国学者的专题采访,基于ESP教学理论,深度剖析了出国留学短期英语强化教学所面临的现实困境与相关问题对出国访问学者英语有... 通过对277名出国访问学者和29名从事出国留学短期英语强化教学工作的教师的问卷调查,结合对6名正在国外访学的中国学者的专题采访,基于ESP教学理论,深度剖析了出国留学短期英语强化教学所面临的现实困境与相关问题对出国访问学者英语有效交际能力的制约和影响,总结了提升出国留学短期英语强化教学效果的策略:借鉴ESP教学理论,夯实教学体系的科学性;强调教与学的一致性;彰显培训理念的前瞻性,以期在有限的培训时间内实现更好的培训效果。 展开更多
关键词 出国留学短期英语强化教学 出国访问学者 英语有效交际能力
下载PDF
一种基于历史信息的社会机会网络路由算法 被引量:3
11
作者 杨云辉 王小明 +2 位作者 张立臣 刘森 林亚光 《计算机技术与发展》 2018年第2期64-68,73,共6页
社会机会网络以人为载体,通过人类手持移动智能设备不断移动形成的通信机会来传输消息数据,移动设备的活动受人们社会行为的影响。针对社会机会网络中节点特有的社会性和移动性,提出了一种基于历史相遇信息的消息递交路由算法。该路由... 社会机会网络以人为载体,通过人类手持移动智能设备不断移动形成的通信机会来传输消息数据,移动设备的活动受人们社会行为的影响。针对社会机会网络中节点特有的社会性和移动性,提出了一种基于历史相遇信息的消息递交路由算法。该路由算法根据节点间的历史相遇信息计算节点的有效转发能力,并且考虑到消息大小不一所需传输时间不同,根据节点间的历史相遇持续时间计算节点间的平均相遇持续时间,始终将消息转发给与目的节点相遇概率更大且平均相遇时间更长的节点,直至消息到达目的节点或者消息失效。仿真实验表明,与现有机会路由算法相比,提出的算法具有较高的消息成功投递率,较小的消息冗余和消息平均时延。 展开更多
关键词 社会机会网络 路由 相遇概率 平均相遇时间 仿真实验
下载PDF
基于登录词邻接关系的双条件概率的领域术语抽取算法 被引量:2
12
作者 陈黎 于中华 +1 位作者 王亚强 秦湘清 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第6期1300-1306,共7页
领域词典作为中文信息处理的基础,在各个领域都有着重要的应用.而人工构建领域词典不仅工作量大,而且缺乏时效性.因此,自动构建领域词典成为目前研究的重点,而构建领域词典的关键是从领域语料中自动抽取领域术语.本文以金融领域作为切入... 领域词典作为中文信息处理的基础,在各个领域都有着重要的应用.而人工构建领域词典不仅工作量大,而且缺乏时效性.因此,自动构建领域词典成为目前研究的重点,而构建领域词典的关键是从领域语料中自动抽取领域术语.本文以金融领域作为切入点,提出了根据登录词前后邻接关系计算邻接词之间的双条件概率自动识别领域术语.实验证明,本文提出的算法不仅能够有效地提取新术语,同时在小语料和低词频情况下也能取得较好的效果. 展开更多
关键词 术语抽取 条件概率 领域词典 候选术语
原文传递
基于依存句法分析的中文专利候选术语选取研究 被引量:11
13
作者 俞琰 陈磊 +1 位作者 姜金德 赵乃瑄 《图书情报工作》 CSSCI 北大核心 2019年第18期109-118,共10页
[目的/意义]针对中文专利候选术语选取方法存在需要对不同的数据集分别制定不同的模式匹配规则、专利术语抽取准确性不高等问题,本文提出基于依存句法分析的中文专利术语选取方法,以提高中文专利术语抽取准确性。[方法/过程]主要包括依... [目的/意义]针对中文专利候选术语选取方法存在需要对不同的数据集分别制定不同的模式匹配规则、专利术语抽取准确性不高等问题,本文提出基于依存句法分析的中文专利术语选取方法,以提高中文专利术语抽取准确性。[方法/过程]主要包括依存句法分析、剪枝、生成依存子树等三个主要步骤。首先对中文专利进行依存句法分析,得到依存树,对依存树进行剪枝,去除不符合要求的依存关系,生成依存子树,从中选取连续词串作为候选术语,以抽取中文专利术语。[结果/结论]实验结果表明,与已有的中文专利候选术语选取方法相比,本文提出的基于依存句法分析的中文候选术语选取方法能够有效地提高中文专利术语抽取的准确性。 展开更多
关键词 术语抽取 依存句法分析 中文候选术语选取
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部