期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于学术论文全文内容的算法使用行为及其影响力研究 被引量:22
1
作者 章成志 丁睿祎 王玉琢 《情报学报》 CSSCI CSCD 北大核心 2018年第12期1175-1187,共13页
数据挖掘算法已被广泛应用于科学研究与实践中。考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法。本文利用学术论文全文内容,对算法的使用行为... 数据挖掘算法已被广泛应用于科学研究与实践中。考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法。本文利用学术论文全文内容,对算法的使用行为进行分析,从而考察算法的影响力。具体来说,本文以自然语言处理领域为例,收集整理全国计算语言学会议(CCL)1993—2016年收录的学术论文全文数据,从使用频次、使用位置、使用年代以及使用动机等四个方面全面考察十大经典数据挖掘算法在该领域的使用情况,并在此基础上对算法的影响力进行评估。实验结果显示,十大算法的使用行为存在明显差异,且SVM算法影响力最高,CART与Apriori算法影响力较低。本文研究可为基于数据驱动的相关研究者,尤其是为初学者在算法选择时提供参考。 展开更多
关键词 算法影响力评估 使用行为 全文内容分析
下载PDF
基于全文内容的学术论文研究方法自动分类研究 被引量:28
2
作者 章成志 李卓 储荷婷 《情报学报》 CSSCI CSCD 北大核心 2020年第8期852-862,共11页
对学术论文所采用的研究方法进行自动分类,有助于研究方法使用行为的分析与研究方法的评估,进而为科研人员推荐或选择合适的研究方法提供依据。相比于摘要信息,全文内容包含更多关于研究方法的上下文信息,因此探索基于全文内容的学术论... 对学术论文所采用的研究方法进行自动分类,有助于研究方法使用行为的分析与研究方法的评估,进而为科研人员推荐或选择合适的研究方法提供依据。相比于摘要信息,全文内容包含更多关于研究方法的上下文信息,因此探索基于全文内容的学术论文研究方法自动分类具有重要的意义。本研究以图书情报领域的820篇学术论文全文为研究对象,邀请专家对其研究方法进行标注得到研究方法训练语料;采用多标签分类任务中问题转换法和算法自适应法,将朴素贝叶斯与支持向量机作为问题转换法的底层分类器,构建6种不同的分类模型,同时选用算法自适应法中的ML-KNN模型,分别对论文中使用的研究方法进行自动分类。实验结果表明,相较于学术论文的摘要信息,全文内容在研究方法分类的性能上有较大的提升;朴素贝叶斯算法在问题转换法的分类器链策略中表现最佳,F1值达到0.705;另外结果也表明不同的学术论文研究方法的特征表征能力不同,训练集的规模较少会导致分类的泛化效果差。 展开更多
关键词 研究方法分类 文本分类 全文内容 多标签分类
下载PDF
基于学术论文全文内容的特定领域算法实体抽取研究 被引量:4
3
作者 丁睿祎 王玉琢 章成志 《数字图书馆论坛》 CSSCI 2022年第3期2-14,共13页
对学术论文中的算法实体进行研究,能够促进深入了解算法对科学研究的作用,而从全文数据中抽取算法实体是相关研究的基础。学术论文全文内容中算法实体的抽取可以看作一种特殊的命名实体识别。本文通过人工识别的方法,从4641篇论文中抽取... 对学术论文中的算法实体进行研究,能够促进深入了解算法对科学研究的作用,而从全文数据中抽取算法实体是相关研究的基础。学术论文全文内容中算法实体的抽取可以看作一种特殊的命名实体识别。本文通过人工识别的方法,从4641篇论文中抽取出977种算法实体并构建算法实体词列表,以此为基础构建标注语料,训练算法实体自动抽取模型,在剩余语料上抽取得到221种新算法实体,并将自动抽取结果与人工抽取结果进行整合得到全部算法实体1198种。研究结果表明:人工抽取法的结果能够为自动抽取法构建一定数量的标注语料,所构建的算法实体自动抽取模型能够有效地抽取出人工方法中遗漏的新算法实体,同时还能够抽取出已有算法实体的全新表达形式,进一步对人工抽取结果进行扩充和完善。 展开更多
关键词 学术论文全文内容 算法实体 实体抽取 学术文本挖掘
下载PDF
基于Lucene的图书全文检索应用研究 被引量:1
4
作者 文永革 胡国芳 彭声泽 《绵阳师范学院学报》 2010年第11期88-92,共5页
基于当前数字图书馆建设所需,根据Lucene主流开源全文检索引擎技术分析,应用双向最大匹配(BBM)分词算法及通用反向索引机制,在优化向量空间模型(VSM)基础上,实现数字图书全文内容的检索。该方法提高了数据的查询速度与查准率,为如何提... 基于当前数字图书馆建设所需,根据Lucene主流开源全文检索引擎技术分析,应用双向最大匹配(BBM)分词算法及通用反向索引机制,在优化向量空间模型(VSM)基础上,实现数字图书全文内容的检索。该方法提高了数据的查询速度与查准率,为如何提升高校图书馆信息服务水平作出了有益的探索。 展开更多
关键词 数字图书 LUCENE 向量空间模型 全文内容检索
下载PDF
学术文本中细粒度知识实体的关联分析 被引量:17
5
作者 章成志 谢雨欣 宋云天 《图书馆论坛》 CSSCI 北大核心 2021年第3期12-20,共9页
考察特定领域文本中蕴含的细粒度知识实体的使用情况,对知识实体的评估和选择具有重要意义。学术文本中的细粒度知识实体通常具有多个类型、多种关联关系,挖掘知识实体的同质与异质关联关系,有助于深入了解特定领域知识实体的实际使用... 考察特定领域文本中蕴含的细粒度知识实体的使用情况,对知识实体的评估和选择具有重要意义。学术文本中的细粒度知识实体通常具有多个类型、多种关联关系,挖掘知识实体的同质与异质关联关系,有助于深入了解特定领域知识实体的实际使用情况。目前相关研究大多针对学术文本中单一知识实体的抽取和评估,缺乏对知识实体间关系的关注,在一定程度上限制了基于实体抽取进行知识发现的能力。文章以自然语言处理领域为例,对学术论文全文中的细粒度知识实体关联数据进行挖掘,并通过可视化方式揭示关联数据中蕴含的信息。主要是选取全国计算语言学会议2009-2018年间收录的中文论文为原始语料,人工标注论文中使用的知识实体,并针对NLP特点将其细分为“指标实体”“工具实体”“资源实体”“方法实体”4种类型;结合关联规则挖掘算法Apriori和复杂网络分析软件构建知识实体关联网络,揭示该领域常用的知识实体,以及这些知识实体的使用相关性。 展开更多
关键词 全文内容分析 细粒度知识实体 关联分析
下载PDF
针对特定任务的方法实体评估研究 被引量:2
6
作者 李小乐 王玉琢 章成志 《情报工程》 2021年第4期13-26,共14页
[目的/意义]在科学的发展中,研究方法扮演着重要角色。收集并分析特定学科的方法实体,能够帮助学者更好地了解该领域的研究方法,并找到适合其自身研究的方法。目前已有针对方法抽取和评价的相关研究,但尚未针对特定任务开展知识实体抽... [目的/意义]在科学的发展中,研究方法扮演着重要角色。收集并分析特定学科的方法实体,能够帮助学者更好地了解该领域的研究方法,并找到适合其自身研究的方法。目前已有针对方法抽取和评价的相关研究,但尚未针对特定任务开展知识实体抽取与评估研究。[方法/过程]本文以命名实体识别(Named Entity Recognition,NER)任务为例,从ACL Anthology网站中收集相关论文,利用内容分析法对论文中作者使用的方法实体进行标注。本文从426篇学术论文中标注出904种方法实体。并基于使用次数和使用年代两个维度来评估方法实体影响力。[结果/结论]条件随机场是NER任务中影响力最大的算法,神经网络算法在近五年发展迅猛;学者倾向于使用算法而不是现成的工具进行实体识别;在数据选择方面,经典数据集是学者的首选;F值、正确率和召回率是影响力最大的评价指标。本文的标注结果能够帮助学者更好地理解该任务,提高科研的效率。实体评估的结果能够为初学者在选择具体研究方法时提供参考。 展开更多
关键词 命名实体识别 实体影响力评估 全文内容分析
下载PDF
考虑全文本内容的算法学术影响力分析研究 被引量:21
7
作者 王玉琢 章成志 《图书情报工作》 CSSCI 北大核心 2017年第23期6-14,共9页
[目的/意义]从全文本内容分析的角度对算法的学术影响力进行分析。[方法 /过程]以自然语言处理领域十大数据挖掘算法使用为例,分析不同算法在特定领域的影响力。通过对1965年-2006年间发表的自然语言处理领域10 922篇学术论文的调研,从... [目的/意义]从全文本内容分析的角度对算法的学术影响力进行分析。[方法 /过程]以自然语言处理领域十大数据挖掘算法使用为例,分析不同算法在特定领域的影响力。通过对1965年-2006年间发表的自然语言处理领域10 922篇学术论文的调研,从其全文内容中抽取6 001条包含十大数据挖掘算法的句子(简称算法句);针对算法句从提及论文数、总提及次数、提及位置等3个方面,对不同算法的影响力进行比较分析。[结果/结论]以不同特征作为影响力衡量标准,十大数据挖掘算法在自然语言处理领域学术论文中的影响力有明显区别,在基于论文数、提及数和提及位置的评估标准中,SVM算法表现出较高的影响力,Apriori算法的影响力则明显低于其他算法。本研究为量化评估算法的影响力提供了新思路。 展开更多
关键词 算法影响力 影响力评估 全文内容 文本内容分析
原文传递
IEC发布《多媒体设备的安全导则》第二版
8
作者 李兰芬 《安全与电磁兼容》 2002年第6期36-36,共1页
随着信息技术的高速发展,多媒体产品已出现在各个领域.信息技术设备、音频-视频设备、通信设备、网络综合设备的界限均发生了很大变化.
关键词 IEC 《多媒体设备的安全导则》 第二版 全文内容
下载PDF
医学信息学领域算法类别使用及影响力研究
9
作者 于琦 马彩珍 +2 位作者 邰杨芳 吴胜男 贺培凤 《医学信息学杂志》 CAS 2020年第10期23-29,共7页
基于JCR数据,采用社会调查法、分层抽样法、全文内容分析法筛选705篇使用算法论文样本,通过相关标准及专家咨询法获得16个算法类别。在此基础上对算法类别使用情况进行统计,基于分类词典对提及次数、提及位置和共现情况进行影响力分析,... 基于JCR数据,采用社会调查法、分层抽样法、全文内容分析法筛选705篇使用算法论文样本,通过相关标准及专家咨询法获得16个算法类别。在此基础上对算法类别使用情况进行统计,基于分类词典对提及次数、提及位置和共现情况进行影响力分析,为相关研究提供参考。 展开更多
关键词 医学信息学 算法 使用行为 影响力评估 全文内容分析
下载PDF
《排污费征收使用管理条例》公布
10
《电力快讯》 2003年第5期1-3,共3页
关键词 《排污费征收使用管理条例》 全文内容 排污费 排放种类
下载PDF
基于学术论文全文的跨语言研究方法自动分类研究 被引量:7
11
作者 田亮 李博闻 章成志 《图书馆建设》 CSSCI 北大核心 2022年第1期75-86,共12页
自动识别学术论文所使用的研究方法对研究方法的评估、方法使用行为分析、方法检索等均具有重要意义。学术论文研究方法的自动分类离不开大量训练语料,但论文研究方法标注成本高昂,探讨如何充分利用现有标注数据对于降低标注成本具有重... 自动识别学术论文所使用的研究方法对研究方法的评估、方法使用行为分析、方法检索等均具有重要意义。学术论文研究方法的自动分类离不开大量训练语料,但论文研究方法标注成本高昂,探讨如何充分利用现有标注数据对于降低标注成本具有重要意义。以图书情报领域为研究对象,首先通过实验比较了基于英文摘要的单语言方法和基于全文的跨语言方法,进而说明了使用跨语言方法的必要性;其次比较了两种跨语言方法在跨语言研究方法分类中的效果;最后对本文提出的一种学术论文全文处理方法进行了验证。实验结果表明,基于学术论文全文的跨语言方法明显优于基于英文摘要的单语言方法,基于机器翻译的方法比基于跨语言预训练模型的方法更优。此外,实验表明针对学术论文全文的长文本处理方法相较于基线方法有明显提升。 展开更多
关键词 研究方法自动分类 跨语言文本分类 多标签分类 学术论文全文内容
原文传递
THE IMPLEMENTATION OF A BALANCED READING INSTRUCTION IN TAIWAN
12
作者 柳雅梅 黄秀霜 《Chinese Journal of Applied Linguistics》 2006年第5期11-17,32+127,共9页
The purpose of this study is to explore the effects of the balanced reading program on the elementary school students in Taiwan. The participants were 36 fifth graders in Taiwan. The researchers chose suitable picture... The purpose of this study is to explore the effects of the balanced reading program on the elementary school students in Taiwan. The participants were 36 fifth graders in Taiwan. The researchers chose suitable picture books as teaching materials and made use of them to design a balanced reading program. The program combines the ideas of whole language and phonics rules. Whole-part-whole structure was used in the teaching process. The teaching of the balanced reading program lasted for nine weeks. The questionnaire of learning feedbacks, the questionnaire of reading activities, the teacher's journal, interviews with teachers and students were used to gather data. Six facts were found after the analysis of the data: (1) Among the picture books, 'Seven Blind Mice' and 'Snow' were chosen by the students as their favorite. (2) Most students liked the reading activities for this semester. (3) The students made progress in reading ability and reading techniques. (4) The frequency of the students' reading English storybooks increased. (5) Most students were willing to read English storybooks after the program. (6) The table of self-evaluation didn't work well. Some suggestions have been provided according to the findings. 展开更多
关键词 balanced reading instruction phonics approach whole language approach language and literature-rich activities elementary EFL classroom in Taiwan
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部