期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
近十年国家社科基金资助图书情报类课题指南与立项项目文本分析 被引量:8
1
作者 曹玲 郑思远 《图书馆工作与研究》 CSSCI 北大核心 2017年第12期17-22,47,共7页
本文针对2007-2016年国家社科基金"图书馆·情报与文献学"类目下的课题指南和立项项目名称,进行关键词切分与比对,结合内容分析结果,对二者关联性展开讨论,认为课题指南与立项项目的指导性是相互的,并对未来课题指南的制... 本文针对2007-2016年国家社科基金"图书馆·情报与文献学"类目下的课题指南和立项项目名称,进行关键词切分与比对,结合内容分析结果,对二者关联性展开讨论,认为课题指南与立项项目的指导性是相互的,并对未来课题指南的制定及立项项目的申报提出相关建议。 展开更多
关键词 国家社科基金 基金立项 课题指南 文本比
下载PDF
基于MapReduce的文本语句向量算法实现
2
作者 周宁 向阳 《电子技术与软件工程》 2015年第17期180-183,共4页
文本语句向量算法是针对文本语句元素提炼成为向量进行计算的一种文本比对算法,但是在处理海量数据和高维度矩阵时由于内存和I/O等资源的局限,该算法受到极大的影响。针对文本语句向量的相关特点,提出了基于Map Reduce模型的实现文本语... 文本语句向量算法是针对文本语句元素提炼成为向量进行计算的一种文本比对算法,但是在处理海量数据和高维度矩阵时由于内存和I/O等资源的局限,该算法受到极大的影响。针对文本语句向量的相关特点,提出了基于Map Reduce模型的实现文本语句向量算法的方法,Map函数完成对向量的划分和文本的解析,Reduce函数完成文本语句属性的比对和结果的新构建。实验结果表明:在大数据的环境下使用Map Reduce并行算法模型的文本语句向量计算效率性和可拓展性有进一步的提升。 展开更多
关键词 文本比 海量数据 高维度矩阵 MAPREDUCE 模型
下载PDF
Unix文本比对分析高通量RNA-Seq测序基因表达
3
作者 宋东光 卢博彬 陈柳婷 《生物信息学》 2018年第2期119-129,共11页
从RNA-Seq高通量测序短序列进行比对及拼接获得较长转录本并确定基因表达量的方法随着转录组测序的广泛开展仍在不断改进,本文利用类Unix系统的文本处理命令组合对山茶花开花期叶片及花瓣的转录组序列进行比对、序列拼接及其表达量分析... 从RNA-Seq高通量测序短序列进行比对及拼接获得较长转录本并确定基因表达量的方法随着转录组测序的广泛开展仍在不断改进,本文利用类Unix系统的文本处理命令组合对山茶花开花期叶片及花瓣的转录组序列进行比对、序列拼接及其表达量分析。首先对测序序列进行每1万条准随机排序,选取10万条序列分别与100万条序列进行比对,从每个查询序列随机选取9组20 mer比对100万条序列去重后获得该序列的转录数量。利用查询序列首尾20 mer从匹配的比对重叠群进行拼接,初次拼接最长为410 mer,超过两个及以上拼接序列的再次进行相互比对及再拼接,最长1 174 mer。用查询序列的比对匹配数表示其拼接前后的表达量,与用互补链进行比对得到的负链表达量相当。用拼接序列进行NCBI联网blast比对获得了其基因注释。本文得到的结果表明,利用类Unix系统文本比对可以有效用于高通量测序基因表达量及进行序列从头组装等分析。 展开更多
关键词 RNA-SEQ 文本比 基因表达量 重叠群拼接 类Unix系统
下载PDF
社会主义术语的中日共享与创出--以日本文献的早期汉译为例
4
作者 刘孟洋 《东北亚外语研究》 2023年第2期27-39,共13页
本文基于20世纪初的汉译社会主义著作,通过中日两国文本的比对,考察了社会主义术语的早期汉译方式及其特点。研究表明:我国知识界在将社会主义基本概念转换成汉语之早期阶段,译者们从日文诸底本中直接吸收汉字术语,这是最主要的方式,也... 本文基于20世纪初的汉译社会主义著作,通过中日两国文本的比对,考察了社会主义术语的早期汉译方式及其特点。研究表明:我国知识界在将社会主义基本概念转换成汉语之早期阶段,译者们从日文诸底本中直接吸收汉字术语,这是最主要的方式,也是有效的捷径。在吸收日语中社会主义术语的同时,译者们还努力进行着新术语的创制。这一时期创造的术语,由于受日文底本的影响,加之对社会主义学说的理解不足,很多汉译还不够准确。尽管如此,术语的创制与中国术语共享,为我国社会主义术语的早期汉译发挥了重要的作用。 展开更多
关键词 社会主义术语 日本文献 早期汉译 文本比 共享与创出
下载PDF
Word 2007格式科技文档抄袭鉴定研究
5
作者 付毅 程赟 于韬 《电子质量》 2016年第3期52-56,共5页
当前的"学术不端"检测系统大多只检测论文中的文字内容,对其中的公式,表格,图像,图形等内容没有进行雷同性检测。为此,该文基于Word 2007格式,着重研究了这些关键要素的抄袭鉴定。首先使用XML编程接口提取出了该格式文档中的... 当前的"学术不端"检测系统大多只检测论文中的文字内容,对其中的公式,表格,图像,图形等内容没有进行雷同性检测。为此,该文基于Word 2007格式,着重研究了这些关键要素的抄袭鉴定。首先使用XML编程接口提取出了该格式文档中的各个要素,并深入地研究了文本、公式、表格和图形等要素的比对方法。公式使用"类卷积"比对方案,表格使用二维文本比对,图片分矢量图和位图分别研究比对,并针对这些要素进行了综合的抄袭鉴定建模。最后,总结了本文的创新点,并提出了改进方向。 展开更多
关键词 WORD 2007 抄袭鉴定 公式比对 文本比 图片比对
下载PDF
基于LCS算法的EDL可视化比对工具研究
6
作者 郑晓发 李垚瑞 《现代电影技术》 2020年第6期11-15,共5页
本文设计并开发了针对EDL文件特点的按行比对工具,以LCS最大公共子串比对算法执行EDL文件比对功能;同时使用Qt Creator进行比对结果可视化开发的设计方案,实现了EDL文件读取、异动比对、比对结果可视化及文本输出功能,为后期环节剪辑、... 本文设计并开发了针对EDL文件特点的按行比对工具,以LCS最大公共子串比对算法执行EDL文件比对功能;同时使用Qt Creator进行比对结果可视化开发的设计方案,实现了EDL文件读取、异动比对、比对结果可视化及文本输出功能,为后期环节剪辑、特效、调色各部门间变动素材整理提供了一种解决方案,可提高数字电影后期制作流程中各部门协同工作的效率. 展开更多
关键词 EDL 文本比 LCS算法 结果可视化 素材筛选
下载PDF
《老子》諸本的四字句與早期文本的演變規律——基於出土文獻與傳世文獻的文本比對研究
7
作者 李林芳 《古籍研究》 2022年第2期133-148,共16页
本文以《老子》諸本中的四字句爲主要考察對象。通過全面對比其出土和傳世文本,並加以統計分析,發現《老子》文本中的四字句占比具有隨文本年代的推進而逐漸升高的規律,虚詞的减少和增加是最爲常見的造成四字句變化的途徑。在此基礎上,... 本文以《老子》諸本中的四字句爲主要考察對象。通過全面對比其出土和傳世文本,並加以統計分析,發現《老子》文本中的四字句占比具有隨文本年代的推進而逐漸升高的規律,虚詞的减少和增加是最爲常見的造成四字句變化的途徑。在此基礎上,本文探討了該文本演變規律的成因,認爲四字句在《老子》文本内部和其他衆多早期文本的所有句式中占比最高的事實誘發了這一變化,漢語語言本身的特質又爲該變化提供了可能;這一變化應非源於傳承者全面系統的、有明確主觀意圖的行爲,而更可能是隨興的改易。最後,本文又對其他早期文本的四字句情况進行了分析,發現其中也存在着同樣的文本變化趨勢。而這一規律還可應用於對文本要素時代的判斷上,從而能昭顯某些文本中遺存着的較爲古早的因素。 展开更多
关键词 老子 四字句 文本演變規律 早期文本 文本比對
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部