期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
Text Rank for Domain Specific Using Field Association Words 被引量:1
1
作者 Omnia G. El Barbary El Sayed Atlam 《Journal of Computer and Communications》 2020年第11期69-79,共11页
Text Rank is a popular tool for obtaining words or phrases that are important for many Natural Language Processing (NLP) tasks. This paper presents a practical approach for Text Rank domain specific using Field Associ... Text Rank is a popular tool for obtaining words or phrases that are important for many Natural Language Processing (NLP) tasks. This paper presents a practical approach for Text Rank domain specific using Field Association (FA) words. We present the keyphrase separation technique not for a single document, although for a particular domain. The former builds a specific domain field. The second collects a list of ideal FA terms and compounds FA terms from the specific domain that are considered to be contender keyword phrases. Therefore, we combine two-word node weights and field tree relationships into a new approach to generate keyphrases from a particular domain. Studies using the changed approach to extract key phrases demonstrate that the latest techniques including FA terms are stronger than the others that use normal words and its precise words reach 90%. 展开更多
关键词 text rank Keyphrase Extraction Field Association Words Information Retrieval
下载PDF
基于PageRank和锚文本的网页排序研究 被引量:6
2
作者 刘菁菁 林鸿飞 赵晶 《计算机工程与应用》 CSCD 北大核心 2007年第10期170-173,共4页
网页和纯文本结构差异性决定了传统的IR排序技术不能适应网络发展。为合理排序检索结果,引入了基于文献引文分析法原理的链接分析方法。该方法对被多个网页链接的网页赋予较高评价,同时考虑锚文本与查询词的相似度。源网页质量参差不齐... 网页和纯文本结构差异性决定了传统的IR排序技术不能适应网络发展。为合理排序检索结果,引入了基于文献引文分析法原理的链接分析方法。该方法对被多个网页链接的网页赋予较高评价,同时考虑锚文本与查询词的相似度。源网页质量参差不齐,链向相同网页的锚文本质量也有优劣之分,但高质量源网页的锚文本不一定比质量低源网页的准确。对相似度高的锚文本加以修正,即通过计算查询词和锚文本相似度,对于相似度较高但源于PageRank值低的源网页的锚文本加以补偿,并重新排序查询结果。 展开更多
关键词 链接分析 锚文本 PAGErank 网页排序
下载PDF
基于BERT的海上船舶安全隐患分类
3
作者 靳嵩 朱艳 +3 位作者 吴可嘉 孟祥松 赵乾菊 王颖 《船舶工程》 CSCD 北大核心 2023年第S01期381-384,共4页
为准确分析出影响海上船舶安全的隐患类别,提高船舶、船员、设备的管理制度,提出一种基于双向编码器(BERT)的海上船舶安全隐患分类。采用Text Rank算法对隐患文本进行关键词提取,将提取的关键词输入到BERT预训练模型,提升模型在分类任... 为准确分析出影响海上船舶安全的隐患类别,提高船舶、船员、设备的管理制度,提出一种基于双向编码器(BERT)的海上船舶安全隐患分类。采用Text Rank算法对隐患文本进行关键词提取,将提取的关键词输入到BERT预训练模型,提升模型在分类任务上的性能。试验结果表明,训练前采用Text Rank算法进行关键词提取,准确率、召回率和F1值都有所提升,验证了模型的有效性,达到了快速准确对海上船舶安全隐患分类的目的。 展开更多
关键词 海上船舶 隐患类别 关键词提取 BERT text rank算法
下载PDF
Construction of an Automatic Bengali Text Summarizer Using Machine Learning Approaches
4
作者 Busrat Jahan Mahfuja Khatun +2 位作者 Zinat Ara Zabu Afranul Hoque Sayed Uddin Rayhan 《Journal of Data Analysis and Information Processing》 2022年第1期43-57,共15页
In our study, we chose python as the programming platform for finding an Automatic Bengali Document Summarizer. English has sufficient tools to process and receive summarized records. However, there is no specifically... In our study, we chose python as the programming platform for finding an Automatic Bengali Document Summarizer. English has sufficient tools to process and receive summarized records. However, there is no specifically applicable to Bengali since Bengali has a lot of ambiguity, it differs from English in terms of grammar. Afterward, this language holds an important place because this language is spoken by 26 core people all over the world. As a result, it has taken a new method to summarize Bengali documents. The proposed system has been designed by using the following stages: pre-processing the sample doc/input doc, word tagging, pronoun replacement, sentence ranking, as well as summary. Pronoun replacement has been used to reduce the incidence of swinging pronouns in the performance review. We ranked sentences based on sentence frequency, numerical figures, and pronoun replacement. Checking the similarity between two sentences in order to exclude one since it has less duplication. Hereby, we’ve taken 3000 data as input from newspaper and book documents and learned the words to be appropriate with syntax. In addition, to evaluate the performance of the designed summarizer, the design system looked at the different documents. According to the assessment method, the recall, precision, and F-score were 0.70, 0.82 and 0.74, respectively, representing 70%, 82% and 74% recall, precision, and F-score. It has been found that the proper pronoun replacement was 72%. 展开更多
关键词 Natural Language Processing Formatting Bangla text Summarizer Bengali Language Processing Word Tagging Pronoun Replacement Sentence ranking
下载PDF
政策工具视角下我国科技项目“揭榜挂帅”政策文本分析 被引量:1
5
作者 朱浩 陈鑫 刘柳 《科技和产业》 2023年第23期10-18,共9页
基于Rothwell和Zegveld政策工具分类方法,结合我国“揭榜挂帅”政策发展阶段构建X-Y二维分析框架,通过对2016年以来的178份“揭榜挂帅”政策文本进行编码,量化分析“揭榜挂帅”政策工具体系及演进。结果表明,“揭榜挂帅”政策探索和发... 基于Rothwell和Zegveld政策工具分类方法,结合我国“揭榜挂帅”政策发展阶段构建X-Y二维分析框架,通过对2016年以来的178份“揭榜挂帅”政策文本进行编码,量化分析“揭榜挂帅”政策工具体系及演进。结果表明,“揭榜挂帅”政策探索和发展大致经历萌芽起步、探索发展和全国推广3个阶段,相比环境型政策工具,需求型和供给型政策工具使用较少,“揭榜挂帅”政策工具内部结构仍有待优化。最后从促进主体深度融合、强化人才激励和防范盲目扩大风险等方面提出优化建议。 展开更多
关键词 揭榜挂帅 政策工具 文本分析
下载PDF
基于检索重排序模型的文本差异化研究
6
作者 门业堃 钱梦迪 +3 位作者 于钊 滕景竹 陈少坤 颜旭 《电测与仪表》 北大核心 2023年第1期57-63,共7页
电力行业在设备质量评估中需要结合行业标准规范文件中指定的具体标准来对设备质量进行准确评估。文中通过基于检索重排序模型的文本差异化模型,建立自动化、信息化、智能化的标准差异化梳理技术,有效解决了当前设备质量评估时的费时费... 电力行业在设备质量评估中需要结合行业标准规范文件中指定的具体标准来对设备质量进行准确评估。文中通过基于检索重排序模型的文本差异化模型,建立自动化、信息化、智能化的标准差异化梳理技术,有效解决了当前设备质量评估时的费时费力问题,并提升了文本差异检索的准确率。文中主要围绕自动化、信息化、智能化的标准差异化梳理技术,通过基于检索重排序模型的信息检索模型,建立针对同一领域不同标准的文本检索比对,检索出不同文件对同一技术有着不同要求的差异性内容并进行预警提示。文中的创新点是,利用检索重排序精确性高的优点,在保留传统差异性检索召回模型的召回候选能力的基础上进一步提高精确性。模型在真实的电力行业技术标准文档上进行了交叉验证,验证了所提出的模型效果,结果表明模型具有良好的实用性,可以广泛应用于电力设备质量评估,供应商评价标准检索等领域。 展开更多
关键词 差异性检索 排序学习 文本相似度 检索重排序 设备质量评估自动化
下载PDF
网络新闻话题演化趋势检测研究 被引量:1
7
作者 赵旭剑 付鹏 +4 位作者 李波 张晖 杨春明 喻琼 王耀彬 《电脑知识与技术(过刊)》 2015年第1X期52-54,59,共4页
演化趋势检测能提前获取话题的演变轨迹,有效提高决策者对于话题舆情处理的主动性和预判性。针对该需求,该文深入研究新闻话题的演变过程,利用K-means算法对专题新闻报道集进行聚类,得到新闻话题演化阶段的不同类簇,并且采用Text Rank... 演化趋势检测能提前获取话题的演变轨迹,有效提高决策者对于话题舆情处理的主动性和预判性。针对该需求,该文深入研究新闻话题的演变过程,利用K-means算法对专题新闻报道集进行聚类,得到新闻话题演化阶段的不同类簇,并且采用Text Rank方法提取各个新闻话题演化阶段的有效关键词,然后基于时间信息,整理生成话题演化趋势。该文以百度百科相关词条的客观描述作为评判标准进行算法评测,实验结果表明本文算法具有较高的准确性。 展开更多
关键词 话题演化 演化趋势 趋势检测 K-MEANS text rank
下载PDF
融合图卷积和胶囊网络的内容感知排序推荐
8
作者 周文荣 张䶮 肖述 《计算机工程与设计》 北大核心 2023年第1期158-165,共8页
为提升内容感知推荐算法的性能,提出一种基于排序学习融合胶囊网络和图卷积网络的内容感知推荐算法。构建图卷积网络学习文本特征并捕获非连续和长距离的语义信息,利用胶囊网络提取文本信息中的层次结构信息,融合这两个网络学习文本的... 为提升内容感知推荐算法的性能,提出一种基于排序学习融合胶囊网络和图卷积网络的内容感知推荐算法。构建图卷积网络学习文本特征并捕获非连续和长距离的语义信息,利用胶囊网络提取文本信息中的层次结构信息,融合这两个网络学习文本的细粒度特征;基于项目偏好排序和文本内容相关性排序,构建一个基于扩展BPR模型的联合似然函数损失函数,实现Top-N的排序推荐。真实数据集的实验结果表明,该算法有效提升了推荐性能。 展开更多
关键词 文本信息 图卷积网络 胶囊网络 偏好排序 逐对排序 推荐算法 细粒度特征 用户偏好
下载PDF
网络新闻话题语义信息提取
9
作者 赵旭剑 黄发发 +4 位作者 李波 张晖 杨春明 喻琼 王耀彬 《电脑知识与技术(过刊)》 2015年第5X期176-178,共3页
新闻话题抽取对于话题模型构建以及新闻话题挖掘具有重要的研究意义和应用价值。传统的方法仅仅通过提取关键词包来表示话题,缺乏完整的话题语义信息描述。针对该问题,本文从话题事件要素入手,建立话题语义模型,利用浅层语法特征抽取话... 新闻话题抽取对于话题模型构建以及新闻话题挖掘具有重要的研究意义和应用价值。传统的方法仅仅通过提取关键词包来表示话题,缺乏完整的话题语义信息描述。针对该问题,本文从话题事件要素入手,建立话题语义模型,利用浅层语法特征抽取话题语义信息。实验结果表明,本文算法能有效提取新闻话题要素,抽取结果具有一定的语义表达能力。 展开更多
关键词 话题语义信息 话题抽取 事件要素 text rank
下载PDF
基于胶囊组的低秩重建多标签文本分类
10
作者 罗顺茺 何军 陈贵强 《计算机工程与设计》 北大核心 2023年第5期1359-1367,共9页
为解决胶囊注意力网络在特征提取无法关注胶囊代表属性之间关系的问题,提出一种基于胶囊组低秩重建的3D上下文表示建模的胶囊网络多标签文本分类方法。设计多层次卷积残差结构构建初始胶囊组,整合全文的语义信息;设计可学习的权重矩阵... 为解决胶囊注意力网络在特征提取无法关注胶囊代表属性之间关系的问题,提出一种基于胶囊组低秩重建的3D上下文表示建模的胶囊网络多标签文本分类方法。设计多层次卷积残差结构构建初始胶囊组,整合全文的语义信息;设计可学习的权重矩阵在张量矩阵化的3个维度上生成一阶低秩胶囊组,以低秩胶囊组为基础构建完整的上下文特征。将注意力集中到重要词语上的同时,关注胶囊中不同属性之间的关系。实验结果表明,该方法可有效提高多标签文本分类的效果。 展开更多
关键词 多标签文本分类 胶囊网络 多层次卷积 张量矩阵化 低秩重建 残差结构 低秩胶囊组
下载PDF
网络新闻话题演化模式挖掘 被引量:3
11
作者 赵旭剑 张立 +4 位作者 李波 张晖 杨春明 喻琼 王耀彬 《软件》 2015年第6期1-6,共6页
针对特定主题的新闻话题演化模式挖掘对于话题动态演化研究具有重要的研究意义和应用价值,能帮助人们清晰地梳理话题事件的来龙去脉,直观地展现话题演化轨迹的逻辑结构。针对该需求,本文提出一种面向特定话题的网络新闻话题演化模式挖... 针对特定主题的新闻话题演化模式挖掘对于话题动态演化研究具有重要的研究意义和应用价值,能帮助人们清晰地梳理话题事件的来龙去脉,直观地展现话题演化轨迹的逻辑结构。针对该需求,本文提出一种面向特定话题的网络新闻话题演化模式挖掘方法,拟从挖掘话题演化逻辑的角度出发,针对特定话题(矿难事件)进行话题演化一般规律的深入分析,对话题演变过程进行阶段化表示,建立话题演化模式。实验结果表明,本文构建的特定话题演化模式具有较强的语义表达能力,符合话题逻辑。 展开更多
关键词 话题演化 演化模式挖掘 话题聚类 text rank
下载PDF
基于热度联合排序的微博热点话题发现 被引量:6
12
作者 刘培玉 侯秀艳 +2 位作者 朱振方 刘芳 蔡肖红 《计算机科学与探索》 CSCD 北大核心 2016年第4期573-581,共9页
微博热点话题发现对于舆情分析和观点挖掘具有重要作用,提出了一种基于热度联合排序的微博热点话题发现方法,并构建统一的模型框架将微博文本和热点主题词之间的各种关系进行了有机融合;考虑微博用户的权威性以及主题词的时间段相关特性... 微博热点话题发现对于舆情分析和观点挖掘具有重要作用,提出了一种基于热度联合排序的微博热点话题发现方法,并构建统一的模型框架将微博文本和热点主题词之间的各种关系进行了有机融合;考虑微博用户的权威性以及主题词的时间段相关特性,对微博文本和主题词的热度进行了联合排序并互相增强;使用主题词组合支持度作为阈值对热度序列中的主题词进行聚类以表征热点话题。实验表明,所提方法对于热点主题词的抽取以及热点话题发现具有较高准确性,可以及时有效地发现特定时间段内的微博热点话题。 展开更多
关键词 微博文本 联合排序 热度序列
下载PDF
基于图排序算法的自动文摘研究综述 被引量:11
13
作者 王俊丽 魏绍臣 管敏 《计算机科学》 CSCD 北大核心 2015年第12期1-7,39,共8页
互联网技术的快速发展使得信息的采集和传播速度达到了空前的水平,海量的数据使得人们获取有价值的信息越发困难。自动文摘技术可以从海量的信息中提取出能代表原文重要内容且简洁精练的一段文字,高度压缩文档是解决信息超载问题的有效... 互联网技术的快速发展使得信息的采集和传播速度达到了空前的水平,海量的数据使得人们获取有价值的信息越发困难。自动文摘技术可以从海量的信息中提取出能代表原文重要内容且简洁精练的一段文字,高度压缩文档是解决信息超载问题的有效方法,因此自动文摘技术的研究引起人们越来越多的关注。目前诸如统计分析、机器学习技术以及语言学知识等在已有的自动文摘系统中都有所应用。对基于图排序算法的自动文摘的研究成果进行综述,首先阐述自动文摘以及图排序算法的基本知识,然后重点从图的构建、图排序、句子选择3个方面系统地介绍基于图排序算法的自动文摘的研究现状,最后在分析已有自动文摘系统的基础上,探讨了基于图排序算法的自动文摘的未来发展方向。 展开更多
关键词 自动文摘 图排序 图模型 文本挖掘
下载PDF
翻译研究方法论——语篇描写 被引量:21
14
作者 李运兴 《外语与外语教学》 北大核心 2001年第4期47-50,共4页
现代翻译研究的主导方法是对交际中的语篇进行充分语料基础上的描写,这是翻译研究的发展以及性质所决定的.文章讨论了描写的种类以及针对语篇级层、类型和翻译过程进行转换描写的基本内容.最后还简述了借鉴相关学科理论描写与理论建树... 现代翻译研究的主导方法是对交际中的语篇进行充分语料基础上的描写,这是翻译研究的发展以及性质所决定的.文章讨论了描写的种类以及针对语篇级层、类型和翻译过程进行转换描写的基本内容.最后还简述了借鉴相关学科理论描写与理论建树的关系问题. 展开更多
关键词 语篇 描写 级层 语篇类型 翻译过程
下载PDF
中文搜索引擎现状与展望 被引量:25
15
作者 都云程 卢献华 《中文信息学报》 CSCD 北大核心 1999年第3期61-64,F003,共5页
本文介绍了中文搜索引擎的发展现状,分析了中文搜索引擎中存在的问题,以及与国外先进的搜索引擎的差距,提出了中文搜索引擎的发展方向。
关键词 中文搜索引擎 全文检索 中文自动分词 搜索引擎
下载PDF
一种对动态网页的排名算法及其应用 被引量:1
16
作者 李慧 沈洁 +1 位作者 张舒 杨学凯 《扬州大学学报(自然科学版)》 CAS CSCD 2006年第3期59-62,共4页
针对目前普通搜索引擎无法对动态网页的查询结果进行有效索引与排序的问题,提出了一种对动态网页的排名算法Con ten tR ank,并介绍其在商务网站中的应用.该算法通过对与动态页面相关的内容进行挖掘分析,计算页面排名得分,从而实现对此... 针对目前普通搜索引擎无法对动态网页的查询结果进行有效索引与排序的问题,提出了一种对动态网页的排名算法Con ten tR ank,并介绍其在商务网站中的应用.该算法通过对与动态页面相关的内容进行挖掘分析,计算页面排名得分,从而实现对此类动态网页的查询结果的排序,提高排名的准确性. 展开更多
关键词 C0ntentrank 搜索排名 文本分类
下载PDF
基于自然语言处理的空管系统危险源文本分类方法研究 被引量:3
17
作者 郭九霞 《安全与环境学报》 CAS CSCD 北大核心 2022年第2期819-825,共7页
为了预防空管系统不安全事件的发生,利用人为因素分析与分类系统(HFACS)模型和自然语言处理技术,研究空管系统危险源文本分类方法。根据改进的HFACS模型建立空管系统危险源分类指标体系,选取民航空管安全管理系统的危险源数据库作为生... 为了预防空管系统不安全事件的发生,利用人为因素分析与分类系统(HFACS)模型和自然语言处理技术,研究空管系统危险源文本分类方法。根据改进的HFACS模型建立空管系统危险源分类指标体系,选取民航空管安全管理系统的危险源数据库作为生语料库,将其划分为5级,并对其进行编码。为解决空管系统危险源数据库小样本、多标签、样本不均衡的问题,分别采用基于TFIDF-TextRank关键词提取的文本分类方法和基于CNN和BERT模型的文本分类方法进行试验。结果表明,基于TFIDF-TextRank关键词提取的文本分类方法的精确率和召回率明显优于基于CNN和BERT模型的分类方法,关键词提取方法可以有效处理小语料库文本分类问题,并有助于进一步研究空管系统不安全事件的形成机理。 展开更多
关键词 安全社会工程 空管系统 危险源 HFACS模型 TFIDF-textrank方法 文本分类
下载PDF
学术文本的结构功能识别--在关键词自动抽取中的应用 被引量:32
18
作者 方龙 李信 +1 位作者 黄永 陆伟 《情报学报》 CSSCI CSCD 北大核心 2017年第6期599-605,共7页
当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提... 当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,证明了学术文本结构功能特征在关键词自动提取上的重要性。 展开更多
关键词 结构功能 关键词提取 学术文本 支持向量机 学习排序
下载PDF
科技信息资源内容监测与分析服务平台概况 被引量:3
19
作者 徐硕 乔晓东 +1 位作者 朱礼军 张运良 《数字图书馆论坛》 2011年第11期38-44,共7页
为了方便研究者分析领域的研究动态,了解领域内研究的重要研究者和重要文献,并对科技文献和科技工作者的工作进行准确的评价,作者借助国家科技图书文献中心(NSTL)雄厚的资源优势,联合清华大学等有关优势单位,共同开发了面向西文... 为了方便研究者分析领域的研究动态,了解领域内研究的重要研究者和重要文献,并对科技文献和科技工作者的工作进行准确的评价,作者借助国家科技图书文献中心(NSTL)雄厚的资源优势,联合清华大学等有关优势单位,共同开发了面向西文资源的科技信息资源内容监测与分析服务平台,该平台具有专家、期刊/会议和关键词统一检索功能,具有研究者关联路径发现、主题发现等功能,并且内嵌了专家和论文排名功能。 展开更多
关键词 知识服务 话题模型 关联路径 排名 全文索引
下载PDF
论高校教师专业技术职务聘任条件——基于地方本科院校制度文本分析 被引量:5
20
作者 李泽彧 陈杰斌 《国家教育行政学院学报》 CSSCI 北大核心 2015年第9期64-69,共6页
教师是地方本科院校转型和质量提升的主体和执行人,职务聘任条件作为教师的重要评价指标具有导向功能,同时地方本科院校聘任条件应与其学校定位相匹配。分析部分已经改革省份、高校的职称聘任条件的制度文本显示,由于更适应地方本科院... 教师是地方本科院校转型和质量提升的主体和执行人,职务聘任条件作为教师的重要评价指标具有导向功能,同时地方本科院校聘任条件应与其学校定位相匹配。分析部分已经改革省份、高校的职称聘任条件的制度文本显示,由于更适应地方本科院校发展的需求和教师能力、教学工作、教研科研业绩等要求,因此自定聘任条件、自主聘任是此类院校之大势所趋。 展开更多
关键词 地方本科院校 职称聘任条件 制度文本分析
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部