期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
技术密集型企业的创新能力及其对实体经济的影响分析
1
作者 浦墨 李岩 +1 位作者 孟庆斌 高影繁 《科技管理研究》 CSSCI 2024年第7期27-34,共8页
为研究技术密集型企业的创新能力并探究其对国家实体经济的影响情况,参照A股市场通用的交易性成分指数拟合方式,从上市企业中遴选出300家技术密集型上市企业样本并编制能表征技术密集型企业这个群体的市场表现指标—技术密集型企业300,... 为研究技术密集型企业的创新能力并探究其对国家实体经济的影响情况,参照A股市场通用的交易性成分指数拟合方式,从上市企业中遴选出300家技术密集型上市企业样本并编制能表征技术密集型企业这个群体的市场表现指标—技术密集型企业300,进而以此为基础从市场表现、产业结构和区域分布情况等方面探究技术密集型企业的创新能力,同时借助自向量回归模型(VAR)的构建和脉冲响应函数的分析探究技术密集型企业对国家实体经济的影响情况。技术密集型企业的整体表现优于蓝筹企业,传统制造企业是其科技创新的主力军,重点分布于首都北京及东南沿海地区,其市场表现对实体经济的重要组成部分工业和消费呈现出正向影响,且对科技含量较高的工业影响最大。 展开更多
关键词 技术密集型企业 技术创新能力 实体经济
下载PDF
基于科技文献的锡铟材料知识图谱构建研究
2
作者 李岩 彭巨擘 高影繁 《中国科技资源导刊》 2024年第5期19-27,共9页
随着科技文献数量的爆发性增长,垂直领域的企业面临着知识服务的挑战。为了帮助新材料领域企业有效利用科技文献信息资源,迫切需要使用人工智能技术对包含的材料性能等关键知识的专利及学术论文进行深入的知识建模,提供知识获取效率和... 随着科技文献数量的爆发性增长,垂直领域的企业面临着知识服务的挑战。为了帮助新材料领域企业有效利用科技文献信息资源,迫切需要使用人工智能技术对包含的材料性能等关键知识的专利及学术论文进行深入的知识建模,提供知识获取效率和准确性。以锡铟贵金属领域的10.48万篇科技文献为数据源,构建领域知识本体,利用BERT+BiLSTM+CRF模型进行命名实体识别,利用BERT+BiGRU神经网络模型进行关系抽取,将抽取结果存入图数据库Neo4j中并构建锡铟贵金属材料领域的知识图谱。所构建的知识图谱拥有18.19万个实体节点和23.47万条关系,能够实现多粒度的材料实体和关系的关联查询与可视化。基于锡铟科技文献构建知识图谱的方法拓展了新材料领域知识图谱构建的研究思路,为开展基于科技文献的垂直领域智能知识问答等应用提供了坚实的基础。 展开更多
关键词 材料学 知识图谱 命名实体识别 关系抽取 图数据库
下载PDF
跨语言文本分类技术研究进展 被引量:5
3
作者 高影繁 王惠临 徐红姣 《情报理论与实践》 CSSCI 北大核心 2010年第11期126-128,104,共4页
本文以综述的形式对跨语言文本分类技术目前的发展态势进行了介绍,从应用背景出发,了解跨语言文本分类技术的社会需求;从关键技术出发,了解该项技术的核心问题及解决方案;从已有研究成果得到的结论揭示了该项技术的发展状况,作为一种重... 本文以综述的形式对跨语言文本分类技术目前的发展态势进行了介绍,从应用背景出发,了解跨语言文本分类技术的社会需求;从关键技术出发,了解该项技术的核心问题及解决方案;从已有研究成果得到的结论揭示了该项技术的发展状况,作为一种重要的多语信息组织手段,跨语言文本分类技术发展前景广阔。 展开更多
关键词 跨语言文本分类 特征提取 算法
下载PDF
主题图在突发事件应急信息分析中的应用研究 被引量:8
4
作者 高影繁 李颖 孟令恩 《情报理论与实践》 CSSCI 北大核心 2016年第6期115-119,共5页
对突发事件进行快速有效的识别和分析处理,对信息需求者得出合理的应对策略是非常有价值的。文章以主题图为工具,充分利用主题图灵活的知识组织和信息导航优势,将复杂事件按照不同的视角进行主题和主题关联抽取,降低了知识结构的构建难... 对突发事件进行快速有效的识别和分析处理,对信息需求者得出合理的应对策略是非常有价值的。文章以主题图为工具,充分利用主题图灵活的知识组织和信息导航优势,将复杂事件按照不同的视角进行主题和主题关联抽取,降低了知识结构的构建难度;同时,利用主题图合并技术,合并不同主题图中的相同或相似主题、主题关联,从而使得复杂事件整体知识结构的还原成为可能。基于主题图的信息组织方法为突发事件应急中的信息分析提供了新的思路,也是文章的新颖性所在。 展开更多
关键词 突发事件 应急管理 主题图 事件分解
下载PDF
文本分类中影响因素的定量分析 被引量:2
5
作者 高影繁 马润波 刘玉树 《计算机工程》 CAS CSCD 北大核心 2008年第9期222-224,共3页
基于包含全部特征的类别特征数据库,利用基于距离度量的Rocchio算法、FastTC算法和基于概率模型的NB算法,从定量的角度来分析停用词、词干合并、数字和测试文档长度4个因素对文本分类精度的影响程度。实验表明,过滤停用词方法是一种无... 基于包含全部特征的类别特征数据库,利用基于距离度量的Rocchio算法、FastTC算法和基于概率模型的NB算法,从定量的角度来分析停用词、词干合并、数字和测试文档长度4个因素对文本分类精度的影响程度。实验表明,过滤停用词方法是一种无损的特征压缩手段,词干合并虽然对分类精度略有减弱,但仍能保证特征压缩的可行性。数字与其他词汇的语义关联性提高了Rocchio算法和FastTC算法的分类精度,但降低了视特征彼此独立的NB算法的分类精度。3种算法在测试文档取不同数量的关键词时分类精度的变化趋势说明了特征所包含的有益信息和噪音信息对分类精度的影响。 展开更多
关键词 类别特征信息库 影响因素 分类效率
下载PDF
查询分类在跨语言检索中的应用研究 被引量:2
6
作者 高影繁 王惠临 徐红姣 《情报学报》 CSSCI 北大核心 2011年第4期366-371,共6页
文章旨在探讨查询分类技术和跨语言检索技术的关系,前者的应用能否改善后者的系统性能是核心问题。首先提出一种基于查询分类的标准化折扣累积增量评价指标,通过对采用查询分类技术前后信息检索系统的标准化折扣累积增量评价指标的变化... 文章旨在探讨查询分类技术和跨语言检索技术的关系,前者的应用能否改善后者的系统性能是核心问题。首先提出一种基于查询分类的标准化折扣累积增量评价指标,通过对采用查询分类技术前后信息检索系统的标准化折扣累积增量评价指标的变化进行判断,来检验该评价指标的可用性和有效性。同时,查询分类可以作为降低跨语言检索系统查询翻译的歧义性的技术手段。对大规模查询集随机抽样的查询翻译实验结果表明,本文提出的基于查询分类的查询翻译消歧方法对大部分查询有效,在一些情况下甚至可以直接通过本方法完成查询翻译。结合其他方法进一步消除翻译的歧义性则是下一步的工作内容。 展开更多
关键词 标准化折扣累积增量 查询分类 查询翻译消歧算法
下载PDF
基于跨语言文本分类的跨语言特征提取方法研究 被引量:2
7
作者 高影繁 王惠临 徐红姣 《情报学报》 CSSCI 北大核心 2011年第12期1242-1248,共7页
随着文本分类算法的实用化和多语种信息的日益丰富,当机构或组织的文档管理部门日益依赖自动文本分类时,如何解决多语种文档的归类问题成为新的研究热点,跨语言文本分类技术就是在这样的背景下提出的。本文以国家图书文献中心(NSTL... 随着文本分类算法的实用化和多语种信息的日益丰富,当机构或组织的文档管理部门日益依赖自动文本分类时,如何解决多语种文档的归类问题成为新的研究热点,跨语言文本分类技术就是在这样的背景下提出的。本文以国家图书文献中心(NSTL)的多语种语料为研究对象,以一部科技类的汉英科技词典为资源工具,提出了一种基于跨语言文本分类的跨语言特征提取方法,实验结果验证了在简单翻译资源条件下对科技文献进行跨语言分类的可行性,也为下一阶段建立实用跨语言文类系统奠定了基础。 展开更多
关键词 最长短语识别 类别信息消歧 特征提取
下载PDF
双语句对翻译众包辅助平台设计与实现 被引量:3
8
作者 高影繁 李辉 +1 位作者 徐红姣 崔笛 《情报工程》 2017年第3期86-96,共11页
本文提出了一种采用众包工作模式的科技领域日汉机器翻译辅助平台的构建方法。在充分调研众包生产模式、质量控制等研究和实践的基础上,设计了集用户管理、团队管理、语料管理、机器辅助翻译、术语辅助翻译等功能为一体的双语句对生产平... 本文提出了一种采用众包工作模式的科技领域日汉机器翻译辅助平台的构建方法。在充分调研众包生产模式、质量控制等研究和实践的基础上,设计了集用户管理、团队管理、语料管理、机器辅助翻译、术语辅助翻译等功能为一体的双语句对生产平台,针对不同角色和不同技术类别分别构建出相应的功能模块。该平台在众包工作模式的基础上结合了多源信息辅助译者完成翻译,翻译效率高且翻译成本低,平台的开发和运行为科技领域实用型日汉机器翻译系统的建设提供了有力支撑。 展开更多
关键词 众包 双语语料建设 机器翻译辅助平台
下载PDF
一种专利与企业相关性测度方法 被引量:1
9
作者 高影繁 王峥 +2 位作者 胡小荣 姚长青 梁娜 《情报学报》 CSSCI CSCD 北大核心 2019年第12期1268-1274,共7页
随着我国企业每年专利申请量的不断增多,一些专利申请乱象日渐显现:国家为专利申请制定了扶持与鼓励政策,有的企业为了争取这些政策奖励而胡乱申报或购买对于企业发展与利润提升无积极影响、且与企业主营产品无关的专利。在这种背景下,... 随着我国企业每年专利申请量的不断增多,一些专利申请乱象日渐显现:国家为专利申请制定了扶持与鼓励政策,有的企业为了争取这些政策奖励而胡乱申报或购买对于企业发展与利润提升无积极影响、且与企业主营产品无关的专利。在这种背景下,专利与企业相关性测度研究就成为一个有价值的研究课题。针对当前专利与企业相关性判断依赖领域专家的主观评价现状,提出一种专利与企业相关性的自动测度方法,为传统主观评价方法提供替代思路。采用信息论与深度学习方法进行专利的标引词识别,通过测度专利标引词在企业文本的映射程度来实现专利与企业相关性的自动量化。本研究对环保企业专利与企业相关性做整体评价判断,在任意选取的4325份环保领域专利中,有4065个一致性结果,260个不一致结果,其准确率达到94%,验证了本文方法的可行性。 展开更多
关键词 专利与企业相关性 短语抽取 词向量过滤 标引词权重
下载PDF
一种快速文本归类算法的设计与实现 被引量:1
10
作者 高影繁 马润波 刘玉树 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第12期1069-1072,共4页
为实现无维数约减技术而使分类算法可行且不浪费空间存储的超稀疏文档向量,同时保证分类精度和速度且两者相互独立的目标,提出使用类别特征信息数据库、类别特征权重向量模型、待归类文档压缩向量表示法和改进的Rocchio分类算法等技术... 为实现无维数约减技术而使分类算法可行且不浪费空间存储的超稀疏文档向量,同时保证分类精度和速度且两者相互独立的目标,提出使用类别特征信息数据库、类别特征权重向量模型、待归类文档压缩向量表示法和改进的Rocchio分类算法等技术实现文档的高速归类.在相同的Reuters测试语料集上,与CRF算法和改进的kNN算法进行对比实验.结果表明,在基本不牺牲精度的情况下,归类算法的分类速度明显高于对比算法. 展开更多
关键词 类别特征库 类别特征权重向量模型 压缩文档向量表示
下载PDF
基于过滤与权重平滑策略的自动标引方法研究 被引量:1
11
作者 高影繁 徐红姣 杜枫 《情报理论与实践》 CSSCI 北大核心 2014年第2期103-106,共4页
文章提出一种基于过滤和权重平滑策略的标引词自动抽取方法,该方法采用可变停用词作为文档分隔手段,采用词性、词频、词语位置等信息作为标引词过滤的手段,采用合理的权重倾向策略保证了标引词抽取在词组和单词中的均衡。方法综合利用... 文章提出一种基于过滤和权重平滑策略的标引词自动抽取方法,该方法采用可变停用词作为文档分隔手段,采用词性、词频、词语位置等信息作为标引词过滤的手段,采用合理的权重倾向策略保证了标引词抽取在词组和单词中的均衡。方法综合利用了词性标注等自然语言处理领域的研究成果和统计学信息,不依赖词汇在文档集中的分布规律,可以直接从单篇文档抽取标引词,在待标引文档篇幅受限的情况下具有良好的运行性能。 展开更多
关键词 词性过滤规则 权重 自动标引
下载PDF
基于多重过滤策略的科技文献自动标引方法研究 被引量:1
12
作者 高影繁 徐红姣 王惠临 《情报理论与实践》 CSSCI 北大核心 2012年第12期98-100,110,共4页
文章提出一种基于多重过滤策略的科技文献自动标引方法,该方法不依赖于大规模训练语料,很容易作为处理模块嵌入到其他文本处理环节中,实验结果验证了方法的可行性。另外,还提出了一种基于二次文献的标引词评价方法。该方法虽然严重依赖... 文章提出一种基于多重过滤策略的科技文献自动标引方法,该方法不依赖于大规模训练语料,很容易作为处理模块嵌入到其他文本处理环节中,实验结果验证了方法的可行性。另外,还提出了一种基于二次文献的标引词评价方法。该方法虽然严重依赖于二次文献中给出的摘要和关键词的质量,但在人力和物力资源不足以支持建立一个高质量测试集的条件下是有价值的,制定更加合理有效的评测方案势在必行。 展开更多
关键词 多重过滤 科技文献 自动标引
下载PDF
一种面向复杂多值属性的本体存储方法研究 被引量:1
13
作者 高影繁 刘娟 王惠临 《情报理论与实践》 CSSCI 北大核心 2010年第9期111-115,共5页
随着本体种类和资源的增加,本体的结构越来越复杂,如何合理地存储各种结构类型的本体、支持高效的本体查询是一项很有意义且具有挑战性的课题。本文提出一种面向复杂多值属性的本体存储方法,采用与传统的本体分解存储模式不同的数据库... 随着本体种类和资源的增加,本体的结构越来越复杂,如何合理地存储各种结构类型的本体、支持高效的本体查询是一项很有意义且具有挑战性的课题。本文提出一种面向复杂多值属性的本体存储方法,采用与传统的本体分解存储模式不同的数据库模式分解方法,将单属性值资源与多属性值资源的存储分别处理来解决资源与属性值之间的复杂关系问题,并通过对资源和其属性值的统一存储来解决存储冗余问题。实验结果验证了该本体存储方法在获取复杂本体关系方面的优势,但同时也暴露出模式结构的易理解性与模式的查询效率之间的矛盾,在此基础上提出了修正存储模式的折中方案,实验表明查询资源的速度比原来方案基本快了一个数量级,但这是以冗余的多个表结构为代价的。 展开更多
关键词 本体 数据存储 数据库
下载PDF
基于跨语言文本分类的多语资源组织方法研究
14
作者 高影繁 徐红姣 +1 位作者 于薇 王惠临 《情报理论与实践》 CSSCI 北大核心 2011年第10期101-103,108,共4页
文章以国家图书文献中心(NSTL)的多语种科技语料为研究对象,以一部科技类的英汉双语科技词典为资源工具,提出一种英汉跨语言文本分类系统的构建方法,实验结果验证了采用本方法进行跨语言分类的可行性,也为下一阶段建立跨语言分类实用系... 文章以国家图书文献中心(NSTL)的多语种科技语料为研究对象,以一部科技类的英汉双语科技词典为资源工具,提出一种英汉跨语言文本分类系统的构建方法,实验结果验证了采用本方法进行跨语言分类的可行性,也为下一阶段建立跨语言分类实用系统奠定了基础。 展开更多
关键词 文本分类 翻译词典 信息资源 算法
下载PDF
基于非线性规划理论的事件主题词过滤方法
15
作者 高影繁 苏娜 +1 位作者 张运良 韩红旗 《情报学报》 CSSCI CSCD 北大核心 2018年第1期61-67,共7页
本文提出一种基于非线性规划理论的突发事件主题词自动过滤方法。首先以左右邻接熵为主题短语的边界识别依据,选出更具信息量的短语作为候选主题词,然后通过将候选主题词回溯原始文档集合的方式过滤掉部分噪声词,最后采用基于非线性规... 本文提出一种基于非线性规划理论的突发事件主题词自动过滤方法。首先以左右邻接熵为主题短语的边界识别依据,选出更具信息量的短语作为候选主题词,然后通过将候选主题词回溯原始文档集合的方式过滤掉部分噪声词,最后采用基于非线性规划理论的函数,对抽取到的候选主题词按权重进行排序,选定更具突发事件类别表征能力的主题词。在几个类别突发事件语料上与传统的TF-IDF算法的对比实验结果说明了本文方法的有效性和实用价值。 展开更多
关键词 突发事件主题词 左右邻接熵 噪声词过滤 非线性规划理论
下载PDF
一种基于泊松估计的可控特征选择算法
16
作者 高影繁 王惠临 《情报学报》 CSSCI 北大核心 2010年第3期408-413,共6页
特征选择是文本分类的关键技术之一。本文提出一种基于泊松估计的可控特征选择算法,该算法以基于泊松假设估算的文档频率作为衡量特征语义信息的依据,以通信领域中的信息率失真理论作为可控特征选择的思想来源。在Reuters-21578新闻语... 特征选择是文本分类的关键技术之一。本文提出一种基于泊松估计的可控特征选择算法,该算法以基于泊松假设估算的文档频率作为衡量特征语义信息的依据,以通信领域中的信息率失真理论作为可控特征选择的思想来源。在Reuters-21578新闻语料上进行的实验结果表明,基于泊松估计的特征选择算法性能优于基于语义的WN算法和同样基于统计的IG、Chi2等算法;在以特征漏选率作为信息率失真函数的前提下,设定分类算法分类指标下限值,则可以通过改变特征漏选率得到任意的分类精度值。实验表明本文算法在与相关算法的对比中存在优势。算法思想来源于通信领域中的信息率失真理论,也是一种在领域融合方面的崭新尝试。 展开更多
关键词 泊松估计 语义特征 率失真理论 可控特征选择
下载PDF
台风眼效应中的突发事件舆情数据分析方法
17
作者 高影繁 李岩 +2 位作者 浦墨 郑明 翟云 《情报工程》 2020年第2期4-11,共8页
心理学家用"台风眼效应"表征人们离危机事件中心的距离越远、反应越强的心理现象。突发事件发生以后,网络舆情数据通常会呈现铺天盖地、汹涌澎湃之势。在这种情况下,如何去除舆情数据中的心理、情绪等主观信息,为民众中的不... 心理学家用"台风眼效应"表征人们离危机事件中心的距离越远、反应越强的心理现象。突发事件发生以后,网络舆情数据通常会呈现铺天盖地、汹涌澎湃之势。在这种情况下,如何去除舆情数据中的心理、情绪等主观信息,为民众中的不同层次主体呈现客观的事件描述,缓解由于信息不对称所带来的台风眼效应问题成为了一个有价值的研究课题。本文结合科技文本的短语识别方法,通过突发事件典型特征词与科技类短语的联合检索实现对舆情信息的过滤,利用可视化主题聚类和热点分析工具实现了对突发事件舆情数据的客观描述,为台风眼效应中信息不对称问题的解决提供了新思路。 展开更多
关键词 台风眼效应 信息不对称 短语识别 舆情信息过滤
下载PDF
军事情报文本分类中的维数约减技术
18
作者 高影繁 刘玉树 《火力与指挥控制》 CSCD 北大核心 2008年第5期5-8,13,共5页
为保证军事指挥决策的质量和速度、提高军事情报文本的分析能力,高效率的自动文本分类成为其中的重要技术。描述了文本分类所面临的高维稀疏文本空间和维数灾难等问题,综述了各种寻找最优和次优子集的特征选择技术和以主成分分析、Fishe... 为保证军事指挥决策的质量和速度、提高军事情报文本的分析能力,高效率的自动文本分类成为其中的重要技术。描述了文本分类所面临的高维稀疏文本空间和维数灾难等问题,综述了各种寻找最优和次优子集的特征选择技术和以主成分分析、Fisher判别分析、潜在语义索引等为代表的特征抽取技术,并指出了目前存在的技术问题和未来的工作方向。 展开更多
关键词 情报文本分类 特征选择 特征抽取
下载PDF
基于风险短语自动抽取的上市公司风险识别方法及可视化研究 被引量:13
19
作者 胡小荣 姚长青 高影繁 《情报学报》 CSSCI CSCD 北大核心 2017年第7期663-668,共6页
上市公司作为证券市场的基石,其财务状况与风险信息是众多投资者与研究人员的关注焦点,而上市公司年报中的风险信息披露字段因其权威性与公开性成为研究者评估上市公司风险的研究依据。目前针对风险信息披露字段内容的研究仅停留在基于... 上市公司作为证券市场的基石,其财务状况与风险信息是众多投资者与研究人员的关注焦点,而上市公司年报中的风险信息披露字段因其权威性与公开性成为研究者评估上市公司风险的研究依据。目前针对风险信息披露字段内容的研究仅停留在基于分词与词频统计的风险分析层面,而单个的词并不能很好地揭示不同风险主题的具体表现和语义内容。本文采用基于多因素拟合的风险短语识别技术,对沪深两市环保行业76家上市公司年报中"风险因素"的文字描述字段进行处理,得到环保行业不同风险主题文本中的主题短语,最后使用jQCloud词云图对风险主题短语进行可视化展示。 展开更多
关键词 上市公司风险评估 互信息 左右熵 多因素拟合 可视化
下载PDF
面向对象角色分析和建模方法研究
20
作者 高影繁 《微机发展》 2002年第2期72-74,共3页
面向对象角色分析方法OOram (Object -OrientedRoleAnalysisandModeling)是一种新的面向对象软件开发方法。文章介绍了它的建模思想、步骤和
关键词 面向对象角色分析 OOram 软件开发 建模 角色模型
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部