-
题名信息检索的核心支撑技术
被引量:2
- 1
-
-
作者
施水才
-
机构
北京拓尔思信息技术有限公司
-
出处
《中国计算机用户》
2003年第29期51-51,共1页
-
文摘
信息检索(Information Retrieval),通常指文本信息检查,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。
-
关键词
信息检索
手工检索
计算机检索
核心
网络化
历史
文本信息
存取
查询
索引
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
G252
[文化科学—图书馆学]
-
-
题名揭示“信息冰山”的真面目——内容管理的核心技术
被引量:1
- 2
-
-
作者
韩啸
-
机构
北京拓尔思(TRS)信息技术有限公司研发中心
-
出处
《中国计算机用户》
2004年第19期54-54,共1页
-
文摘
小A是一家咨询公司的业务骨干,面对繁忙的咨询工作,平均每天至少要花2小时来搜索所需信息。而且随着信息格式的多样化,小A发现结构化的数据越来越难以满足工作的需要。相反,大量诸如文档、邮件、声频、视频等类型的信息却越来越重要,而公司对这些信息的管理始终不得章法。 其实,小A的困惑在“信息爆炸”年代是一种普遍现象,人们在惊诧信息增长速度的同时,发现除关系型数据之外的大量非结构化数据,没有得到妥善管理。小A在咨询关于非结构化数据管理措施时,专家向他介绍了内容管理。至此,小A明白,他日常所能自如应用的数据只是“信息冰山”的一角。
-
关键词
信息
核心技术
内容管理
增长速度
公司
业务骨干
关系型
非结构化数据
文档
邮件
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名新媒体技术平台建设思考
- 3
-
-
作者
施水才
-
机构
北京拓尔思信息技术股份有限公司
-
出处
《中国传媒科技》
2014年第15期16-17,共2页
-
文摘
新媒体对传统媒体的冲击是传统媒体必须面对的挑战,而传统媒体和新媒体的融合发展是当前的重要任务和机遇。在这个过程中,必须高度关注技术创新的作用,因为新媒体的爆发很大程度上是因为技术革命所引起的。
-
关键词
新媒体技术
平台建设
传统媒体
融合发展
技术创新
技术革命
-
分类号
F713.82
[经济管理—广告]
-
-
题名面向互联网舆情的热词分析技术
被引量:17
- 4
-
-
作者
李渝勤
孙丽华
-
机构
北京信息科技大学
北京拓尔思信息技术股份有限公司
-
出处
《中文信息学报》
CSCD
北大核心
2011年第1期48-53,59,共7页
-
基金
国家863计划重点资助项目(2006AA010105)
国家自然科学基金资助项目(60772081)
北京市教委科技发展计划资助项目(KM200910772022)
-
文摘
热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题。该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究。在热词发现阶段,首先采用命名实体识别技术和高频串统计技术进行短语串的挖掘,继而采用基础权值和波动权值两项指标进行热度权值的计算。在热词关联阶段,按热词权值高低进行热词类的划分,通过同现率的原则确定热词类之间的关联计算。该文所采用的方法已经成功应用到TRS舆情监测系统的热点发现模块。
-
关键词
热词
命名实体识别
热度计算
波动权值
词群关系
-
Keywords
hot words
named entity identification
hot degree computing
weight fluctuations
words relationship
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名用于产品信息评价的术语库构建及应用
- 5
-
-
作者
苏祺
李芸
王洪俊
-
机构
北京大学计算语言学研究所
中国社会科学院语言研究所
北京拓尔思信息技术有限公司
-
出处
《术语标准化与信息技术》
2006年第1期33-36,共4页
-
文摘
对网页内容中包含的产品信息进行自动褒贬义评价,能够为用户提供对其所关心产品的一个直观认识。进行这样的自动褒贬义评价计算需要有一个专业术语库支持。本文以汽车产品为例, 介绍了如何设计并构建一个面向产品信息评价的汽车术语库,并分析了术语库在产品信息评价中的应用方法。
-
关键词
术语库
产品信息评价
-
Keywords
terminology database, produce information evaluation
-
分类号
F270.7
[经济管理—企业管理]
U461.6
[机械工程—车辆工程]
-
-
题名基于新型主题信息量化方法的Web主题信息提取研究
被引量:1
- 6
-
-
作者
吕聚旺
都云程
王弘蔚
施水才
-
机构
北京信息科技大学中文信息处理研究中心
北京拓尔思信息技术股份有限公司
-
出处
《现代图书情报技术》
CSSCI
北大核心
2008年第12期48-53,共6页
-
基金
国家863计划重点项目“跨媒体搜索关键技术研究及服务产品开发”(项目编号:2006AA010105)
国家自然科学基金项目“基于语义的中文文本聚类研究”(项目编号:60772081)
北京市属市管高校人才强教计划项目“创新团队-智能搜索引擎和文本挖掘”(项目编号:PXM2007_014224_044677)的研究成果之一
-
文摘
针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采用分治思想,先定位到包含主题信息的区域,后过滤噪音信息。实验证明本文提出的方法能够较好地解决主题信息自动提取存在的信息完整性和准确性的矛盾。
-
关键词
网页主题信息信息抽取信息块语义信息IB—DOM树
-
Keywords
Topic information of Web page
Information extraction
Information block
Semantic information
IB -DOM tree
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名“人民金典”语义检索系统实现方法和技术
被引量:2
- 7
-
-
作者
王洪俊
黄翬
-
机构
北京拓尔思信息技术股份有限公司
人民出版社
-
出处
《中国传媒科技》
2011年第4期74-77,共4页
-
文摘
为解决传统关键词检索技术的不足,人民出版社采用最新的语义检索技术,建立面向政治理论文献的语义模型,开发知识点标引平台来提取和整理文献中的各个知识点,将复杂的理论文献知识化、条理化,在此基础上建立多种语义检索模型,实现检索结果的去粗取精、去伪存真。最终实现的人民金典语义检索系统,已经在"人民出版社"网站经过一年多时间的运行,证明其知识点检索的语义准确率和有效率均达到了70%以上,其中"人民金典语义查询"系统的准确率达到95%以上。
-
关键词
语义检索系统
人民出版社
检索技术
知识点
语义模型
政治理论
检索模型
检索结果
-
分类号
G236
[文化科学]
-
-
题名媒体融合技术平台的建设实践
被引量:2
- 8
-
-
作者
林松涛
-
机构
北京拓尔思信息技术股份有限公司新闻出版事业部
-
出处
《传媒》
CSSCI
北大核心
2017年第14期32-34,共3页
-
文摘
2017年年初,中宣部部长刘奇葆在推进媒体深度融合工作座谈会上强调,推进媒体深度融合,要重点突破采编发流程再造这个关键环节,以“中央厨房”,即融媒体中心建设为龙头,创新媒体内部组织结构,构建新型采编发网络。
-
关键词
媒体融合
技术平台
实践
内部组织结构
流程再造
媒体中心
座谈会
刘奇葆
-
分类号
G206
[文化科学—传播学]
-
-
题名基于TRS控件的数字图书馆及信息整合应用研究
被引量:1
- 9
-
-
作者
金扬
韩伟亮
-
机构
湖北省电力试验研究院
北京拓尔思信息技术股份有限公司
-
出处
《湖北电力》
2010年第A01期127-128,共2页
-
文摘
借助TRS控件的内容管理及检索系统,构建了集信息管理,统一检索,专题制作,自建资源库(元数据)等于一体的综合性数字图书馆及资源整合平台,为电力科研技术人员提供方便、灵活的分类信息资源和综合的文献检索搜索服务。
-
关键词
数字图书馆
TRS
元数据
-
分类号
G250.76
[文化科学—图书馆学]
-
-
题名内容管理的关键技术
被引量:12
- 10
-
-
作者
韩啸
曹辉
-
机构
北京拓尔思信息技术有限公司
-
出处
《中国传媒科技》
2004年第5期44-45,共2页
-
文摘
内容管理是针对实际问题提出的解决方案,是人、过程与技术的集成,需要从人员组织、业务流程以及内容管理系统的建立等多方面共同协调实现。
-
关键词
内容管理
内容管理平台技术
XML技术
元数据技术
工作流管理技术
企业
应用集成技术
智能关联技术
内容挖掘技术
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
F270.7
[经济管理—企业管理]
-
-
题名基于页面结构分析的论坛主题信息定位方法研究
- 11
-
-
作者
陈雄
都云程
李渝勤
施水才
-
机构
北京信息科技大学中文信息处理研究中心
北京拓尔思信息技术股份有限公司
-
出处
《微计算机信息》
2010年第27期168-170,共3页
-
文摘
随着论坛中的用户不断增多,论坛中积存了大量的信息资源,为了能从论坛中提取出有效的主题信息,提出了一种通过分析页面结构的定位论坛主题信息的方法。该方法利用所有跟帖所在的节点在结构上相似的特点,计算各个节点的相似度,并利用总结的启发式规则提取特征,最后定位得到主题信息。实验表明,该方法具有较高的通用性和准确性。
-
关键词
信息抽取
论坛
节点相似度
-
Keywords
Information Extraction
BBS
Node Similarity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名用户差异性对信息服务模式的影响及对策
被引量:4
- 12
-
-
作者
何东炯
-
机构
北京拓尔思信息技术有限公司
-
出处
《中国传媒科技》
2004年第5期18-21,共4页
-
文摘
随着社会和经济的高速发展,信息搜集与利用问题越来越受到人们关注。目前,政府、企业、社会团体、行业组织乃至个人都会积极搜集信息并加以利用,用来辅助政策制定、市场分析、商业决策和个人行动决定。
-
关键词
用户差异性
信息服务模式
网络媒体
信息网络化
内容管理
个性化信息增值服务
-
分类号
G20
[文化科学—传播学]
-
-
题名政府公开目录系统的技术及应用
- 13
-
-
作者
孙丽华
曹辉
施水才
-
机构
北京拓尔思信息技术股份有限公司
-
出处
《数字图书馆论坛》
2008年第5期38-42,共5页
-
文摘
文章系统地阐述了政府信息公开目录系统的可行性,从资源层、编目层、渠道层和保障层等四个层次上详细论述了TRS的总体实现方案,并分别就四个层次介绍了TRS的实现技术,从而形成一个严格的开放的政府信息公开平台系统,为《政府信息公开条例》提供全面而先进的技术保障与支撑。
-
关键词
政府公开目录
数据挖掘
元数据
全文检索
-
Keywords
Government opening content data, Data mining, Metadata, Text retrieval
-
分类号
TP311.131
[自动化与计算机技术—计算机软件与理论]
D63
[政治法律—中外政治制度]
-
-
题名大数据技术与文化产业
- 14
-
-
作者
施水才
-
机构
北京拓尔思信息技术股份有限公司
-
出处
《新闻研究导刊》
2015年第20期9-9,共1页
-
文摘
在国家发展的今天,文化创意产业俨然离不开高科技的支持与帮助。在这些神秘的大数据技术背后,不仅为经济转型提供动力,还为政府提高了其治理能力。由此可以看出,大数据技术不单只是为经济做参考,同时也能为文化创意产业指引道路。
-
关键词
“一带一路”
大数据技术
文化产业
-
分类号
G124
[文化科学]
-
-
题名浅论中央厨房的技术平台建设
- 15
-
-
作者
林松涛
-
机构
北京拓尔思信息技术股份有限公司北京分公司新闻出版事业部
-
出处
《中国传媒科技》
2017年第3期39-40,共2页
-
文摘
在习总书记关于媒体融合发展的国家战略指导下,中央及各级地方和行业媒体等都在积极探索适合自身发展的媒体融合转型实践。从整个传媒行业来看,媒体融合发展是组织机构、工作机制和技术平台三位一体的融合和变革的过程。在移动互联网和社交新媒体的全社会普及背景下,伴随着大数据和人工智能等高新技术高速发展与成熟落地,媒体的内容创作与传播形态都呈现出多元化的特色。如何利用新兴技术来提升媒体的生产、传播、决策、指挥等业务应用成效,如何应用技术平台配套于集团融合发展的整体业务体系,成为媒体当下的重要工作之一。
-
关键词
媒体融合
技术平台建设
传媒行业
战略指导
效果监测
内容管理系统
跨媒体
传播分析
传播形态
媒体时代
-
分类号
F426.7
[经济管理—产业经济]
-
-
题名媒体公司要生存必须变成科技公司
- 16
-
-
作者
施水才
-
机构
北京拓尔思信息技术股份有限公司
-
出处
《中国传媒科技》
2015年第10期75-75,共1页
-
文摘
传统媒体正在加速衰退,断崖式下滑已经成为现实,其衰落的速度比人们预计的还要快很多。移动和社交已经全面颠覆了媒体的消费和传播方式,自媒体具有巨大的能量,未来的媒体是小型化的。
-
关键词
媒体公司
科技公司
传统媒体
传播方式
速度比
自媒体
小型化
-
分类号
G206.2
[文化科学—传播学]
-
-
题名走出报业新闻信息服务的困境
- 17
-
-
作者
施水才
高建国
-
机构
北京拓尔思信息技术有限公司
-
出处
《中国传媒科技》
2004年第12期49-51,共3页
-
-
关键词
中国报业
新闻信息服务
跨媒体
传媒集团
困境
竞争压力
目标
行业
外资
改革
-
分类号
G219
[文化科学—新闻学]
G222
[文化科学]
-
-
题名内容管理技术在金融行业的应用
- 18
-
-
-
机构
北京拓尔思(TRS)信息技术有限公司
-
出处
《华南金融电脑》
2005年第8期82-82,共1页
-
文摘
改革开放 20多年来,中国金融行业的信息化建设从无到有、从单一业务向综合业务发展,并从根本上改变了传统金融业务的处理模式,建立了以计算机和互联网为基础的电子清算系统.
-
关键词
金融行业
内容管理技术
应用
业务发展
信息化建设
改革开放
处理模式
金融业务
清算系统
-
分类号
F830.49
[经济管理—金融学]
TN948.61
[电子电信—信号与信息处理]
-
-
题名核心的转变——内容管理在传媒信息化中的作为
- 19
-
-
作者
施水才
陈仕军
陈一宏
-
机构
北京拓尔思(TRS)信息技术有限公司
南方日报报业集团新闻信息中心
-
出处
《中国传媒科技》
2004年第5期9-13,共5页
-
文摘
南方报业是我国第一家省级党委机关报组建的报业集团,1998年5日18日成立至今,已迅速形成以报业为主体,横跨出版、信息、印刷、广告、物流配送和实业拓展等产业的媒体军团。
-
关键词
内容管理
传媒信息化
南方报业集团
内容挖掘
智能关联技术
内容检索技术
信息技术
-
分类号
G219.24
[文化科学—新闻学]
G210.7
[文化科学—新闻学]
-
-
题名整合新闻内容 拓展知识服务
- 20
-
-
作者
施水才
-
机构
北京拓尔思信息技术有限公司
-
出处
《中国传媒科技》
2003年第11期23-26,20,共5页
-
-
关键词
中国
传媒业
行业分析
知识服务
IT技术
网络媒体
-
分类号
G219.2
[文化科学—新闻学]
-