期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
汉语分词系统中的信息集成和最佳路径搜索方法 被引量:13
1
作者 沈达阳 孙茂松 黄昌宁 《中文信息学报》 CSCD 北大核心 1997年第2期34-47,共14页
复杂的汉语分词系统中,各种信息的有效集成是系统实现的关键。本文介绍了分调系统SegTag中信息集成方法,并讨论了信息集成结构中的两种最佳路径搜索方法。最后,我们给出实验结果和结论。
关键词 汉语分词 词性标注 信息集成 最佳路径搜索
下载PDF
万维网知识挖掘方法的研究 被引量:14
2
作者 沈达阳 孙茂松 《计算机科学》 CSCD 北大核心 2000年第2期79-82,共4页
1.引言万维网(World Wide Web)的出现使计算机拥有海量的信息资源,然而这些信息却很少以计算机可理解的结构存在,因为,万维网上的页面本来就是以人,而不是计算机为其阅读对象的。因此,复杂的文本结构、图像、声音等多种信息的存在,既把... 1.引言万维网(World Wide Web)的出现使计算机拥有海量的信息资源,然而这些信息却很少以计算机可理解的结构存在,因为,万维网上的页面本来就是以人,而不是计算机为其阅读对象的。因此,复杂的文本结构、图像、声音等多种信息的存在,既把万维网变成一种丰富多采的媒体,又造成了计算机对万维网信息进一步处理的障碍。 展开更多
关键词 万维网 知识挖掘 WEB INTERNET网
下载PDF
Internet上的软件Agent 被引量:17
3
作者 沈达阳 林作铨 《计算机科学》 CSCD 北大核心 1997年第4期14-19,共6页
本文首先介绍Agent的基本概念及其相关理论、体系结构和语言。然后较详细地介绍软件Agent方面的典型工作。最后,阐释Internet软件Agent有关思想,并给出一些相应的研究结果。
关键词 AGENT 软件 INTERNET
下载PDF
Internet中文个人信息搜索 被引量:7
4
作者 沈达阳 孙茂松 《中文信息学报》 CSCD 北大核心 1999年第2期24-32,共9页
本文构造了一个用于自动生成Internet个人信息索引的实验系统PersonIndexer。在CERNET两个网址上进行的初步实验表明,PersonIndexer对中文姓名、拼音人名、中文机构名的召回率和精确率平均分... 本文构造了一个用于自动生成Internet个人信息索引的实验系统PersonIndexer。在CERNET两个网址上进行的初步实验表明,PersonIndexer对中文姓名、拼音人名、中文机构名的召回率和精确率平均分别为97.8%和61.9%、100%和64.5%、94.5%和92.1%,对电子邮件地址和电话传真号码的召回率和精确率均为100%。鉴于Internet上的信息检索以及自然语言处理这两个领域都互向对方提出了要求,我们相信,面向大规模真实文本的汉语分析技术与Internet的结合。 展开更多
关键词 中文姓名辨识 个人信息搜索 INTERNET 信息处理
下载PDF
Internet的信息收集Agent及其搜索方法 被引量:4
5
作者 沈达阳 林作铨 陈智健 《计算机系统应用》 1998年第5期18-21,共4页
本文首先介绍了Internet上Agent技术的重要性和信息结构,接着阐明了Internet信息收集Agent的功能及其信息搜索算法,并进一步描述其具体实现的体系结构。
关键词 信息收集 信息搜索 INTERNET网 AGENT
下载PDF
Intranet搜索索引自动生成工具Weblndex 被引量:1
6
作者 沈达阳 于斌 林作铨 《计算机系统应用》 1999年第2期24-27,共4页
本文在分析几种典型Internet搜索引擎的基础上,设计实现了一种面向Intranet的信息收集agent,着重阐述了WebIndex,一个基于IICA体系的Intranet搜索索引自动生成工具。该系统克服了现有产品... 本文在分析几种典型Internet搜索引擎的基础上,设计实现了一种面向Intranet的信息收集agent,着重阐述了WebIndex,一个基于IICA体系的Intranet搜索索引自动生成工具。该系统克服了现有产品的一些缺点,在系统的可伸缩性、可移植性和中文处理能力方面有明显的改进。 展开更多
关键词 搜索引擎 索引生成器 Weblndex INTRANET网
下载PDF
基于统计的汉语分词模型及实现方法 被引量:6
7
作者 沈达阳 孙茂松 黄昌宁 《中文信息》 1998年第2期96-98,共3页
本文介绍了一种基于统计的汉语分词模型以及该模型在不同资源要求下的实现方法,并进一步讨论了这种方法的优缺点,最后,作者实现了这些方法,并给出相应的实验结果和结论。
关键词 中文信息处理 汉语分词 统计 汉语分词模型
下载PDF
汉语自动分词和词性标注一体化系统 被引量:5
8
作者 沈达阳 孙茂松 黄昌宁 《中文信息》 1996年第5期17-19,共3页
关键词 汉语自动分词 词性标注 汉字处理 信息处理
下载PDF
汉字简繁体智能化转换系统
9
作者 沈达阳 孙茂松 《中文信息》 1996年第6期16-18,共3页
关键词 简繁体转换 智能化 汉字信息处理 简体 繁体
下载PDF
利用汉字二元语法关系解决汉语自动分词中的交集型歧义 被引量:66
10
作者 孙茂松 黄昌宁 +2 位作者 邹嘉彦 陆方 沈达阳 《计算机研究与发展》 EI CSCD 北大核心 1997年第5期332-339,共8页
本文提出了一种利用句内相邻字之间的互信息及t-测试差这两个统计量解决汉语自动分词中交集型歧义切分字段的方法.汉字二元语法关系(bigram)为相关计算的基础,直接从生语料库中自动习得.初步的实验结果显示,可以正确处理... 本文提出了一种利用句内相邻字之间的互信息及t-测试差这两个统计量解决汉语自动分词中交集型歧义切分字段的方法.汉字二元语法关系(bigram)为相关计算的基础,直接从生语料库中自动习得.初步的实验结果显示,可以正确处理90. 展开更多
关键词 汉语 自动分词 汉字二元语法 计算机语言学
下载PDF
Java在中文信息处理中的应用
11
作者 沈达阳 《广东通信技术》 2004年第A01期87-90,共4页
简要介绍了java在平台无关性方面的特点,着重论述java在中文软件系统的资源、文件I/O和码表转化几个方面的应用,同时提供几个体现中文信息处理方法的例子。
关键词 中文信息处理 平台无关性 I/O 中文软件 文件 例子 系统 体现 特点 转化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部