期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向范畴类型数据的sIB算法 被引量:5
1
作者 叶阳东 何锡点 贾利民 《电子学报》 EI CAS CSCD 北大核心 2009年第10期2165-2172,共8页
本文针对sIB算法仅适用于共现数据的问题,提出了一种能够自动进行范畴类型数据分析的sIB算法:CD-sIB.该算法根据范畴类型数据的离散化表示、不同属性值有限的特征,进行数据的属性的拓展和二元化处理,基于属性值的出现进行X,Y的联合分布... 本文针对sIB算法仅适用于共现数据的问题,提出了一种能够自动进行范畴类型数据分析的sIB算法:CD-sIB.该算法根据范畴类型数据的离散化表示、不同属性值有限的特征,进行数据的属性的拓展和二元化处理,基于属性值的出现进行X,Y的联合分布的计算,使得sIB算法可有效应用于范畴类型数据的分析.实验结果表明:CD-sIB算法相对于现有的面向范畴类型数据聚类模式分析的算法GAClust和K-modes具有明显的优势;CD-sIB算法在进行数据属性概化程度高、类数据分布相对平衡的范畴类型数据的分析中,在效率和精确度方面均很突出. 展开更多
关键词 IB理论 SIB算法 范畴类型数据 概化 聚类
下载PDF
一种自动确定参数的sIB算法 被引量:5
2
作者 叶阳东 刘东 +1 位作者 贾利民 LI Gang 《计算机学报》 EI CSCD 北大核心 2007年第6期969-978,共10页
针对sIB算法的压缩变量参数的确定问题,采用最小描述长度原理,构建一种自动确定参数的AsIB算法.算法使用一种有效的编码方案对数据分析模型和相应的数据进行描述,将最小描述长度的模型作为选择标准,从而有效发现了数据蕴含的特征模式数... 针对sIB算法的压缩变量参数的确定问题,采用最小描述长度原理,构建一种自动确定参数的AsIB算法.算法使用一种有效的编码方案对数据分析模型和相应的数据进行描述,将最小描述长度的模型作为选择标准,从而有效发现了数据蕴含的特征模式数目.实验表明:AsIB算法所采用的编码方案有效,在不设定模式数目的情况下,能够正确发现数据集所蕴含的模式.该算法解决了现sIB算法对先验知识的依赖问题,将能拓展其在多维数据的自动降维分析和模式提取等方面的应用. 展开更多
关键词 IB理论 SIB算法 AsIB算法 最小描述长度原理 模型选择
下载PDF
医学自然语言处理技术对产科病历逻辑错误的质量控制效果 被引量:3
3
作者 赵悦淑 王蕊 +2 位作者 窦华溢 张坤丽 王军 《中国生育健康杂志》 2020年第4期371-373,共3页
目的运用医学自然语言处理技术查找病历的逻辑错误,提高病历质量。方法选取2016年1月1日至2016年12月31在河南省某三甲医院的全部产科出院患者的产科首次病程记录,共计19860份。运用自然语言处理技术把归档的产科病历的产科检查抽取成Ex... 目的运用医学自然语言处理技术查找病历的逻辑错误,提高病历质量。方法选取2016年1月1日至2016年12月31在河南省某三甲医院的全部产科出院患者的产科首次病程记录,共计19860份。运用自然语言处理技术把归档的产科病历的产科检查抽取成Excel文件,然后查找可疑逻辑错误,把错误项与原始病历核对,最后由病历书写者确认错误。结果19860份中有309份除住院号、性别、年龄外,其他字段全部为"空",只有19551份包括主诉等内容。在19551份病历中,共发现通过人工质控和质控软件没有发现的存在逻辑错误的病例1246份(0.28%)。逻辑错误共23类,错误率最高的前三位分别是髂嵴间径小于髂棘间径259个(1.32%),预产期在末次月经前140个(0.72%),宫高和腹围填写颠倒120个(0.61%),极度异常值如腹围703.0 cm。结论自然语言处理技术用于文本病历的逻辑错误审核,比人工审核快速、客观、全面。 展开更多
关键词 自然语言 逻辑错误 质量控制 病历
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部