期刊文献+
共找到173篇文章
< 1 2 9 >
每页显示 20 50 100
Construction of Complex Intervention in Traditional Chinese Medicine (TCM): A Preliminary Methodological Study Based on Text Mining and Interviewing Method
1
作者 Lian Gong Wenzhi Hao Feifei Xue 《Pharmacology & Pharmacy》 2019年第3期130-136,共7页
Aim: To explore and analyze the feasibility of establishing a program of complex intervention in Traditional Chinese Medicine (TCM) based on Text Mining and Interviewing method. Methods: According to MRC, Constructing... Aim: To explore and analyze the feasibility of establishing a program of complex intervention in Traditional Chinese Medicine (TCM) based on Text Mining and Interviewing method. Methods: According to MRC, Constructing the program of complex intervention in TCM by Text Mining and Interviewing method should include 4 steps: 1) establishment of interview framework via normalization of extraction of ancient documents and Effectiveness of collection of modern periodical literatures;2) materialization of interview outline based on Focus Group Interview;3) rudimentary construction of complex intervention program based on Semi-structured Interview;4) evaluation of curative effect of complex intervention. Conclusions: It is feasible and significative to establish a program of complex intervention in TCM based on Text Mining and Interviewing method. 展开更多
关键词 TRADITIONAL Chinese MEDICINE text Mining Interviewing METHOD complex INTERVENTION
下载PDF
Text Extraction in Complex Color Document Images for Enhanced Readability
2
作者 P. Nagabhushan S. Nirmala 《Intelligent Information Management》 2010年第2期120-133,共14页
Often we encounter documents with text printed on complex color background. Readability of textual contents in such documents is very poor due to complexity of the background and mix up of color(s) of foreground text ... Often we encounter documents with text printed on complex color background. Readability of textual contents in such documents is very poor due to complexity of the background and mix up of color(s) of foreground text with colors of background. Automatic segmentation of foreground text in such document images is very much essential for smooth reading of the document contents either by human or by machine. In this paper we propose a novel approach to extract the foreground text in color document images having complex background. The proposed approach is a hybrid approach which combines connected component and texture feature analysis of potential text regions. The proposed approach utilizes Canny edge detector to detect all possible text edge pixels. Connected component analysis is performed on these edge pixels to identify candidate text regions. Because of background complexity it is also possible that a non-text region may be identified as a text region. This problem is overcome by analyzing the texture features of potential text region corresponding to each connected component. An unsupervised local thresholding is devised to perform foreground segmentation in detected text regions. Finally the text regions which are noisy are identified and reprocessed to further enhance the quality of retrieved foreground. The proposed approach can handle document images with varying background of multiple colors and texture;and foreground text in any color, font, size and orientation. Experimental results show that the proposed algorithm detects on an average 97.12% of text regions in the source document. Readability of the extracted foreground text is illustrated through Optical character recognition (OCR) in case the text is in English. The proposed approach is compared with some existing methods of foreground separation in document images. Experimental results show that our approach performs better. 展开更多
关键词 Color Document Image complex Background Connected Component ANALYSIS Segmentation of text texture ANALYSIS UNSUPERVISED THRESHOLDING OCR
下载PDF
A Complexity Analysis and Entropy for Different Data Compression Algorithms on Text Files
3
作者 Mohammad Hjouj Btoush Ziad E. Dawahdeh 《Journal of Computer and Communications》 2018年第1期301-315,共15页
In this paper, we analyze the complexity and entropy of different methods of data compression algorithms: LZW, Huffman, Fixed-length code (FLC), and Huffman after using Fixed-length code (HFLC). We test those algorith... In this paper, we analyze the complexity and entropy of different methods of data compression algorithms: LZW, Huffman, Fixed-length code (FLC), and Huffman after using Fixed-length code (HFLC). We test those algorithms on different files of different sizes and then conclude that: LZW is the best one in all compression scales that we tested especially on the large files, then Huffman, HFLC, and FLC, respectively. Data compression still is an important topic for research these days, and has many applications and uses needed. Therefore, we suggest continuing searching in this field and trying to combine two techniques in order to reach a best one, or use another source mapping (Hamming) like embedding a linear array into a Hypercube with other good techniques like Huffman and trying to reach good results. 展开更多
关键词 text FILES Data Compression HUFFMAN Coding LZW Hamming ENTROPY complexITY
下载PDF
最近发展区域理论视角下文本复杂度对于续译效果的影响研究
4
作者 胡海峰 《成都工业学院学报》 2024年第5期107-112,共6页
续译的协同促学效应已经得到证实,续译亦可提高翻译学习者的翻译水平,但尚未发现文本复杂度对于续译效果的影响研究。最近发展区域理论认为,学习者在最近发展区域内的调节最有效。通过定量研究与定性研究相结合,探讨续译的文本复杂度对... 续译的协同促学效应已经得到证实,续译亦可提高翻译学习者的翻译水平,但尚未发现文本复杂度对于续译效果的影响研究。最近发展区域理论认为,学习者在最近发展区域内的调节最有效。通过定量研究与定性研究相结合,探讨续译的文本复杂度对于续译效果的影响。研究发现:在最近发展区域内,即用于续译练习的文本复杂度高于语言学习者的实际语言水平时,学习者调节充分,因此,学习者的翻译水平提升效果显著;文本复杂度低于或者等同于语言学习者的实际语言水平(即不在最近发展区域之内)时,学习者的调节空间有限,因此,尽管学习者的翻译水平有提升,但是效果不显著。 展开更多
关键词 续译 最近发展区域 文本复杂度 调节
下载PDF
利用网络游记分析成都市旅游景区空间结构
5
作者 张红 李玥 +1 位作者 邓雯 王艺 《地理空间信息》 2024年第7期31-35,共5页
从携程网爬取了2010—2019年成都市游记数据,构建旅游景区关键词文本共现网络,采用数量统计、空间分析、复杂网络分析等方法,挖掘成都市旅游景区游客到访的时空分异特征。结果表明,成都市旅游景区到访频率呈长尾分布,空间上形成以青城... 从携程网爬取了2010—2019年成都市游记数据,构建旅游景区关键词文本共现网络,采用数量统计、空间分析、复杂网络分析等方法,挖掘成都市旅游景区游客到访的时空分异特征。结果表明,成都市旅游景区到访频率呈长尾分布,空间上形成以青城山—都江堰、金牛—武侯主城区为高热度中心的“双核摄动”格局;成都市旅游景区文本共现网络具有较高的集聚系数和较短的平均路径,等级圈层结构和马太效应较显著,热门景区对邻近热门景区的空间溢出效应显著,但对邻近低等级景区的带动效果有限;成都市旅游景区空间结构由条带状和团簇式向轴辐式和网络化方向转变,在区域旅游一体化发展中的作用日益显著。 展开更多
关键词 旅游景区 网络游记 空间结构 文本共现 复杂网络分析
下载PDF
Oracle Text技术在复杂结构数据库中的应用 被引量:5
6
作者 蒙辉 陈燕 《计算机技术与发展》 2007年第4期38-40,44,共4页
全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不... 全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不足的。文中介绍了Oracle Text全文检索技术的方法和步骤,阐述了其在复杂结构数据库中的具体应用,最后程序实现了所设计的全文检索技术。 展开更多
关键词 ORACLE text 复杂结构数据库 全文检索
下载PDF
自注意力机制下复杂文本实体关系抽取方法
7
作者 针钰 马晓宁 《计算机仿真》 2024年第4期522-526,共5页
为了能够明确语义关系,快速识别所需信息,提出一种自注意力机制下复杂文本实体关系抽取方法。通过复杂文本向量模型把全部词映射为低度实数向量,使文本转变成矢量模式,按照单词的外在情境学习嵌入,可将句子内的所有字转化为嵌入矩阵。利... 为了能够明确语义关系,快速识别所需信息,提出一种自注意力机制下复杂文本实体关系抽取方法。通过复杂文本向量模型把全部词映射为低度实数向量,使文本转变成矢量模式,按照单词的外在情境学习嵌入,可将句子内的所有字转化为嵌入矩阵。利用LSTM网络建立文本向量,存取以往和将来的上下文,融合前后两种输出矢量。运用激活函数压缩单词维度,计算句子上下文本语义贡献权重,在双向LSTM层和输出层间加入自注意力机制,从多角度获取矩阵层次的句子语义,计算组合句子特征矢量在关系上的分数,根据给定概率随机抽样权值参变量,完成复杂文本实体关系抽取。通过实验证明所提方法对复杂文本实体关系抽取效果较好,具有极高的精准度。 展开更多
关键词 自注意力机制 关系抽取 文本向量模型 复杂文本实体
下载PDF
中考英语阅读理解真题文本难度历时分析(2004—2023年)
8
作者 曾娟 李芷莹 黄丽燕 《外语测试与教学》 2024年第3期1-11,共11页
中考英语阅读理解的文本难度控制是保证考试效度的关键环节。在义务教育课程改革及中考英语省级命题工作推进下,中考英语阅读理解真题文本难度演进特征尚待探究。本研究选取了2004至2023年的1200篇中考英语阅读理解真题文本,使用“阅读... 中考英语阅读理解的文本难度控制是保证考试效度的关键环节。在义务教育课程改革及中考英语省级命题工作推进下,中考英语阅读理解真题文本难度演进特征尚待探究。本研究选取了2004至2023年的1200篇中考英语阅读理解真题文本,使用“阅读分级指难针”,分析义务教育理念推广期(2004—2011)、义务教育课标实施期(2012—2014)、核心素养期(2015—2020)及核心素养下的“双减”时期(2021—2023)中的文本难度、词汇难度、句法难度及其相关指标的历时变化,并探讨不同发展阶段和命题单位对其的影响。结果显示,中考英语阅读文本难度、词汇难度与句法难度的均值在3.46至3.62之间,处于中考级别的中等难度水平;文本长度、词汇覆盖率、限定性从属子句数量、复杂名词短语数量与非限定性动词短语数量的均值呈现不同发展轨迹。双因素方差分析结果显示,核心素养时期的中考英语阅读理解文本难度显著高于义务教育理念推广期及义务教育课标实施期。地市命题的文本难度与词汇难度值均显著高于省级命题,发展阶段与命题单位在文本长度上的交互效应显著。本研究在一定程度上反映了不同阶段中考命题理念的变化,为优化中考阅读命题和教学实践提供意见参考。 展开更多
关键词 文本难度 阅读理解 中考英语 历时分析
下载PDF
数字中国建设背景下的技术跨界与场景创新———基于智能产业复杂度视角
9
作者 李依菲 刘刚 《中国科技论坛》 北大核心 2024年第10期104-116,共13页
人工智能技术的跨界融合与应用场景的创新扩散,是推进数字中国建设的重要力量。构建反映技术扩散与场景创新进程的测度指标并量化分析,有助于准确把握数字中国建设的方向与趋势。研究基于复杂度视角,对互联网开源文本进行采集、识别与挖... 人工智能技术的跨界融合与应用场景的创新扩散,是推进数字中国建设的重要力量。构建反映技术扩散与场景创新进程的测度指标并量化分析,有助于准确把握数字中国建设的方向与趋势。研究基于复杂度视角,对互联网开源文本进行采集、识别与挖掘,形成智能产业合作关系数据集。通过构建技术—场景关系矩阵,将复杂度算法应用于分析,计算2014—2021年智能产业复杂度指数。研究显示,中国智能产业复杂度保持稳步增长,但在不同发展阶段表现出层次性差异。当由消费领域向生产领域扩展,技术与场景融合的难度也不断加深。人工智能技术与制造业的创新融合具有挑战性,智能制造和智能网联汽车是值得重点突破的应用场景。核心产业部门与融合产业部门间的协同创新将形成正反馈效应,构成数字中国建设的强大合力。 展开更多
关键词 人工智能 复杂度 技术扩散 场景创新 文本挖掘
下载PDF
基于文本挖掘的WUI火灾致灾因子网络构建及特征分析
10
作者 袁惠 钟少波 靳薇 《计算机系统应用》 2024年第6期251-258,共8页
为预防和减少WUI火灾的发生,挖掘WUI火灾关键致灾因子,厘清致灾因子间的作用机制.本文首先基于本文挖掘技术从WUI火灾事故案例中得到致灾因子,使用Apriori算法得到致灾因子之间的关联规则.然后使用复杂网络理论构建WUI火灾致灾因子网络... 为预防和减少WUI火灾的发生,挖掘WUI火灾关键致灾因子,厘清致灾因子间的作用机制.本文首先基于本文挖掘技术从WUI火灾事故案例中得到致灾因子,使用Apriori算法得到致灾因子之间的关联规则.然后使用复杂网络理论构建WUI火灾致灾因子网络,计算网络拓扑特征参数,探析WUI火灾致灾因子网络特征.最后引入WUI火灾致因链风险度指标,挖掘出高风险连边,并提出断链措施.结果表明:WUI火灾致灾因子网络具有小世界特性,高温、强风、干旱等对其他致灾因子影响较大.燃烧废弃物、植物起火、应急响应速度、人为纵火、强风在不同致灾因子转换中具有重要作用,应加强管控.网络中风险度最高的边是燃烧废弃物→植物起火,通过颁布禁止擅自燃烧废弃物等规定,即可切断该风险链,实现对WUI火灾的预防和主动控制. 展开更多
关键词 WUI火灾 致灾因子 文本挖掘 复杂网络 拓扑特征 风险度
下载PDF
句法复杂度指标在文本阅读理解测评素材开发中的作用
11
作者 彭雨欣 孙杰 张浩敏 《外语测试与教学》 2024年第3期12-21,49,共11页
本文探讨了句法复杂度作为一个多维度构念在量化文本工具定级中的预测效应和机制。50名师范大学英语专业师范生以“蓝思分析器”为参照进行小学三年级至初中三年级共700篇的英语阅读理解测评素材开发,研究团队选取了Jin et al.(2020)中... 本文探讨了句法复杂度作为一个多维度构念在量化文本工具定级中的预测效应和机制。50名师范大学英语专业师范生以“蓝思分析器”为参照进行小学三年级至初中三年级共700篇的英语阅读理解测评素材开发,研究团队选取了Jin et al.(2020)中涉及的8个粗细粒度句法复杂度指标,并使用二语句法复杂度分析器(L2 Syntactic Complexity Analyzer,L2SCA,Lu 2010)对每篇改编后文本进行指标提取。本文聚焦句法复杂度这一多维度构念,旨在探讨如何使用句法复杂度进行阅读文本改编及难度调控。单因素方差分析结果表明,句法复杂度各指标在不同难度等级的文本上存在显著差异,路径分析的结果揭示了句法复杂度各子维度对素材难度的预测机制,本文讨论了如何通过具体的句子成分来微观调控文本的句法复杂度以调整文本难度,为国内一线教师的阅读文本改编实践提供了启示。 展开更多
关键词 句法复杂度 文本难度调控 分级阅读 二语阅读测评素材开发 中介效应
下载PDF
央行货币政策报告文本复杂度与金融市场稳定——基于短语句法结构复杂度的分析
12
作者 范小云 李皓若 《南开经济研究》 北大核心 2024年第7期3-21,共19页
基于前沿的短语句法复杂度识别方法,本文对央行货币政策报告的文本信息进行了分析,并使用2005年第三季度至2021年第四季度的数据探究央行货币政策报告的文本复杂度对金融市场稳定的影响。实证结果表明,较低的央行货币政策报告文本复杂... 基于前沿的短语句法复杂度识别方法,本文对央行货币政策报告的文本信息进行了分析,并使用2005年第三季度至2021年第四季度的数据探究央行货币政策报告的文本复杂度对金融市场稳定的影响。实证结果表明,较低的央行货币政策报告文本复杂度有利于股票市场和中长期国债市场维持稳定,但是会导致债券市场的整体价格波动幅度上升。央行货币政策报告文本复杂度对外汇市场的影响较小。对央行货币政策报告进一步分析后发现,央行货币政策报告文本复杂度对金融市场稳定的影响主要通过前瞻性指引部分发挥作用。 展开更多
关键词 文本复杂度 中央银行沟通 金融市场稳定
下载PDF
机构投资者抱团与公司前瞻性信息披露 被引量:8
13
作者 张俊瑞 仇萌 张志超 《统计与信息论坛》 北大核心 2023年第5期53-66,共14页
提高信息披露水平是缓解公司内部管理层与外部投资者之间信息不对称的关键机构投资者作为长期资金提供者,更关注企业的前景和成长性,因此会格外关注公司的前瞻性信息披露。国内外现有研究对中国实践情境下机构投资者持股抱团现象缺乏关... 提高信息披露水平是缓解公司内部管理层与外部投资者之间信息不对称的关键机构投资者作为长期资金提供者,更关注企业的前景和成长性,因此会格外关注公司的前瞻性信息披露。国内外现有研究对中国实践情境下机构投资者持股抱团现象缺乏关注,尤其是尚未探讨机构投资者持股抱团与上市公司前瞻性信息披露之间的关系。基于2007—2019年中国A股上市公司数据,通过复杂网络分析方法构建机构投资者重仓持股网络,并借助模块度的社区算法(Louvain算法)提取机构投资者网络团体,同时采取Word2Vec神经网络模型算法构建上市公司前瞻性信息披露指标,进而考察机构投资者网络抱团对公司前瞻性信息披露的影响。研究发现:机构投资者抱团持股比例与公司前瞻性信息披露呈现显著正相关关系,即机构投资者抱团后,公司年报中将来时态的词频显著提高。机制检验发现,机构投资者通过持股抱团增强其对管理层监督的动机与能力,以及机构投资者抱团促使公司增加披露前瞻性描述内容与描述语气,以上两条机制来增加年报中对未来展望的描述。进一步分析发现,机构投资者抱团对前瞻性信息的正向效应存在于民营企业与分析师关注度较高的企业。研究结论通过一系列稳健性检验仍显著成立,加深了公司治理中机构投资者治理角色的认知,促进发挥机构投资者抱团的长期投资作用,对于资本市场持续稳定发展具有启示意义。 展开更多
关键词 机构投资者网络 机构投资者抱团 复杂网络 前瞻性信息披露 文本信息特征
下载PDF
融合事实文本的问句分解式语义解析方法 被引量:1
14
作者 杨玉倩 高盛祥 +1 位作者 余正涛 宋燃 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1932-1939,共8页
目前知识库问答(Knowledge base question answering,KBQA)技术无法有效地处理复杂问题,难以理解其中的复杂语义.将一个复杂问题先分解再整合,是解析复杂语义的有效方法.但是,在问题分解的过程中往往会出现实体判断错误或主题实体缺失... 目前知识库问答(Knowledge base question answering,KBQA)技术无法有效地处理复杂问题,难以理解其中的复杂语义.将一个复杂问题先分解再整合,是解析复杂语义的有效方法.但是,在问题分解的过程中往往会出现实体判断错误或主题实体缺失的情况,导致分解得到的子问题与原始复杂问题并不匹配.针对上述问题,提出了一种融合事实文本的问解分解式语义解析方法.对复杂问题的处理分为分解-抽取-解析3个阶段,首先把复杂问题分解成简单子问题,然后抽取问句中的关键信息,最后生成结构化查询语句.同时,本文又构造了事实文本库,将三元组转化成用自然语言描述的句子,采用注意力机制获取更丰富的知识.在ComplexWebQuestions数据集上的实验表明,本文提出的模型在性能上优于其他基线模型. 展开更多
关键词 知识库问答 复杂问题 语义解析 事实文本
下载PDF
Text Reasoning Chain Extraction for Multi-Hop Question Answering
15
作者 Pengming Wang Zijiang Zhu +1 位作者 Qing Chen Weihuang Dai 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2024年第4期959-970,共12页
With the advent of the information age, it will be more troublesome to search for a lot of relevant knowledge to find the information you need. Text reasoning is a very basic and important part of multi-hop question a... With the advent of the information age, it will be more troublesome to search for a lot of relevant knowledge to find the information you need. Text reasoning is a very basic and important part of multi-hop question and answer tasks. This paper aims to study the integrity, uniformity, and speed of computational intelligence inference data capabilities. That is why multi-hop reasoning came into being, but it is still in its infancy, that is, it is far from enough to conduct multi-hop question and answer questions, such as search breadth, process complexity, response speed, comprehensiveness of information, etc. This paper makes a text comparison between traditional information retrieval and computational intelligence through corpus relevancy and other computing methods. The study finds that in the face of multi-hop question and answer reasoning, the reasoning data that traditional retrieval methods lagged behind in intelligence are about 35% worse. It shows that computational intelligence would be more complete, unified, and faster than traditional retrieval methods. This paper also introduces the relevant points of text reasoning and describes the process of the multi-hop question answering system, as well as the subsequent discussions and expectations. 展开更多
关键词 intelligent computing multi-hop quiz text reasoning document retrieval text complex network
原文传递
初中英语学业水平考试阅读理解文本的语言特征研究
16
作者 赵连杰 曹宇煊 《基础教育外语教学研究》 2023年第7期7-12,共6页
文本质量是阅读理解命题的前提和基础,其重要性不言而。然而,已有研究多关注阅读理解的命题技术,对文本的语言特征研究关注不足。本文依据收集的五套2022年省级统一命题的初中英语学业水平试题,选出阅读理解文本18篇,基于语言特征分析框... 文本质量是阅读理解命题的前提和基础,其重要性不言而。然而,已有研究多关注阅读理解的命题技术,对文本的语言特征研究关注不足。本文依据收集的五套2022年省级统一命题的初中英语学业水平试题,选出阅读理解文本18篇,基于语言特征分析框架",运用自然语言处理工具Coh-Metrix以及"英语阅读分级指难针",分别从文本复杂度和"依标命题"两个维度对阅读理解文本的语言特征开展量化分析并进行共时跨案例比较分析。研究发现,五套省级统一命题的初中英语学业水平考试阅读理解文本的语言特征在词汇复杂度、句法复杂度上均不存在显著性差异,但是在易读度与衔接性上出现省际间的显著性差异。在"依标命题"方面,各卷均存在词汇超标现象,个别试题的词汇超标率高于5%,同时还存在句法难度超标的问题。基于研究发现,本文提出在选择中考英语阅读理解文本时可以运用Coh-Metrix对文本的可读性、衔接性等进行测算,并结合"英语阅读分级指难针",对文本的词汇、句法、难度等进行分析。 展开更多
关键词 初中英语学业水平考试 阅读理解文本 文本复杂度 “依标命题”
下载PDF
一种改进的KMP算法 被引量:13
17
作者 俞松 郑骏 胡文心 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第4期92-97,共6页
在给出改进的KMP模式匹配算法的定义和步骤的同时,对其进行了严格推导和证明.实验证明,当模式首次出现在文本后半段的情况下,该算法较原KMP算法具有更少的比较次数和更高的效率.
关键词 匹配 模式 时间复杂度 文本
下载PDF
在ICU中实现少数民族文字的处理 被引量:24
18
作者 董治江 吴健 钟义信 《中文信息学报》 CSCD 北大核心 2004年第2期66-72,共7页
基于ISO/IEC 10 6 46和UNICODE国际标准 ,用传统的字体技术 (如TrueType)来实现少数民族文字处理所面临的一个“瓶颈”问题是 :“变形显现字符”不存在确定的码位。这也是多年来民文系统重复开发、互不兼容的根本原因。本文基于ICU的文... 基于ISO/IEC 10 6 46和UNICODE国际标准 ,用传统的字体技术 (如TrueType)来实现少数民族文字处理所面临的一个“瓶颈”问题是 :“变形显现字符”不存在确定的码位。这也是多年来民文系统重复开发、互不兼容的根本原因。本文基于ICU的文字处理体系结构 ,阐述了完全支持Unicode标准的少数民族文字(本文主要指蒙古文字、维文、藏文等 )的实现方法。文中首先介绍了少数民族文字的特点 ,分析其与拉丁文字、汉字在计算机输入、输出过程中的不同之处 ,并指出少数民族文字处理的难点。其次介绍了一种能满足少数民族文字处理需求的字体技术———OpenType。最后 ,阐述了文字处理引擎的工作原理 ,以及ICU中如何实现对少数民族文字的支持。 展开更多
关键词 计算机应用 中文信息处理 复杂文本 UNICODE Open Type 布局引擎 ICU 少数民族文字处理
下载PDF
基于OpenType的复杂文本语言处理的研究与实现 被引量:6
19
作者 董治江 吴健 钟义信 《计算机应用研究》 CSCD 北大核心 2004年第10期158-161,共4页
某些书写系统的文字(如蒙古文、维文、藏文等)具有比拉丁文字复杂的特性,当计算机在处理这类文字时,运用传统的字体技术(如TrueType)几乎不可能在显现出规范的书写形式的同时,实现对Unicode标准编码的支持。就这个问题介绍一种基于OpenT... 某些书写系统的文字(如蒙古文、维文、藏文等)具有比拉丁文字复杂的特性,当计算机在处理这类文字时,运用传统的字体技术(如TrueType)几乎不可能在显现出规范的书写形式的同时,实现对Unicode标准编码的支持。就这个问题介绍一种基于OpenType字体的处理模型。事实证明,这是一种可行的方案。 展开更多
关键词 复杂文本 字符 字型 布局引擎 连字
下载PDF
基于复杂关联网络的生物医学研究结构的挖掘 被引量:5
20
作者 闵波 刘爱中 +2 位作者 郑萍 史艳莉 唐春霞 《中华医学图书情报杂志》 CAS 2015年第8期1-4,共4页
基于免费开放的Pub Med文献数据集,利用文献的知识发现,通过挖掘文献中隐含的关联,构建了生物医学实体关联演化网络。它能帮助科研人员形成新的科学假设,分析关联网络的拓扑特征,从系统层面上研究科学文献富集的知识结构、相关性与发展... 基于免费开放的Pub Med文献数据集,利用文献的知识发现,通过挖掘文献中隐含的关联,构建了生物医学实体关联演化网络。它能帮助科研人员形成新的科学假设,分析关联网络的拓扑特征,从系统层面上研究科学文献富集的知识结构、相关性与发展规律,为文献的知识发现引入新的视角与方法,提高知识发现的效率。 展开更多
关键词 复杂网络 文本挖掘 知识发现 关联知识网络
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部