话题跟踪是一项针对新闻话题进行相关信息识别、挖掘和自组织的研究课题,其关键问题之一是如何建立符合话题形态的统计模型.话题形态的研究涉及两个问题,其一是话题的结构特性,其二是话题变形.对比分析了现有词包式、层次树式和链式这3...话题跟踪是一项针对新闻话题进行相关信息识别、挖掘和自组织的研究课题,其关键问题之一是如何建立符合话题形态的统计模型.话题形态的研究涉及两个问题,其一是话题的结构特性,其二是话题变形.对比分析了现有词包式、层次树式和链式这3类主流话题模型的形态特征,尤其深入探讨了静态和动态话题模型拟合话题脉络的优势和劣势,并提出一种基于特征重叠比的核捕捉衰减评价策略,专门用于衡量静态和动态话题模型追踪话题发展趋势的能力.在此基础上,分别给出突发式增量式学习方法和时序事件链的更新算法,借以提高动态话题模型的核捕捉性能.实验基于国际标准评测语料TDT4,采用NIST(National Institute of Standards and Technology)提出的最小检测错误权衡系数评测法,并结合所提出的核捕捉衰减评价方法,对各类主要话题模型进行测试.实验结果显示,结构化的动态话题模型具有最佳的跟踪性能,且突发式增量式学习和时序事件链的更新算法分别给予动态话题模型0.4%和3.3%的性能改进.展开更多
[目的/意义]揭示中国和美国“人工智能+教育”研究的话题异同对于促进我国人工智能教育发展具有重要意义。[方法/过程]以Web of Science数据库中人工智能教育的相关文献为分析对象,采用结构话题模型分析方法,对话题结构、话题内容以及...[目的/意义]揭示中国和美国“人工智能+教育”研究的话题异同对于促进我国人工智能教育发展具有重要意义。[方法/过程]以Web of Science数据库中人工智能教育的相关文献为分析对象,采用结构话题模型分析方法,对话题结构、话题内容以及话题时序变化等进行了模型估计和比较分析。[结果/结论]研究结果发现,中美“人工智能+教育”研究涵盖了15个主要话题。美国研究者倾向于机器学习、教育机器人以及智能知识管理系统等11个智能技术性话题,中国研究者关注教育游戏、教学代理和智能医疗等4个教学性话题。他们在同一话题的预期比例和话题关键词内容等方面存在着显著差异,大部分研究话题的时序发展强度各异。基于结构话题模型的文献分析,不仅揭示了两国在话题数量、内容偏好以及强度时序发展等方面的异同,而且为我国人工智能教育的基础性研究、研究体系创建、建立健全研发机制等建议的提出提供了依据。展开更多
专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词...专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词项的条件独立性假设,且其可操作性比经典模型更强。同时,使用了一种排序截断技术,该技术极大地降低了模型的计算复杂度。使用CERC(CSIRO Enterprise Research Collection)数据集对模型的性能进行评估。实验结果表明,基于话题模型的专家发现方法在各个评价指标上均优于经典的专家发现模型,能够有效地提高专家发现的效能。展开更多
文摘话题跟踪是一项针对新闻话题进行相关信息识别、挖掘和自组织的研究课题,其关键问题之一是如何建立符合话题形态的统计模型.话题形态的研究涉及两个问题,其一是话题的结构特性,其二是话题变形.对比分析了现有词包式、层次树式和链式这3类主流话题模型的形态特征,尤其深入探讨了静态和动态话题模型拟合话题脉络的优势和劣势,并提出一种基于特征重叠比的核捕捉衰减评价策略,专门用于衡量静态和动态话题模型追踪话题发展趋势的能力.在此基础上,分别给出突发式增量式学习方法和时序事件链的更新算法,借以提高动态话题模型的核捕捉性能.实验基于国际标准评测语料TDT4,采用NIST(National Institute of Standards and Technology)提出的最小检测错误权衡系数评测法,并结合所提出的核捕捉衰减评价方法,对各类主要话题模型进行测试.实验结果显示,结构化的动态话题模型具有最佳的跟踪性能,且突发式增量式学习和时序事件链的更新算法分别给予动态话题模型0.4%和3.3%的性能改进.
文摘[目的/意义]揭示中国和美国“人工智能+教育”研究的话题异同对于促进我国人工智能教育发展具有重要意义。[方法/过程]以Web of Science数据库中人工智能教育的相关文献为分析对象,采用结构话题模型分析方法,对话题结构、话题内容以及话题时序变化等进行了模型估计和比较分析。[结果/结论]研究结果发现,中美“人工智能+教育”研究涵盖了15个主要话题。美国研究者倾向于机器学习、教育机器人以及智能知识管理系统等11个智能技术性话题,中国研究者关注教育游戏、教学代理和智能医疗等4个教学性话题。他们在同一话题的预期比例和话题关键词内容等方面存在着显著差异,大部分研究话题的时序发展强度各异。基于结构话题模型的文献分析,不仅揭示了两国在话题数量、内容偏好以及强度时序发展等方面的异同,而且为我国人工智能教育的基础性研究、研究体系创建、建立健全研发机制等建议的提出提供了依据。
文摘专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词项的条件独立性假设,且其可操作性比经典模型更强。同时,使用了一种排序截断技术,该技术极大地降低了模型的计算复杂度。使用CERC(CSIRO Enterprise Research Collection)数据集对模型的性能进行评估。实验结果表明,基于话题模型的专家发现方法在各个评价指标上均优于经典的专家发现模型,能够有效地提高专家发现的效能。