文本和数据挖掘(textual or data mining,简称TDM)的概念及其随后的分析可以追溯到几百甚至上千年前。文本和数据分析最初是手工进行的,目前它已经发展成为一种新的工具,能够帮助科研人员从文本语料库得出新见解。然而,为发掘TDM的潜在...文本和数据挖掘(textual or data mining,简称TDM)的概念及其随后的分析可以追溯到几百甚至上千年前。文本和数据分析最初是手工进行的,目前它已经发展成为一种新的工具,能够帮助科研人员从文本语料库得出新见解。然而,为发掘TDM的潜在益处,我们需要克服一些非技术壁垒。这些壁垒包括复杂的著作权、数据库权利和许可造成的法律不确定性;一些出版商目前并不支持TDM提供给学术界的机会;很多学者缺乏对TDM的认识以及相关工具技能的使用。展开更多
文摘文本和数据挖掘(textual or data mining,简称TDM)的概念及其随后的分析可以追溯到几百甚至上千年前。文本和数据分析最初是手工进行的,目前它已经发展成为一种新的工具,能够帮助科研人员从文本语料库得出新见解。然而,为发掘TDM的潜在益处,我们需要克服一些非技术壁垒。这些壁垒包括复杂的著作权、数据库权利和许可造成的法律不确定性;一些出版商目前并不支持TDM提供给学术界的机会;很多学者缺乏对TDM的认识以及相关工具技能的使用。