时代的进步日新月异,越来越多的工具在数据科学和统计学分析中得到应用。不同的工具系统各有优劣,伴随着数据的数量越来越庞大,更多的研究工作者渴望高效简洁的工具链。“花更少的时间写程序,花更多的时间研究算法,用最简约而美观的方...时代的进步日新月异,越来越多的工具在数据科学和统计学分析中得到应用。不同的工具系统各有优劣,伴随着数据的数量越来越庞大,更多的研究工作者渴望高效简洁的工具链。“花更少的时间写程序,花更多的时间研究算法,用最简约而美观的方式输出图表”才是 21 世界数据科学家和统计学家渴望的工作环境。而随着相应技术的普及和发展,文本越来越多的不单单以信息的载体的形式而存在,越来越多技术的实现和广泛应用、越来越多的场景呼唤精准而有效的语言分析。使用计算机程序、借助庞大的网络资源库,成为了时代的号召、广大用户的需求,也自然成为了语言学发展的新桥头堡。在统计学分析中起到至关重要作用的 R 语言,正在越来越成为语言文字处理者手头上的利器。本文将对 R 语言本身及基于 R 语言的自然语言处理生态环境进行全方位的比较,从各种软件包的基本作用、使用场景、优点以及不同软件包的组合应用方面入手,向读者展示一个全方位、深层次的 R 语言生态环境。展开更多
文摘时代的进步日新月异,越来越多的工具在数据科学和统计学分析中得到应用。不同的工具系统各有优劣,伴随着数据的数量越来越庞大,更多的研究工作者渴望高效简洁的工具链。“花更少的时间写程序,花更多的时间研究算法,用最简约而美观的方式输出图表”才是 21 世界数据科学家和统计学家渴望的工作环境。而随着相应技术的普及和发展,文本越来越多的不单单以信息的载体的形式而存在,越来越多技术的实现和广泛应用、越来越多的场景呼唤精准而有效的语言分析。使用计算机程序、借助庞大的网络资源库,成为了时代的号召、广大用户的需求,也自然成为了语言学发展的新桥头堡。在统计学分析中起到至关重要作用的 R 语言,正在越来越成为语言文字处理者手头上的利器。本文将对 R 语言本身及基于 R 语言的自然语言处理生态环境进行全方位的比较,从各种软件包的基本作用、使用场景、优点以及不同软件包的组合应用方面入手,向读者展示一个全方位、深层次的 R 语言生态环境。