数据分析师的福音——VS 2017带来一体化的数据分析开发环境
(此文章同时发表在本人微信公众号“dotNET开发经验谈”,欢迎右边二维码来关注。)
题记:在上个月的Connect() 2016大会上,微软宣布了VS 2017 RC的发布,其中为数据分析师带来了一体化的开发环境。
我们知道Visual Studio 2017带来的一大改变就是,轻量级的快速安装模式:把各种功能特性按照开发领域(Workload)进行组织划分,安装的时候只需要选择自己所需要用到的那部分开发领域就可以快速完成VS的安装。
随着数据科学越来越热门,在刚刚发布的VS 2017 RC中,微软已经独立提供了两种和数据分析相关的开发领域了:数据存储和处理、数据科学和分析应用。见下图所示:
选择“数据存储和处理”开发领域,让你能够获得大数据存储和高级分析的开发环境。除了基本SQL以外,还支持HDInsight(Hadoop/Spark)和Azure机器学习的开发能力。
选择“数据科学和分析应用”开发领域,让你能够获得用于构建分析应用的相应开发环境。包括如下内容:
可用来构建桌面、Web、科学计算、数据科学和机器学习应用的Python的开发工具(PTVS)。支持CPython 2.x/3.x、IronPython、Jython、PyPy等。也包含了Anaconda这一可以安装大量科学计算和分析Python包的包管理器。如下图所示:
可用来构建统计、数据科学和机器学习应用的R开发工具(RTVS)。同时支持CRAN R和Microsoft R两种发行版本。如下图所示:
可用来开发各类数据处理任务的的F#开发工具。由于F#是类LISP的函数式为先的语言,同时兼具面向对象的特性,所以天然就是用来开发机器学习等人工智能应用的首选语言。如下图所示:
F#作为微软头等语言之一,Visual Studio一直以来都支持它的开发环境。而对于Python和R,其实微软之前也一直以开源插件的形式为VS提供这方面的开发能力。我之前的文章都有介绍过。
另外需要强调的是,Python和R已经成为数据分析、数据挖掘、数据科学方面使用最广的两种语言,见下图:
本文基于The Data Science Workloads in Visual Studio 2017 RC整理翻译而来。