Python如何成为数据科学语言?
2018-05-30 17:15 文章来自:IFTNews 收藏(0) 阅读(3081) 评论(0)

IFTNews:在2015年,Python在数据科学应用中的使用率增长了51%?您是否知道youtube是基于Python语言构建的,包含超过一百万行代码?技术预言家们预测,它可能很快就会超越R,并可能成为数据科学行业最受欢迎的语言。 R是一种致力于统计和数据科学的语言,但Python是一种通用编程语言。尽管如此,它在数据科学环境中被广泛使用。最近,在技术论坛上,当Google主要使用Python创建其称为tensorflow的深度学习框架时,出现了巨大的骚动。他们称Python为高端计算的未来。此外,Facebook开发人员在其生产环境中大量使用该语言。

在数据科学中选择Python的原因

可扩展性的优势 - Python具有高度可扩展性,并且比Stata和Matlab等语言更快。代码设计的灵活性是Python比R更具可扩展性的原因。为了快速开发应用程序,这是最常用的语言。

强大的软件包 - 数据科学家可以选择许多软件包来开发他的应用程序。 SciPy用于科学计算,NumPy用于数学计算,Pandas在数据处理中很受欢迎。除了提到的StatsModels包之外,SciKit-Learn也用于数据科学。它的软件包会及时更新,因此如果语言的任何方面都有问题,那么它很可能会得到解决。

易于学习 - 它普遍使用的主要原因是它易于学习和易于开发。与R相比,它的语法很容易遵循。它是一种既简单又高效的少数语言之一。

可视化和图形 - Pandas plotting、seaborn和ggplot libraries都是用Matplotlib构建,它们是它们的共同基础。 Ggplot基于“图形语法”,是一个非常重要的数据可视化库。建立信息统计图形使用Seaborn,Altair基于Vega-Lite的可视化语法。Bokeh用于提供交互式的图形表示。Pygal用于构建绘图区。

巨大的在线社区 - 由于成为通用编程语言的优点,Python拥有非常庞大的在线社区,它为语言的开发提供了强大的支持。急切的开发人员从涉及的社区中找到高度相关的解决方案来解决他们的编码问题StackOverflow和Codementor是编程人员可以从中获益的论坛。

Python将在未来的未来相关吗?

有一种说法是,Python不适合为大规模的核心基础架构提供动力。其他人抱怨代码文档不符合标准。尽管存在这些问题,它仍是十大最常用的编程语言之一。这是因为它的好处远远超过它的缺点。美国银行正在非常成功地构建界面,处理数据和开发使用该语言的新产品。需要在网络上部署应用程序的数据科学家更喜欢Python。虽然R是最常用的数据科学语言,但Python很快就会赶上并可能在未来取代它。

原作者: Vincent Granville

来源:https://www.datasciencecentral.com