R vs Python:关于可用性、流行度、优点和缺点、工作和薪水的元评审

最后更新于2022年2月2日

如果你是一名高级数据科学家或预测分析专业人士,你可能会同时使用R & Python和其他工具,如SAS、SQL等。但是,如果你是一个初学者或只是想开始在数据科学、机器学习和商业分析方面的职业生涯你应该学哪一个——R还是Python?这一直是数据科学家、研究人员和分析专业人士之间激烈争论的话题。在本文中,我们将对此进行讨论R与Python- - - - - -可用性,流行指数,优势和限制,工作机会,薪水.在本文中,您将了解数据科学的r vs python,机器学习的r vs python,数据分析的r vs python等等。

RvsPython

关于可用性、流行度、优点和缺点、工作和薪水的元回顾

介绍R

R是一种统计和可视化语言,它是深刻的,庞大的,数学的。R是1992年开发的,多年来一直是大多数数据科学家首选的编程语言。R使得为您想要执行的任何分析找到一个库成为可能。丰富的库种类使R成为统计分析的首选,特别是专门的分析工作。此外,使用R的一个突出特性是您可以创建漂亮的数据可视化报告并交流发现。

R:针对程序员的流行软件包

  • dplyr,plyr,数据表对数据操作
  • stringr操作字符串
  • 动物园能够处理规则和不规则的时间序列
  • ggvis,晶格,ggplot2数据可视化
  • 脱字符号对机器学习

检查Edureka使用R的数据科学认证课程

介绍了Python

Python是一种基于C语言的软件开发语言,博大精深,直观直观。它比许多其他语言更容易学习,你不需要完全流利,就可以将它用于基因组学或其他生物数据分析。它可以做一些统计,是一种很好的脚本语言,可以帮助您将工作流或管道组件链接在一起。

Python于1989年发布,其理念强调代码的可读性和效率。它是一种面向对象的编程语言,这意味着它将数据和代码分组为可以相互交互和修改的对象。Java、c++和Scala是其他的例子。

Python是一种大规模部署和实现机器学习的工具。它几乎可以完成与R相同的任务:数据整理、工程设计、功能选择、网页删除、应用程序等等。但是,Python代码比r更容易维护,也更健壮。它为机器学习或人工智能提供了前沿的API。

大多数数据科学工作可以通过五个Python库完成:Numpy、Pandas、Scipy、Scikit-learn和Seaborn。此外,Python比r更容易再现和访问。如果您需要在应用程序或网站中使用您的分析结果,Python是最佳选择。

Python:编程人员的流行库

  • 熊猫对数据操作
  • SciPy/NumPy科学计算
  • scikit-learn对机器学习
  • matplotlib对图形
  • statsmodels来研究数据,估计统计模型,并执行统计测试和单元测试

检查最佳Python在线课程而且Edureka的Python数据科学认证培训

R与Python
来源:DataCamp

R vs Python:可用性

根据Chris Groskopf, Quartz的前数据编辑Python更适合数据操作和重复任务,而R适合于特别分析和探索数据集

他进一步补充说,从提取数据,到反复运行自动分析,再到根据结果生成地图和图表等可视化结果,当他在进行选举报道时,Python是更好的选择。

“如果我用R进行分析,那么我就不得不切换到另一种工具来创建网站,并将这个过程自动化,但Python在这些方面也很好,”他说。

相比之下,R适合统计量大的项目和一次性深入数据集。以文本分析为例,您希望将段落分解为单词或短语,然后确定模式。

Groskopf说:“当我开始这样的一个过程时,我常常不知道我将在哪里结束,而R让我能够轻松地快速尝试许多不同的想法。”“在Python中,我将不可避免地编写一堆通用代码来解决这个相当狭窄的问题。”

R具有陡峭的学习曲线,而没有编程经验的人可能会觉得难以承受。Python通常被认为更容易掌握

Python是一个很好的工具程序员和开发人员

Python的另一个优点是它是一种更通用的编程语言:对于那些对统计以外的事情感兴趣的人来说,这在构建网站或理解命令行工具时非常方便。Python是机器学习领域的一个纯玩家.但是,Python在计量经济学和通信方面还不完全成熟。

Python是机器学习集成和部署的最佳工具,但不是业务分析的最佳工具。

R是用来院士、学者、科学家.R被设计用来回答统计问题、机器学习和数据科学。R是数据科学的正确工具,因为它有强大的通信库。此外,R还配备了许多软件包,可以进行时间序列分析、面板数据和数据挖掘。

Python与R
来源:DataCamp

R vs Python:在统计学、数据科学、机器学习和软件工程中的使用

当涉及到数据科学的使用时,一些数据科学家更喜欢R而不是Python,因为它的可视化库和交互风格。

R在静态和交互式数据可视化方面具有强大的能力。用诸如Plotly、Highcharter、Dygraphs和Ggiraph等R包构建的交互式可视化将用户和数据之间的交互提升到一个新的水平。

因为R是作为一种统计语言构建的,所以它更适合进行统计学习。它很好地代表了统计学家的思考方式,因此任何具有正式统计背景的人都可以轻松使用R。

但是,如果您正在寻找更高的性能或结构化代码,Python是首选语言。这是因为Python有一些最好的库,如SciKit-Learn、IPython、numpy、scipy、matplotlib等。

NumPy是Python科学计算的基础库,它引入了多维数组和矩阵的对象,以及允许开发人员用更少的代码在这些数组上执行高级数学和统计函数的例程。Matplotlib是用于创建2D图表的标准Python库。

Python也是更好的选择吗机器学习它具有生产使用的灵活性,特别是当数据分析任务需要与web应用程序集成时。为快速原型而且利用数据集建立机器学习模型R英寸。Python在Matplotlib方面已经赶上了一些进步,但R在数据可视化方面似乎仍然要好得多(ggplot2, htmlwidgets, pamphlet)。

此外,如果你想做很多事情,Python也是很好的选择软件工程.在工程环境中,它比R集成得更好。然而,要写真的高效的代码,您可能必须使用较低级的语言,如c++或Java,但为这些代码提供Python包装器是一个很好的选择,可以更好地与其他组件集成。

相关:你认为你能成为一名数据科学家吗?

R vs Python: 2021年的流行

直到2015-2016年,R更受欢迎。但是,在过去的2 - 3年里,Python获得了极大的普及。Burtch作品我们对数据科学家和分析专家进行了全面的调查,以确定他们更喜欢使用哪种工具——SAS、R还是Python。KDnuggets我们还做了另一项调查,找出数据科学家和分析专业人士的首选平台。看看下面的结果吧。

Python vs R - Stackoverflow
图片来源:DZone

Python vs R平台的使用
图片来源:DZone

R vs Python vs SAS
图片来源:Burtch作品

R与Python
图片来源:KDnuggets

经验丰富的专业人士使用R(SAS)。相比之下,入门级数据科学家更喜欢使用Python这并不奇怪,因为Python更容易掌握。预测分析专业人士更喜欢使用SAS.而对于数据科学家来说,Python是一个明显的赢家.此外,使用和流行程度也因行业而异并通过教育水平.看看下面的图表。

R vs Python vs SAS
图片来源:Burtch作品

数据科学和预测分析中的SAS vs R vs Python
图片来源:Burtch作品

Python vs R vs SAS -行业偏好
图片来源:Burtch作品

SAS vs R vs Python的教育水平
图片来源:Burtch作品

R vs Python:优势与局限

R的优点

  • R非常适合统计分析。
  • R也是围绕命令行构建的,但许多人在RStudio或R commander等环境中工作,这些环境包括数据编辑器、调试支持和保存图形的窗口。Python试图通过Eclipse或Visual Studio等ide来实现这一点。
  • R语言被认为是数据可视化的最佳工具。可视化数据比原始数据更容易理解。R和可视化是密切相关的。它包含了相当多与此相对应的包。python的可视化稍微复杂一些,没有那么多的可视化库可供选择。
  • R编程可产生最佳的可视化结果,可用于研究论文(白皮书)。结果可以在需要时进行跟踪,并可以重新生成以创建不同的结果结构。
  • R语言提供了一个拥有1000名开发人员的大型社区支持,吸引了来自世界各地的数据科学家人才。这个社区包括金融、机器学习、网络技术和制药等各个领域的软件包。

R的局限性:

  • 对于没有编程知识的用户来说,R语言会有点困难,因为它有一个陡峭的学习曲线。
  • 如果代码写得不好,用R编程语言得到正确的解决方案会被认为是缓慢的。为了克服这个缺点,必须包含库来实现正确的输出。

Python的优点:

  • 由于Python是一种通用编程语言,学习它可以使您获得超越数据分析的技能。Python编程广泛用于web开发、自动化测试和ETL。
  • 程序员认为Python比R更符合程序员的思维方式,因此它更容易翻译成其他语言。如前所述,R的根在于统计,因此具有独特的设计。如果您想继续学习其他通用语言,那么Python是您应该学习的语言。
  • 数据分析的很大一部分是预先清理数据。使用像Python这样的全服务语言来清理数据很好,因为您可以添加新的函数和层来分解数据。如果这些函数需要本地存储或web访问,那么在Python中包含这些函数是相当容易的。
  • Python是随着时间而发展的。一种新的代码被引入并打破了旧的代码,这使得Python成为一种活的语言。这导致了更多的开放源代码和解决方案。R的步骤没有那么前瞻性。相反,它一直保持纯净。
  • Python比R移动得更快,这是因为R的开发是为了方便统计人员,而不是计算机的方便。
  • Python由于其语法非常清楚易懂而获得了广泛的普及。数据科学家获得专业知识,并掌握使用Python编程的技巧,通过指定的步骤获得所需的输出。

Python的局限性:

  • 与其他编程语言相比,Python速度较慢,因为它是一种解释性语言。
  • Python需要严格的测试,因为在运行时会出现错误。
  • Python编程在移动计算平台上仍然被认为是薄弱的,因为很少有应用程序是用Python作为核心语言创建的。

R vs Python——优点和缺点
信息来源:DataCamp

R vs Python:工作机会和薪水

下图按编程语言显示了与数据科学相关的工作数量。SQL遥遥领先,其次是Python和Java。R等级5th.如果我们关注Python(橙色)和R(蓝色)之间的长期趋势,我们可以看到这一点在职位描述中,Python比R更常被引用

在工资方面,平均年薪为$99,000 (R)及$100,000 (Python)

Python开发人员的平均工资是多少?(2022年的指南)

美国的工资

Python -工资-美国
图片来源:DAXX

R vs Python:印度的工作和工资

以下是调查结果印度年度薪酬研究旨在了解印度分析和数据科学组织中广泛的当前和新兴的薪酬趋势。

R vs Python——印度的工资
图片来源:分析印度杂志

R vs Python——印度的工资
图片来源:分析印度杂志

Python与R
图片来源:分析印度杂志

R vs Python - Metareview
图片来源:分析印度杂志

R vs Python -印度的工作和工资
图片来源:分析印度杂志

印度数据科学家和分析师的工资
图片来源:分析印度杂志

Python vs R -工作和工资
图片来源:分析印度杂志

掌握多种工具显然会让你赚得更多。请看下面的图表(2016 - 2017年数据).

印度的工资——R vs Python
来源:NDTV

学习R & Python最受欢迎的在线课程

R类热门在线课程:

绝对初学者编程

R编程

统计数据与R

数据科学与机器学习与R

R Programming A-Z for Data Science with Real Exercises

统计与数据科学程序设计

基于R的文本挖掘、裁剪与情感分析

使用R掌握数据可视化(使用R基础图形、格包和ggplot/GGPlot2)

Python热门在线课程:

数据科学与Python的学生和初学者

用Python从头开始掌握机器学习

Python对每个人都

完整的Python训练营

Python数据科学导论

Python用于数据科学和机器学习训练营

机器学习在Python中的应用

IBM使用Python进行机器学习

机器学习A-Z™:数据科学中的实践Python和R

使用Pandas和Python进行数据分析

数据科学与Python和Pandas, Numpy, Matplotlib

使用Python和Matplotlib进行数据可视化

顶点:用Python检索、处理和可视化数据

如果你是一个数据科学的初学者应该做什么?

如果您是数据科学的新手,但拥有必要的统计学基础,想要了解算法如何工作和部署模型,您应该首先学习Python。作为初学者,学习如何从零开始构建模型,然后切换到机器学习库中的函数可能更容易。

如果您已经知道算法,或者想马上开始进行数据分析,那么R和Python都是可以的。然而,如果你要专注于统计方法,你应该选择R。

其次,如果您想做的不仅仅是统计,比如部署和再现性,那么Python是更好的选择。如果您需要写报告和创建仪表板,那么R更适合您的工作。

R vs Python——你应该用哪一个?
图片来源:革命性的分析

Python或R ?结论

在R和Python之间的选择实际上取决于您的知识水平和目标。但是,接下来你需要学习这两种。

    如果您需要申请方面的帮助,请填写此表格






    日常用户和数据科学家正在两全其美,因为R用户可以在R中运行rPython包来从R中运行Python代码,而使用RPy2库的Python用户可以从Python环境中运行R代码。

    相关文章:

    学习数据科学和机器学习工具的顶级平台和资源

    如何在2018年获得数据科学、机器学习和人工智能的工作

    全球顶尖的数据科学、机器学习、人工智能、商业分析和大数据硕士大学——美国、加拿大、澳大利亚、欧洲

    印度的数据科学工作:角色和责任,所需的技能和经验,顶级行业,培训和课程,以及最佳公司

    数据工程师vs数据科学家——背景、责任、技能、工作前景和薪水

    引用:123.456789101112

    特色图片来源:工作的国家

    默认的图片
    Tanmoy雷
    我是一名职业顾问和入学顾问。此外,我还在stand管理运营。我在英国获得硕士学位(阿斯顿大学),并曾在牛津大学(英国),乌得勒支大学(荷兰)新南威尔士大学(澳大利亚)和MeetUniversity(印度)。
    文章:562