来自 威尼斯国际官方网站 2019-09-16 09:41 的文章
当前位置: 威尼斯国际官方网站 > 威尼斯国际官方网站 > 正文

Python发展介绍,为啥Python为如此慢

Python语言 近年来 人气爆棚 。它广泛应用于网络开发运营,数据科学,网络开发,以及网络安全问题中。

一、            Python主要应用领域

然而, Python 在速度上完全没有优势可言。

(1)       云计算

在速度上,Java如何同C,C++,C#或者Python相比较?答案几乎完全取决于要运行的应用。在这个问题上,没有完美的评判标准,然而The Computer Language Benchmarks Game 是一个不错的方法。

(2)       WEB开发

链接:

(3)       科学计算、人工智能

(4)       系统运维

基于我对The Computer Language Benchmarks Game超过十年的观察,相比于Java,C#,Go,JavaScript, C++等,Python是最慢的语言之一。其中包括了 JIT (C#, Java) 和 AOT (C, C++)编译器,以及解释型语言,例如JavaScript。

(5)       金融

动态编译:

(6)       图形GUI

二、            Python在一些公司的应用

静态编译:

(1)       谷歌

(2)       CIA

注意:当我提到“Python”时,我指的是CPython这个官方的解释器。我也将在本文中提及其他的解释器。

(3)       NASA

我想要回答这样一个问题:当运行同一个程序时,为什么Python会 比其他语言慢2到10倍?为什么我们无法将它变得更快?

(4)       YouTube

以下是最主要的原因:

(5)       Dropbox

  • “它是GIL(Global Interpreter Lock全局解释器锁)”
  • “它是解释型语言而非编译语言”
  • “它是动态类型语言”

(6)       Instagram

那么以上哪种原因对性能影响最大呢?

(7)       Facebook

“它是全局解释器锁”

(8)       Redhat

现代计算机的CPU通常是多核的,并且有些拥有多个处理器。为了充分利用多余的处理能力,操作系统定义了一种低级的结构叫做线程:一个进程(例如Chrome浏览器)可以产生多个线程并且指导内部系统。

(9)       豆瓣

如果一个进程是CPU密集型,那么其负载可以被多核同时处理,从而有效提高大多数应用的速度。

(10)   知乎

当我写这篇文章时,我的Chrome浏览器同时拥有44个线程。注意,基于POSIX(比如MacOS和Linux)和Windows操作系统相比,线程的结构和API是不同的。操作系统也会处理线程的调度问题。

(11)   春雨医生

如果你之前没有做过多线程编程,你需要快速熟悉锁的概念。区别于单线程进程,你需要确保当内存中的变量被修改时,多线程不会同时试图访问或者改变同一个存储地址。

(12)   等等

当CPython创建变量时,它会预先分配存储空间,然后计算当前变量的引用数目。这个概念被称为引用计数。如果引用计数为零,那么它将从系统中释放对应存储区域。

三、            Python

这就是为什么在CPython中创造“临时”变量不会使应用占用大量的存储空间——尤其是当应用中使用了for循环这一类可能大量创建“临时”变量的结构时。

python动态语言,强类型语言

当存在多个线程调用变量时,CPython如何锁住引用计数成为了一个挑战。而“全局解释锁”应运而生,它能够谨慎控制线程的执行。无论有多少的线程,解释器每次只能执行一个操作。

(一)    优点

这对Python的性能意味着什么呢?

(1)           Python的定位是“优雅”、“明确”、“简单”,所以Python程序看上去总是简单易懂,初学者学Python,不但入门容易,而且将来深入下去,可以编写那些非常非常复杂的程序。

如果你的应用基于单线程、单解释器,那么讨论速度这一点就毫无意义,因为去掉GIL并不会影响代码性能。

(2)           开发效率非常高,Python有非常强大的第三方库,基本上你想通过计算机实现任何功能,Python官方库里都有相应的模块进行支持,直接下载调用后,在基础库的基础上再进行开发,大大降低开发周期,避免重复造轮子。

如果你想使用线程在单解释器(Python 进程)中实现并发,并且你的线程为IO密集型(例如网络IO或磁盘IO),你就会看到GIL争用的结果。

(3)           高级语言——当你用Python语言编写程序的时候,你无需考虑诸如如何管理你的程序使用的内存一类的底层细节

如果你有一个网络应用(例如Django)并且使用WSGI,那么每一个对于你的网络应用的请求将是一个独立的Python解释器,因此每个请求只有一个锁。因为Python解释器启动很慢,一些WSGI便集成了能够使保持Python进程的“守护进程”  。

(4)           可移植性——由于它的开源本质,Python已经被移植在许多平台上(经过改动使它能够工 作在不同平台上)。如果你小心地避免使用依赖于系统的特性,那么你的所有Python程序无需修改就几乎可以在市场上所有的系统平台上运行

那么其他Python解释器的速度又如何呢?

(5)           可扩展性——如果你需要你的一段关键代码运行得更快或者希望某些算法不公开,你可以把你的部分程序用C或C++编写,然后在你的Python程序中使用它们。

PyPy拥有GIL,通常比CPython快至少三倍。

(6)           可嵌入性——你可以把Python嵌入你的C/C++程序,从而向你的程序用户提供脚本功能。

Jython没有GIL,因为在Jython中Python线程是用Java线程表示的,这得益于JVM内存管理系统。

(二)    缺点:

JavaScript是如何做到这一点的呢?

(1)           速度慢,Python 的运行速度相比C语言确实慢很多,跟JAVA相比也要慢一些,因此这也是很多所谓的大牛不屑于使用Python的主要原因,但其实这里所指的运行速度慢在大多数情况下用户是无法直接感知到的,必须借助测试工具才能体现出来,比如你用C运一个程序花了0.01s,用Python是0.1s,这样C语言直接比Python快了10倍,算是非常夸张了,但是你是无法直接通过肉眼感知的,因为一个正常人所能感知的时间最小单位是0.15-0.4s左右,哈哈。其实在大多数情况下Python已经完全可以满足你对程序速度的要求,除非你要写对速度要求极高的搜索引擎等,这种情况下,当然还是建议你用C去实现的。

首先,所有的Javascript引擎使用标记加清除的垃圾收集系统,而之前提到GIL的基本诉求是CPython的存储管理算法。

(2)           代码不能加密,因为PYTHON是解释性语言,它的源码都是以名文形式存放的,不过我不认为这算是一个缺点,如果你的项目要求源代码必须是加密的,那你一开始就不应该用Python来去实现。

JavaScript没有GIL,但因为它是单线程的,所以也并不需要GIL。

(3)           线程不能利用多CPU问题,这是Python被人诟病最多的一个缺点,GIL即全局解释器锁(Global Interpreter Lock),是计算机程序设计语言解释器用于同步线程的工具,使得任何时刻仅有一个线程在执行,Python的线程是操作系统的原生线程。在Linux上为pthread,在Windows上为Win thread,完全由操作系统调度线程的执行。一个python解释器进程内有一条主线程,以及多条用户程序的执行线程。即使在多核CPU平台上,由于GIL的存在,所以禁止多线程的并行执行。关于这个问题的折衷解决方法,我们在以后线程和进程章节里再进行详细探讨。

JavaScript通过事件循环和承诺/回调模式来实现异步编程的并发。Python有与异步事件循环相似的过程。

(三)       Python解释器

 “因为它是解释型语言”

(1)           CPython

 

当我们从Python官方网站下载并安装好Python 2.7后,我们就直接获得了一个官方版本的解释器:CPython。这个解释器是用C语言开发的,所以叫CPython。在命令行下运行python就是启动CPython解释器。

我经常听到这句话。我觉得这只是对于CPython实际运行方式的一种简单解释。如果你在终端中输入python myscript.py,那么CPython将对这段代码开始一系列的读取,词法分析,解析,编译,解释和运行。

CPython是使用最广的Python解释器。教程的所有代码也都在CPython下执行。

这个过程中的重要步骤是在编译阶段创建一个.pyc 文件,这个字节码序列将被写入Python3下__pycache__/ 路径中的一个文件(对于Python2,文件路径相同)。这个步骤不仅仅应用于脚本文件,也应用于所有导入的代码,包括第三方模块。

(2)           IPython

所以大多时候(除非你写的代码只运行一次),Python是在解释字节码并且本地执行。下面我们将Java和C#.NET相比较:

IPython是基于CPython之上的一个交互式解释器,也就是说,IPython只是在交互方式上有所增强,但是执行Python代码的功能和CPython是完全一样的。好比很多国产浏览器虽然外观不同,但内核其实都是调用了IE。

Java编译成一门“中间语言”,然后Java虚拟机读取字节代码并即时编译为机器代码。.NET的通用中间语言(CIL)是一样的,它的通用语言运行时间(CLR)也采用即时编译的方法转化为机器代码。

CPython用>>>作为提示符,而IPython用In [序号]:作为提示符。

那么,如果Python用的是和Java和C#一样的虚拟机和某种字节代码,为什么在基准测试中它却慢得多?首先,.NET和Java是采用JIT编译的。

(3)           PyPy

JIT,又称即时编译,需要一种中间语言来把代码进行分块(或者叫数据帧)。预编译(AOT, Ahead of Time)器的设计保证了CPU能够在交互之前理解代码中的每一行。

PyPy是另一个Python解释器,它的目标是执行速度。PyPy采用JIT技术,对Python代码进行动态编译(注意不是解释),所以可以显著提高Python代码的执行速度。

JIT本身不会使执行速度更快,因为它仍然执行相同的字节码序列。但是,JIT允许在运行时进行优化。好的JIT优化器可以检测哪些部分执行次数比较多,这些部分被称为“热点”。然后,它将用更高效的代码替换它们,完成优化。

绝大部分Python代码都可以在PyPy下运行,但是PyPy和CPython有一些是不同的,这就导致相同的Python代码在两种解释器下执行可能会有不同的结果。如果你的代码要放到PyPy下执行,就需要了解PyPy和CPython的不同点。

这就意味着当计算机应用程序需要重复做一件事情的时候,它就会更加地快。另外,我们要知道Java和C#是强类型语言(变量需要预定义),因此优化器可以对代码做更多的假设。

(4)           Jython

PyPy使用即时编译器,并且前文也有提到它比CPython更快。这篇关于基准测试的文章介绍得更为详细——什么版本的Python最快?

Jython是运行在Java平台上的Python解释器,可以直接把Python代码编译成Java字节码执行。

链接:

(5)           IronPython

本文由威尼斯国际官方网站发布于威尼斯国际官方网站,转载请注明出处:Python发展介绍,为啥Python为如此慢

关键词: