文章来自:

商务合作:请加微信


IT技术交流群

我们在学习技术中单枪匹马,还不如一次短短的交流,你可以在别人吸取各种学习经验,学习方法以及学习技巧。所以,学习与交流少不了一个圈子,提升你的学习技能,请点击加技术群:

精选文章正文

进程

进程是什么?进程是正在执行的程序;进程是正在计算机上执行的程序实例;进程是能分配给处理器并由处理器执行的实体。进程一般会包括指令集和系统资源集,这里的指令集是指程序代码,这里的系统资源集是指I/O、CPU、内存等。综合起来,我们也可以理解进程是具有一定独立功能的程序在关于某个数据集合上的一次运行活动, 进程是系统进行资源分配和调度的一个独立单位。

在进程执行时,进程都可以被唯一的表示,由以下一些元素组成:

进程描述符:进程的唯一标识符,用来和其它进程区分。在Linux中叫进程ID,在系统调用fork期间生成,只是我们通过返回的不是其pid字段,而是其线程组号tgid。

进程状态:我们常说的挂起、运行等状态,其表示的是当前的状态。

优先级:进程间的执行调度相关,相对于其它进程而言。

程序计数器:程序中即将被执行的下一条指令的地址,该地址是内核术中或用户内存空间中的内存地址。

内存指针:包括程序代码和进程相关数据的指针,还有和其它进程共享内存块的指针。

上下文数据:进程执行时处理器的寄存器的数据。

I/O状态信息:包括显式的I/O请求、分配给进程的I/O设备等

记账信息:可能包括处理器时间总和、使用的时钟数总和、时间限制等

以上的这些元素都会放在一个叫做进程控制块的数据结构中。进程控制块是操作系统能够支持多进程和提供多处理的结构。

当操作系统做进程切换时,它会执行两步操作,一是中断当前处理器中的进程,二是执行下一个进程。

不管是中断还是执行,进程控制块中的程序计数器、上下文数据和进程状态都会发生变化。当进程中断时,操作系统会把程序计数器和处理器寄存器(对应进程控制块中的上下文数据)保存到进程控制块中的相应位置, 进程状态也会有所变化,可能进入阻塞状态,也有可能进入就绪态。

当执行下一个进程时,操作系统按规则将下一个进程设置为运行态,并加载即将要执行进程的程序上下文数据和程序计数器等。

PHP是单进程执行

我们都知道PHP是单进程执行的,PHP处理多并发主要是依赖服务器或PHP-FPM的多进程及它们进程的复用php完全自学手册,但PHP实现多进程也意义重大,尤其是在后台Cli模式下处理大量数据或运行后台DEMON守护进程时,多进程的优势不用多说。

PHP的多线程也曾被人提及,但进程内多线程资源共享和分配的问题难以解决。PHP也有多线程想关的扩展 ,但据说不太稳定,且要求环境为线程安全,所用不多。

以前PHP群里的一位大神曾指导说后台PHP想进阶必然避不开多进程,正好公司里的守护进程也应用了PHP的多进程,结合着谷哥的各种资料和手册,总算理解了多进程。

要实现PHP的多进程,我们需要两个扩展 pcntl 和 posix,安装方法这里不再赘述。

在php中我们使用()来创建多进程(在*NIX系统的C语言编程中,已有进程通过调用fork函数来产生新的进程)。fork出来新进程则成为子进程,原进程则成为父进程,子进程拥有父进程的副本。

这里要注意:

• 子进程与父进程共享程序正文段

• 子进程拥有父进程的数据空间和堆、栈的副本php完全自学手册,注意是副本,不是共享

• 父进程和子进程将继续执行fork之后的程序代码

• fork之后,是父进程先执行还是子进程先执行无法确认,取决于系统调度(取决于信仰)

这里说子进程拥有父进程数据空间以及堆、栈的副本,实际上,在大多数的实现中也并不是真正的完全副本。更多是采用了COW(Copy On Write)即写时复制的技术来节约存储空间。

简单来说,如果父进程和子进程都不修改这些 数据、堆、栈 的话,那么父进程和子进程则是暂时共享同一份 数据、堆、栈。只有当父进程或者子进程试图对 数据、堆、栈 进行修改的时候,才会产生复制操作,这就叫做写时复制。

在调用完()后,该函数会返回两个值。在父进程中返回子进程的进程ID,在子进程内部本身返回数字0。由于多进程在或者fpm环境下无法正常运行,所以大家一定要在php cli环境下执行代码。

创建子进程

创建PHP子进程是多进程的开始,我们需要()函数;

fork函数详解

() — 在当前进程当前位置产生分支(子进程)。

此函数创建了一个新的子进程后,子进程会继承父进程当前的上下文,和父进程一样从() 函数处继续向下执行,只是获取到的() 的返回值不同,我们便能从判断返回值来区分父进程和子进程,分配父进程和子进程去做不同的逻辑处理。

() 函数成功执行时会在父进程返回子进程的进程id(pid),因为系统的初始进程init进程的pid为1,后来产生进程的pid都会大于此进程,所以我们可以通过判断()的返回值大于1来确实当前进程是父进程;

而在子进程中,此函数的返回值会是固定值0,我们也可以通过判断()的返回值为0来确定子进程;而()函数在执行失败时,会在父进程返回-1,当然也不会有子进程产生。

fork进程实例

fork子进程

$ppid = posix_getpid();

$pid = pcntl_fork();

if ($pid == -1) {

  throw new Exception('fork child process fail');

} elseif ($pid > 0) {

  cli_set_process_title("我是父 process,pid is : {$ppid}.");

  sleep(30);

else {

  $cpid = posix_getpid();

  cli_set_process_title("我是 {$ppid} 子的 process,我的 process pid is : {$cpid}.");

  sleep(30);

}

说明:

():返回当前进程 id

e('进程名称'):为当前进程取一个响亮的名字。

运行这个例子,我们便能看到当前两个PHP进程了。

www@iZ2zec3dge6rwz2uw4tveuZ:~/test$ ps aux|grep -v grep |grep 我

www   18026 0.5 1.2 204068 25772 pts/0  S+  14:08  0:00 我是父 process,pid is : 18026.

www   18027 0.0 0.3 204068 6640 pts/0  S+  14:08  0:00 我 18026 子的 process,我的 process pid is : 18027. 

第一段代码,在程序从()后父进程和子进程将各自继续往下执行代码:

$pid = pcntl_fork();

if$pid > 0 ){

 echo "我是父亲".PHP_EOL;

else if( 0 == $pid ) {

 echo "我是儿子".PHP_EOL;

else {

 echo "fork失败".PHP_EOL;

} 

结果:

www@iZ2zec3dge6rwz2uw4tveuZ:~/test$ php 123.php

我是父亲

我是儿子

第二段代码,用来说明子进程拥有父进程的数据副本,而并不是共享:

// 初始化一个 number变量 数值为1

$number = 1;

$pid = pcntl_fork();

if ($pid > 0) {

  $number += 1;

  echo "我是父亲,number+1 : { $number }" . PHP_EOL;

else if (0 == $pid) {

  $number += 2;

  echo "我是儿子,number+2 : { $number }" . PHP_EOL;

else {

  echo "fork失败" . PHP_EOL;

}

结果

www@iZ2zec3dge6rwz2uw4tveuZ:~/test$ php 1234.php

我是父亲,number+1 : { 2 }

我是儿子,number+2 : { 3 }

线程

进程有两个特性部分:资源所有权和调度执行。

资源所有权是指进程包括了进程运行所需要的内存空间、I/O等资源。

调度执行是指进程执行过程中间的执行路径,或者说程序的指令执行流。

这两个特性部分是可以分开的,分开后,拥有资料所有权的通常称为进程,拥有执行代码的可分派部分的被称之为线程或轻量级进程。

线程有“执行的线索”的意思在里面,而进程在多线程环境中被定义为资源所有者,其还是会存储进程的进程控制块。线程的结构与进程不同,

每个线程包括:

线程状态:线程当前的状态。

一个执行栈

私有的数据区:用于每个线程局部变量的静态存储空间

寄存器集:存储处理器的一些状态

每个进程都有一个进程控制块和用户地址空间,每个线程都有一个独立的栈和独立的控制块,都有自己一个独立执行上下文。其结构如图所示。

php手册书籍_php完全自学手册_php自学网

线程在执行过程中与进程有一些不同。每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行,必须依存在于进程之中,由进程提供多个线程执行控制。

从逻辑角度来看,多线程的意义在于一个进程中,有多个执行部分可以同时执行。此时,进程本身不是基本运行单位,而是线程的容器。

线程较之进程,其优势在于一个快,不管是创建新的线程还是终止一个线程;不管是线程间的切换还是线程间共享数据或通信,其速度与进程相比都有较大的优势。

并发及并行

并发又称共行,是指能处理多个同时性活动的能力,并发事件之间不一定要同一时刻发生。比如,现代计算机系统可在同一段时间内以进程的形式将多个程序加载到存储器中,并借由处理器的时分复用, 以在一个处理器上表现出同时运行的感觉。

并行是指同时发生的两个并发事件,具有并发的含义,而并发则不一定并行。

并发和并行的区别就是一个处理器同时处理多个任务和多个处理器或者是多核的处理器同时处理多个不同的任务。前者是逻辑上的同时发生(),而后者是物理上的同时发生。

PHP的各种并发模型

既然有两种模型,那么PHP使用的是哪一种呢?答案是都支持,也就是说PHP支持多线程的模型, 在多线程情况下通常要解决资源共享和隔离的问题。PHP本身是线程安全的。

具体来说是那种模型需要看使用的是哪个SAPI,比如说在中,那么就可能使用多线程模型, 也可能使用多进程模型。而php-fpm使用的就是多进程模型。

目前比较推荐的方式是使用php-fpm的模型,因为这个模型对于PHP来说有诸多的优势:

内存释放简单,使用多进程模型时进程可以容易通过退出的方式来释放内存, 由于PHP有非常多的扩展,稍有不慎就可能导致内存泄露,fpm通过进程退出方式 简单除暴的解决了问题。

容灾能力强,同样的问题,扩展或者php可能会出现段错误,如果是单进程多线程模型, 那么整个PHP就挂掉了。这会影响服务,多进程的话,某个进程死掉了也不会影响整体的服务。

多进程有多进程的优势,多线程也有多线程的优势,比如HHVM它选择的是多线程模型。多线程模型最大的好处是信息共享和通信方便,因为在同一个进程空间内,可以直接使用指针。

比如 cache工具,在PHP里,apc以及等等使用的是共享内存来共享, 那么在HHVM中则不需要走共享内存,共享内存还有个问题是存储复杂的数据结构不方便, 因为指针的问题,多线程情况下C/C++中的数据结构是可以共享的。这对效率提升也是有帮助的。

多进程和多线程还有一个明显的模型区别:在处理请求时的逻辑。

在多进程情况下,由于跨进程是不好传递fd连接的。那么多进程通常采用在父进程中(), 然后各个子进程()的方式来实现负载均衡。这样的模型下可能会有惊群的问题。

而多线程模型下,可以采用一个独立线程接受请求然后派发到各个线程的方式。

以上是本文的全部内容,希望对大家的学习有帮助,也希望大家多多支持php自学中心


限时特惠:
本站持续每日更新海量各大内部创业课程,一年会员仅需要98元,全站资源免费下载
点击查看详情

站长微信:Jiucxh

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注