网站建设czzmcn,知识库wordpress主题,无极分期网站,优化用户体验文章目录#x1f3aa; 进程的描述组织#x1f680;1.什么是进程#x1f680;2.进程的形成#x1f680;3.进程标识符 *⭐3.1 PS命令查看PID⭐3.2 /proc目录查看进程属性#x1f680;4.父子进程⭐4.1 系统调用获取PID⭐4.2 fork创建子进程⭐4.3 fork双返回值问题⭐4.4 写时拷… 文章目录 进程的描述组织1.什么是进程2.进程的形成3.进程标识符 *⭐3.1 PS命令查看PID⭐3.2 /proc目录查看进程属性4.父子进程⭐4.1 系统调用获取PID⭐4.2 fork创建子进程⭐4.3 fork双返回值问题⭐4.4 写时拷贝与虚拟内存⭐4.5 子进程执行部分代码 进程状态1.五状态模型2.Linux中进程状态的划分3.Linux七状态⭐3.1 R状态 和 X状态⭐3.2 S状态 和 D状态⭐3.3 T状态 和 t状态⭐3.4 Z僵尸状态进程的描述组织
进程Process是计算机中的程序关于某数据集合上的一次运行活动是系统进行资源分配的基本单位是操作系统结构的基础。在早期面向进程设计的计算机结构中进程是程序的基本执行实体在当代面向线程设计的计算机结构中进程是线程的容器。程序是指令、数据及其组织形式的描述进程是程序的实体简单来说进程就是一个正在运行的程序是担当分配系统资源的实体
1.什么是进程
我们前面说了进程是一个正在运行的程序我们上一篇博客(博客链接冯诺依曼体系结构和操作系统概念理解中说到操作系统诞生的意义就是对计算机软硬件资源进行管理而管理的本质就是先描述在组织每个进程包含它对应的代码和数据而描述进程的就是数据结构叫PCB(进程控制块)而每个PCB里面包含着进程相关的信息每款操作系统都有自己的PCB而Linux自己的PCB是task_structtask_struct的相关信息如下
标示符: 描述本进程的唯一标示符用来区别其他进程状态: 任务状态退出代码退出信号等优先级: 相对于其他进程的优先级程序计数器: 程序中即将被执行的下一条指令的地址内存指针: 包括程序代码和进程相关数据的指针还有和其他进程共享的内存块的指针上下文数据: 进程执行时处理器的寄存器中的数据[休学例子要加图CPU寄存器]I O状态信息: 包括显示的I/O请求,分配给进程的I O设备和被进程使用的文件列表记账信息: 可能包括处理器时间总和使用的时钟数总和时间限制记账号等。其他信息
2.进程的形成
当我们打开一个程序(本质上也是文件)实际上它是被加载到了内存中也就变成了进程。我们之前任何启动并运行程序的行为都会有操作系统帮助我们将程序转换成进程完成特定的任务。 我们启动应用程序的时候OS会将对应的程序的代码和数据加载到内存并且会形成当前程序对应的PCB将其链接。总之进程 内核中关于程序对应的数据结构 对应的代码和数据
3.进程标识符 *
进程标识符(PID)是大多数操作系统的内核用于唯一标识进程的一个数值。简言之就是进程的绰号。这一数值可以作为许多函数调用的参数以使调整进程优先级、kill(命令)进程之类的进程控制行为成为可能。
⭐3.1 PS命令查看PID
这里我们先写一个C程序命名为process1.c.
process1.c
#include stdio.h
#include unistd.hint main()
{while (1){printf(我是一个进程我叫process1.\n);sleep(2);}return 0;
}这里为了便于观察我们加上sleep函数让它休眠2ssleep()函数的头文件为unistd.h在通过make自动化构建 Makefile
process1:process1.cgcc process1.c -o process1
.PHONY:clean
clean:rm -f process1这里我们为了便于观察复制一个ssh渠道
我们开始运行我们的程序process1(每2s循环打印) 命令ps -axj 功能查看当前所有进程 我们通过管道过滤出process1输入ps -axj | grep process1 我们找到了进程可是它前面那串数字是什么呢我们键入命令ps -axj | head 1查看它的第一行.
另外我们查看我们自己的process1进程的时候发现它下面还有一个含有关键字process1的进程那么它是什么呢我们之前说过Linux每一个命令实际上也是一个可执行文件那么我们用的grep当然也是进程所以说显示的当然是grep的进程我们将它过滤掉即可ps -axj | head -1 ps -axj | grep process1 | grep -v grep 这样我们就找到了process1的PID为20824
⭐3.2 /proc目录查看进程属性
在 Linux 系统中/proc 目录是一个位于内存中的伪文件系统。该目录下保存的并不是真正的文件和目录而是一些【运行时】的信息如 CPU 信息、负载信息、系统内存信息、磁盘 IO 信息等。/proc目录是内核提供给我们的查询中心通过查询该目录下的文件内容可以获取到有关系统硬件及当前运行进程的信息。
./proc存放的是进程相关的所有信息在硬盘上并不存在在操作系统开机后才会创建.每新建一个进程操作系统都会在/proc目录下新建一个以进程PID命令的目录我们可以通过这个目录来查看该进程属性. 我们进入该目录即可查看process1进程相关信息。 当process1这个进程被杀死那么该PID目录将不复存在 命令kill -9 PID 功能杀死PID对应的进程 杀死该进程后该PID所对应的目录也将不复存在。
4.父子进程
所谓父子进程就是在一个进程的基础上创建出另一条完全独立的进程这个就是子进程相当于父进程的副本。
⭐4.1 系统调用获取PID
我们可以利用函数getpid()getppid()分别获取子进程父进程的PID头文件为sys/types.h和unistd.h
process2.c
#include stdio.h
#include sys/types.h
#include unistd.hint main()
{while (1){printf(我是子进程process1,我的PID是%d,我的父进程PID是%d\n, getpid(), getppid());sleep(2);}return 0;
}那么我们创建这个进程的父进程是什么呢我们停止程序。再次启动 由于每次启动操作系统都会给我们的进程分配一个唯一的PID但是我们的父进程的PID一直都没变说明它是个常驻进程我们利用PS命令来揭开这个进程的面纱 竟然是bashbash是我们Linux的shell程序我们默认创建的进程只要没有指定父进程默认它的父进程都是我们的bash如果把bash给kill掉那么我们的机器就只能重启了.
小科普vim注释代码
ctrl v进入视图模式 视图模式下我们只能根据vim的光标选中H(左)L(右)J(下)K(上)选中区域后键入大写的I然后输入//(注释符)然后esc退出即可完成对选中部分的注释同样的删除注释也在视图模式下进行用光标选中要删除的注释部分然后键入d即可删除注释
⭐4.2 fork创建子进程
我们可以通过pid_t fork()函数创建当前进程的子进程我们使用fork()后会变成两个执行流父子进程谁执行由操作系统决定同时fork()函数会有两个返回值(具体原因后续说明创建子进程成功的话会在父进程中返回子进程PID会在子进程中返回0若创建失败则返回-1.
所以我们可以用if…else函数来让父子进程分别执行不同的代码.
process3.c
#include stdio.h
#include assert.h
#include unistd.h
#include sys/types.hint main()
{pid_t ret fork();//assert(ret ! -1);if(ret 0){//子进程while(1){printf(我是子进程, 我的pid是: %d, 我的父进程是: %d,\n, getpid(), getppid());sleep(2);}}else if(ret 0){//父进程while(1){printf(我是父进程, 我的pid是: %d, 我的父进程是: %d,\n, getpid(), getppid());sleep(2);}}else{printf(创建失败\n);}return 0;
}
执行代码发现父子进程交替打印
⭐4.3 fork双返回值问题
我们通过查看fork函数源码得知fork函数的执行大概分为三个阶段: 1.调用_CREATE函数也就是进程创建部分 2.调用_CLONE函数也就是资源拷贝部分 3.进程创建成功return 0; 失败return -1 前两步中会由父进程来执行创建子进程的过程也就是拷贝代码和栈框等比如在copy_thread()函数里会复制父进程struct pt_regs栈框的全部内容到子进程的栈框里这个栈框描述内核栈上保存寄存器的全部信息。在执行完第二步之后父进程会得到一个返回值即为子进程PID。
然后最后一步剩余的代码会由子进程继续执行在执行这段代码的时copy_thread()函数还会修改子进程的栈框中X0寄存器的值为0因此在返回用户空间时子进程的返回值就是0通过X0寄存器来传递返回值。
总之父子进程会在fork函数中执行不同的代码段并获得不同的返回值
⭐4.4 写时拷贝与虚拟内存
我们来观察一下相同变量分别在父子进程中的地址块分布
#include stdio.h
#includesys/types.h
#includeunistd.hint main()
{int a 520;pid_t ret fork();if (ret 0){while (1){printf(I am child, my PID is %d,子进程中a的值是 %d 地址是 %p\n, getpid(), a, a);sleep(2);}}else if (ret 0){while (1){printf(I am father, my PID is %d,父进程中a的值是 %d 地址是 %p\n, getpid(), a, a);sleep(2);}}else{printf(创建子进程失败\n);}return 0;
}父子进程的变量刚开始是共享地址空间的而子进程在修改变量的值之前会发生写时拷贝即等到修改数据时才真正分配内存空间这是对程序性能的优化可以延迟甚至是避免内存拷贝当然目的就是避免不必要的内存拷贝。 当子进程的数据块被修改后OS会检查被修改数据是否有多个进程指向(比如父子进程)用count记录进程数如果有多个进程修改这时候子进程会重新找一块空间把数据拷贝然后再去修改对应的数据这样父子进程就指向了不同的地址空间。这就是写时拷贝
当我们在子进程中修改a的值时我们在运行看到如下结果 可以看到我们修改子进程中a的值后a的地址是一样的但是值却不一样这又是为什么呢不是发生了写时拷贝吗这是因为Linux上的地址并不是物理地址而是虚拟地址父子进程的虚拟地址相同但是映射到内存上的物理地址可能不同
下图是映射过程
总之对于父子进程代码共享数据独有修改变量时子进程会发生写时拷贝并且变量都存在虚拟地址空间
⭐4.5 子进程执行部分代码
子进程并不是执行父进程的全部代码若是执行全部代码子进程就会陷入无限创建子进程的死循环中无法自拔实际的执行如下 进程状态
进程状态反映进程执行过程的变化。这些状态随着进程的执行和外界条件的变化而转换。在三态模型中进程状态分为三个基本状态即运行态就绪态阻塞态。在五态模型中进程分为新建态、终止态运行态就绪态阻塞态.
1.五状态模型 创建状态进程在创建时需要申请一个空白PCB向其中填写控制和管理进程的信息完成资源分配。如果创建工作无法完成比如资源无法满足就无法被调度运行把此时进程所处状态称为创建状态 就绪状态进程已经准备好已分配到所需资源只要分配到CPU就能够立即运行 执行状态进程处于就绪状态被调度后进程进入执行状态 阻塞状态正在执行的进程由于某些事件I/O请求申请缓存区失败而暂时无法运行进程受到阻塞。在满足请求时进入就绪状态等待系统调用 终止状态进程结束或出现错误或被系统终止进入终止状态。无法再执行
如果进程运行时间片使用完也会进入就绪状态 其中就绪状态跟阻塞状态我们需要区分一下 由于CPU是非常昂贵的所以说进程只有在凑齐所有资源后才会进入就绪队列等待CPU的服务不会出现进程占用着CPU资源而还在等待着其它临界资源的情况
除了上述几种状态之外其实还存着挂起状态机器的资源是有限的在资源不足的情况下操作系统对在内存中的程序进行合理的安排其中有的进程被暂时调离出内存当条件允许的时候会被操作系统再次调回内存重新进入等待被执行的状态即就绪态系统在超过一定的时间没有任何动作。简单来说就是挂起状态就是当阻塞队列太大时会给内存造成压力此时操作系统会将进程的代码和数据挂到磁盘上将PCB指针保留在内存需要时在将进程调回内存
2.Linux中进程状态的划分
Linux的PCB(task_struct)中含有进程状态这个结构体源码中是这样定义这个结构体的
/*
* The task state array is a strange bitmap of
* reasons to sleep. Thus running is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] {
R (running), /* 0 */
S (sleeping), /* 1 */
D (disk sleep), /* 2 */
T (stopped), /* 4 */
t (tracing stop), /* 8 */
X (dead), /* 16 */
Z (zombie), /* 32 */
};简单来说Linux进程有以下七种状态
R 运行状态running : 并不意味着进程一定在运行中它表明进程要么是在运行中要么在运行队列里。S 睡眠状态sleeping): 意味着进程在等待事件完成这里的睡眠有时候也叫做可中断睡眠interruptible sleep。D 磁盘休眠状态Disk sleep有时候也叫不可中断睡眠状态uninterruptible sleep在这个状态的进程通常会等待IO的结束。T 停止状态stopped 可以通过发送 SIGSTOP 信号给进程来停止T进程。这个被暂停的进程可以通过发送 SIGCONT 信号让进程继续运行。t 追踪状态本质上也是一种停止状态X 死亡状态dead这个状态只是一个返回状态你不会在任务列表里看到这个状态Z 僵尸状态这个状态是一种特殊的状态进程已经杀死但是进程资源还保留着.
其实Linux的R状态包含了进程的就绪/执行态而SDTt状态都是阻塞状态的一种Z状态被称为僵尸状态是Linux的一种特殊状态。
3.Linux七状态 我们可以用PS命令查看Linux中正在运行进程的状态。
⭐3.1 R状态 和 X状态
Linux中的R状态包含就绪/运行状态。我们想要观察到R状态必须在保证不使用任何其它资源只使用CPU的情况下观察不然观察到的将可能不是R状态。
process5.c
#include stdio.hint main()
{while (1){//观察R状态死循环即可}return 0;
}小科普前台进程与后台进程
在我们用PS命令查看进程状态时进程状态通常会有RSRS…之类的情况其中
STAT 表示前台进程可以用Ctrl c 杀死前台进程STAT表示后台进程不能用Ctrl c杀死可以用kiil -9 PID杀死该进程
Linux的X状态表示该进程已被完全杀死无法在任务列表中看到该状态
⭐3.2 S状态 和 D状态
Linux的S状态表示可中断睡眠状态我们随便打开一个进程比如前面的process4 为什么该进程明明在运行为啥观察到的会是S状态呢这是因为该进程要打印那么就需要显示器这种资源由于CPU的运行速度极快我们很难观察到该进程正在CPU上运行的R状态而显示器的速度相对于CPU就会慢很多所以我们只能观察到S状态。
Linux的D状态表示不可中断睡眠状态此状态下操作系统无法杀死该进程那么这种状态在哪种场景下会出现呢
设计者发现会有这样的情况存在所以给进程新增了一个D状态该状态下操作系统无法将该进程杀死.
⭐3.3 T状态 和 t状态
Linux下的T和t状态都属于进程停止状态(也是一种阻塞)我们可以用kill -19 PID来暂停一个进程比如进程process2 暂停后该进程依然存在我们可以用kill -18 PID将该进程唤醒 注意暂停后在启动的进程属于后台进程得用kill -9 PID才能杀死
小科普kill信号表 命令kill -l 功能查看kill命令信号表 Linux的t状态跟T状态差不多我们可以在调试的时候观察到因为调试本身也是一个进程打断点相当于暂时中断调试进程有兴趣的小伙伴可以试试。
⭐3.4 Z僵尸状态
僵死状态Zombies是一个比较特殊的状态。当进程退出并且父进程使用wait()系统调用,在后续博客中说明没有读取到子进程退出的返回代码时就会产生僵死(尸)进程僵死进程会以终止状态保持在进程表中并且会一直在等待父进程读取退出状态代码。所以只要子进程退出父进程还在运行但父进程没有读取子进程状态子进程进入Z状态
我们可以用杀死子进程process4来观察到Z状态: 这是子进程就会处于Z状态.
那么僵尸进程存在的意义是什么呢意义是让父进程读取子进程的进程退出码如何查看 命令echo $? 功能查看当前进程的进程退出码 那么如果说父进程一致不读取僵尸子进程的进程退出码呢那么岂不是子进程会一直占用资源 僵尸进程的危害 进程的退出状态必须被维持下去因为他要告诉关心它的进程父进程你交给我的任务我办的怎么样了。可父进程如果一直不读取那子进程就一直处于Z状态是的维护退出状态本身就是要用数据维护也属于进程基本信息所以保存在task_struct(PCB)中换句话说 Z状态一直不退出 PCB一直都要维护是的那一个父进程创建了很多子进程就是不回收是不是就会造成内存资源的浪费是的 因为数据结构对象本身就要占用内存想想C中定义一个结构体变量对象是要在内存的某个位置进行开辟空间内存泄漏?是的