1500字范文 > python并发处理list数据_python之并发基础（进程）

python并发处理list数据_python之并发基础（进程）

时间：2020-11-20 20:27:54

今日内容：

操作系统发展史

多道技术

进程理论

开启进程的两种方式

进程对象的join方法

进程之间数据的相互隔离

进程对象的其他方法

僵尸进程和孤儿进程

守护进程

互斥锁

队列介绍

进程间通信IPC机制

生产者消费者模型

必备知识回顾

计算机又叫电脑，即通电的大脑，发明计算机是为了通电以后能够像人一样去工作并且他比人的工作效率更高,因为可以24小时不间断。

计算机五大组成部分：控制器、运算器、存储器、输入设备、输出设备

计算机的核心真正干活的的是CPU(控制器+运算器 = 中央处理器)

程序想要被计算机运行，他的代码必须要由硬盘读取到内存，之后CPU取值在执行。

操作系统发展史

1946年第一台计算机诞生--20世纪50年代中期，计算机工作还在采用手工操作方式。此时还没有操作系统的概念。

程序员将对应于程序和数据的已穿孔的纸带（或卡片）装入输入机，然后启动输入机把程序和数据输入计算机内存，接着通过控制台开关启动程序针对数据运行；计算完毕，打印机输出计算结果；用户取走结果并卸下纸带（或卡片）后，才让下一个用户上机。

那短时间，同一时间机房里面只能有一个人再操作，对于操作者来说是有好处的，因为他想干嘛就干嘛，而对于在外面等待的程序员来说就非常不友好，极其浪费时间。

CPU等待卡片插入及读取完毕，CPU真正运作的时间非常的短，利用率非常的低。

联机批处理系统

机与输入机之间增加一个存储设备——磁带，在运行于主机上的监督程序的自动控制下，计算机可自动完成：成批地把输入机上的用户作业读入磁带，依次把磁带上的用户作业读入主机内存并执行并把计算结果向输出机输出。完成了上一批作业后，监督程序又从输入机上输入另一批作业，保存在磁带上，并按上述步骤重复处理。

监督程序不停地处理各个作业，从而实现了作业到作业的自动转接，减少了作业建立时间和手工操作时间，有效克服了人机矛盾，提高了计算机的利用率。

但是，在作业输入和结果输出时，主机的高速CPU仍处于空闲状态，等待慢速的输入/输出设备完成工作：主机处于“忙等”状态。

脱机批处理系统

为克服与缓解：高速主机与慢速外设的矛盾，提高CPU的利用率，又引入了脱机批处理系统，即输入/输出脱离主机控制。

卫星机：一台不与主机直接相连而专门用于与输入/输出设备打交道的。

高速磁带：CPU运行的速度是非常快的，而数据从硬盘读取到内存的速度相对来说是非常慢的，所以要用到高速磁带，而图中的高速磁带就演变成我们现在计算机的内存，让计算机和速度快的打交道。

输入机：也就是现在的硬盘

其功能是：

（1）从输入机上读取用户作业并放到输入磁带上。

（2）从输出磁带上读取执行结果并传给输出机。

这样，主机不是直接与慢速的输入/输出设备打交道，而是与速度相对较快的磁带机发生关系，有效缓解了主机与设备的矛盾。主机与卫星机可并行工作，二者分工明确，可以充分发挥主机的高速计算能力。

脱机批处理系统:20世纪60年代应用十分广泛，它极大缓解了人机矛盾及主机与外设的矛盾。

不足：每次主机内存中仅存放一道作业，每当它运行期间发出输入/输出（I/O）请求后，高速的CPU便处于等待低速的I/O完成状态，致使CPU空闲。

为改善CPU的利用率，又引入了多道程序系统。

多道技术

单核实现并发的效果

必备知识点：

并发

看起来相同时运行的就可以称之为并发

并行

真正意义上的同时执行

PS:

并行肯定算并发

单核的计算机肯定不能实现并行，但是可以实现并发！

补充：我们直接假设单核就是一个核，干活的就一个人，不要考虑CPU里面的内核数

多道技术图解

节省多个程序运行的总耗时

多道技术重点技术

空间上的复用与时间上的复用

空间上的复用

多个程序共用一套计算机硬件

时间上的复用

例子：洗衣服30s，做饭50s，烧水30s

但到需要110s,多到只需要任务长的那一个切换节省时间

例子：边吃饭边玩游戏保存状态

切换+保存状态

"""

切换(CPU)分为两种情况

1.当一个程序遇到IO操作的时候，操作系统会剥夺该程序的CPU执行权限

作用:提高了CPU的利用率并且也不影响程序的执行效率

2.当一个程序长时间占用CPU的时候，操作吸引也会剥夺该程序的CPU执行权限

弊端:降低了程序的执行效率(原本时间+切换时间)

"""

进程理论

必备知识点

程序与进程的区别

"""

程序就是一堆躺在硬盘上的代码，是“死”的

进程则表示程序正在执行的过程，是“活”的

"""

进程调度

先来先服务调度算法

"""对长作业有利，对短作业无益"""

短作业优先调度算法

"""对短作业有利，多长作业无益"""

时间片轮转法+多级反馈队列

比如有三个队列，比如有好几个程序进来，每个人都被时间片（将固定的时间切分成N多份，每一片就表示一个时间片）服务三秒钟，三秒钟接待完有的进程会结束有的还不够，如果发现还没有结束的话，放到第二个队列中接着再进行几个时间片来运行来程序，如果还没结束的话放到第三个队列，越往下说明该程序需要的时间越长，也就是说越往下任务的执行优先级越低。

当第一个队列中出现了新的任务，那么CPU会立刻停止第二队列或者第三队列当前执行的任务，去执行新添加进来的第一层队列中的任务。

在Linux中，可以对任务设置优先级，比如一次性分配给好几个时间片，这样就能确保该任务的优先级。

进程运行的三状态图

两对重要概念

同步和异步

"""描述的是任务的提交方式"""

同步:任务提交之后，原地等待任务的返回结果，等待的过程中不做任何事(干等)

程序层面上表现出来的感觉就是卡住了

异步:任务提交之后，不原地等待任务的返回结果，直接去做其他事情

我提交的任务结果如何获取？

任务的返回结果会有一个异步回调机制自动处理

阻塞和非阻塞

"""描述的程序的运行状态"""

阻塞:阻塞态

非阻塞:就绪态、运行态

理想状态:我们应该让我们的写的代码永远处于就绪态和运行态之间切换

上述概念的组合:最高效的一种组合就是异步非阻塞

开启进程的两种方式

定心丸:代码开启进程和线程的方式，代码书写基本是一样的，你学会了如何开启进程就学会了如何开启线程

from multiprocessing import Process

import time

def task(name):

print('%s is running'%name)

time.sleep(3)

print('%s is over'%name)

"""

Windows操作系统下，创建进程一定要在mian内创建

因为windows下创建进程类似于模块导入

会从上往下依次执行代码

linux中则是直接将代码完全拷贝一份，

"""

if __name__ == '__main__':

# 1 创建一个对象

p = Process(target=task, args=('pipi',))

# 容器类型哪怕里面只有1个元素建议要用逗号隔开

# 2 开启进程

p.start() # 告诉操作系统帮你创建一个进程异步

print('>>>>>')

# 第二种方式类的继承

from multiprocessing import Process

import time

class MyProcess(Process):

def run(self):

print('hello bf girl')

time.sleep(1)

print('get out!')

if __name__ == '__main__':

p = MyProcess()

p.start()

print('>>>>>')

总结

"""

创建进程就是在内存中申请一块内存空间将需要运行的代码丢进去

一个进程对应在内存中就是一块独立的内存空间

多个进程对应在内存中就是多块独立的内存空间

进程与进程之间数据默认情况下是无法直接交互,如果想交互可以借助于第三方工具、模块

"""

join方法

join是让主进程等待子进程代码运行结束之后，再继续运行。不影响其他子进程的执行

from multiprocessing import Process

import time

def task(name, n):

print('%s is running'%name)

time.sleep(n)

print('%s is over'%name)

if __name__ == '__main__':

# p1 = Process(target=task, args=('Lance', 1))

# p2 = Process(target=task, args=('lili', 2))

# p3 = Process(target=task, args=('pupu', 3))

# start_time = time.time()

# p1.start()

# p2.start()

# p3.start() # 仅仅是告诉操作系统要创建进程

# # time.sleep(50000000000000000000)

# # p.join() # 主进程等待子进程p运行结束之后再继续往后执行

# p1.join()

# p2.join()

# p3.join()

start_time = time.time()

p_list = []

for i in range(1, 4):

p = Process(target=task, args=('子进程%s'%i, i))

p.start()

p_list.append(p)

for p in p_list:

p.join()

print('>>>>>>', time.time() - start_time)

进程之间数据相互隔离

from multiprocessing import Process

money = 100

def task():

global money # 局部修改全局

money = 666

print('子',money)

if __name__ == '__main__':

p = Process(target=task)

p.start()

p.join()

print(money)

进程对象及其他方法

"""

一台计算机上面运行着很多进程，那么计算机是如何区分并管理这些进程服务端的呢？

计算机会给每一个运行的进程分配一个PID号

如何查看

windows电脑

进入cmd输入tasklist即可查看

tasklist |findstr PID查看具体的进程

mac电脑

进入终端之后输入ps aux

ps aux|grep PID查看具体的进程

"""

from multiprocessing import Process, current_process

current_process().pid # 查看当前进程的进程号

import os

os.getpid() # 查看当前进程进程号

os.getppid() # 查看当前进程的父进程进程号

p.terminate() # 杀死当前进程

# 是告诉操作系统帮你去杀死当前进程但是需要一定的时间而代码的运行速度极快

time.sleep(0.1)

print(p.is_alive()) # 判断当前进程是否存活

"""

一般情况下，我们会默认将

存储bool值的变量名

返回的结果是布尔值的方法名

都起成is_开头

"""

僵尸进程与孤儿进程(了解)

# 僵尸进程

"""

死了但是没有死透

当你开设了子进程之后该进程死后不会立刻释放占用的进程号

因为我要让父进程能够查看到它开设的子进程的一些基本信息占用的pid号运行时间。。。

所有的进程都会步入僵尸进程

父进程不死并且在无限制的创建子进程并且子进程也不结束

回收子进程占用的pid号

父进程等待子进程运行结束

父进程调用join方法

"""

# 孤儿进程

"""

子进程存活，父进程意外死亡

操作系统会开设一个“儿童福利院”专门管理孤儿进程回收相关资源

"""

守护进程

from multiprocessing import Process

import time

def task(name):

print('%s总管正在活着'% name)

time.sleep(3)

print('%s总管正在死亡' % name)

if __name__ == '__main__':

p = Process(target=task,args=('egon',))

# p = Process(target=task,kwargs={'name':'egon'})

p.daemon = True # 将进程p设置成守护进程这一句一定要放在start方法上面才有效否则会直接报错

p.start()

print('皇帝jason寿终正寝')

互斥锁

多个进程操作同一份数据的时候，会出现数据错乱的问题

针对上述问题，解决方式就是加锁处理:将并发变成串行，牺牲效率但是保证了数据的安全

from multiprocessing import Process, Lock

import json

import time

import random

# 查票

def search(i):

# 文件操作读取票数

with open('data','r',encoding='utf8') as f:

dic = json.load(f)

print('用户%s查询余票：%s'%(i, dic.get('ticket_num')))

# 字典取值不要用[]的形式推荐使用get 你写的代码打死都不能报错！！！

# 买票 1.先查 2.再买

def buy(i):

# 先查票

with open('data','r',encoding='utf8') as f:

dic = json.load(f)

# 模拟网络延迟

time.sleep(random.randint(1,3))

# 判断当前是否有票

if dic.get('ticket_num') > 0:

# 修改数据库买票

dic['ticket_num'] -= 1

# 写入数据库

with open('data','w',encoding='utf8') as f:

json.dump(dic,f)

print('用户%s买票成功'%i)

else:

print('用户%s买票失败'%i)

# 整合上面两个函数

def run(i, mutex):

search(i)

# 给买票环节加锁处理

# 抢锁

mutex.acquire()

buy(i)

# 释放锁

mutex.release()

if __name__ == '__main__':

# 在主进程中生成一把锁让所有的子进程抢谁先抢到谁先买票

mutex = Lock()

for i in range(1,11):

p = Process(target=run, args=(i, mutex))

p.start()

"""

扩展行锁表锁

注意：

1.锁不要轻易的使用，容易造成死锁现象(我们写代码一般不会用到，都是内部封装好的)

2.锁只在处理数据的部分加来保证数据安全(只在争抢数据的环节加锁处理即可)

"""

进程间通信

队列Queue模块

"""

管道:subprocess

stdin stdout stderr

队列:管道+锁

队列:先进先出

堆栈:先进后出

"""

from multiprocessing import Queue

# 创建一个队列

q = Queue(5) # 括号内可以传数字标示生成的队列最大可以同时存放的数据量

# 往队列中存数据

q.put(111)

q.put(222)

q.put(333)

# print(q.full()) # 判断当前队列是否满了

# print(q.empty()) # 判断当前队列是否空了

q.put(444)

q.put(555)

# print(q.full()) # 判断当前队列是否满了

# q.put(666) # 当队列数据放满了之后如果还有数据要放程序会阻塞直到有位置让出来不会报错

"""

存取数据存是为了更好的取

千方百计的存、简单快捷的取

同在一个屋檐下

差距为何那么大

"""

# 去队列中取数据

v1 = q.get()

v2 = q.get()

v3 = q.get()

v4 = q.get()

v5 = q.get()

# print(q.empty())

# V6 = q.get_nowait() # 没有数据直接报错queue.Empty

# v6 = q.get(timeout=3) # 没有数据之后原地等待三秒之后再报错 queue.Empty

try:

v6 = q.get(timeout=3)

print(v6)

except Exception as e:

print('一滴都没有了!')

# # v6 = q.get() # 队列中如果已经没有数据的话 get方法会原地阻塞

# print(v1, v2, v3, v4, v5, v6)

"""

q.full()

q.empty()

q.get_nowait()

在多进程的情况下是不精确

"""

IPC机制

from multiprocessing import Queue, Process

"""

研究思路

1.主进程跟子进程借助于队列通信

2.子进程跟子进程借助于队列通信

"""

def producer(q):

q.put('我是23号技师很高兴为您服务')

def consumer(q):

print(q.get())

if __name__ == '__main__':

q = Queue()

p = Process(target=producer,args=(q,))

p1 = Process(target=consumer,args=(q,))

p.start()

p1.start()

生产者消费者模型

"""

生产者:生产/制造东西的

消费者:消费/处理东西的

该模型除了上述两个之外还需要一个媒介

生活中的例子做包子的将包子做好后放在蒸笼(媒介)里面，买包子的取蒸笼里面拿

厨师做菜做完之后用盘子装着给你消费者端过去

生产者和消费者之间不是直接做交互的，而是借助于媒介做交互

生产者(做包子的) + 消息队列(蒸笼) + 消费者(吃包子的)

"""

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。