python流水线框架pypeln的安装使用教程

作者：重庆制造漫画社 | 2022-01-25 23:41

这篇文章主要介绍了python流水线框架pypeln的安装使用教程,通过安装pipinstallpypeln，基本元素在文中给大家介绍过，需要的朋友可以参考下

1. 安装和入门使用

安装pip install pypeln，基本元素如下：

在这里插入图片描述

2 基于multiprocessing.Process

这个是基于多进程。

import pypeln as pl
import time
from random import random

def slow_add1(x):
    time.sleep(random()) # <= some slow computation
    return x + 1

def slow_gt3(x):
    time.sleep(random()) # <= some slow computation
    return x > 3

data = range(10) # [0, 1, 2, ..., 9] 

stage = pl.process.map(slow_add1, data, workers=3, maxsize=4)
stage = pl.process.filter(slow_gt3, stage, workers=2)

data = list(stage) # e.g. [5, 6, 9, 4, 8, 10, 7]

3 基于threading.Thread

顾名思义，基于多线程。

import pypeln as pl
import time
from random import random

def slow_add1(x):
    time.sleep(random()) # <= some slow computation
    return x + 1

def slow_gt3(x):
    time.sleep(random()) # <= some slow computation
    return x > 3

data = range(10) # [0, 1, 2, ..., 9] 

stage = pl.thread.map(slow_add1, data, workers=3, maxsize=4)
stage = pl.thread.filter(slow_gt3, stage, workers=2)

data = list(stage) # e.g. [5, 6, 9, 4, 8, 10, 7]

4 基于asyncio.Task

协程，异步io。

import pypeln as pl
import asyncio
from random import random

async def slow_add1(x):
    await asyncio.sleep(random()) # <= some slow computation
    return x + 1

async def slow_gt3(x):
    await asyncio.sleep(random()) # <= some slow computation
    return x > 3

data = range(10) # [0, 1, 2, ..., 9] 

stage = pl.task.map(slow_add1, data, workers=3, maxsize=4)
stage = pl.task.filter(slow_gt3, stage, workers=2)

data = list(stage) # e.g. [5, 6, 9, 4, 8, 10, 7]

5 三者性能对比

IO 密集型应用CPU等待IO时间远大于CPU 自身运行时间，太浪费；常见的 IO 密集型业务包括：浏览器交互、磁盘请求、网络爬虫、数据库请求等。
Python 世界对于 IO 密集型场景的并发提升有 3 种方法：多进程、多线程、异步 IO(asyncio)。理论上讲asyncio是性能最高的，原因如下：
1.进程、线程会有CPU上下文切换
2.进程、线程需要内核态和用户态的交互，性能开销大；而协程对内核透明的,只在用户态运行
3.进程、线程并不可以无限创建，最佳实践一般是 CPU*2；而协程并发能力强，并发上限理论上取决于操作系统IO多路复用(Linux下是 epoll)可注册的文件描述符的极限

在这里插入图片描述

下面是一个数据库访问的测试：

在这里插入图片描述

内存：
串行：75M
多进程：1.4G
多线程：150M
asyncio：120M

以上就是python流水线框架pypeln的安装使用教程的详细内容，更多关于python流水线框架的资料请关注其它相关文章！

推荐阅读

程序员
!pip install nltk - >权限被拒绝

如何解决《!pipinstallnltk->权限被拒绝》经验，为你挑选了1个好方法。 ... [详细]
程序员
从NUnit TestContext检索测试持续时间

如何解决《从NUnitTestContext检索测试持续时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误:任务执行失败':app:transformResourcesWithMergeJavaResForDebug'

如何解决《错误:任务执行失败':app:transformResourcesWithMergeJavaResForDebug'》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Ubuntu上运行docker:挂载的主机卷不能从容器写入

如何解决《在Ubuntu上运行docker:挂载的主机卷不能从容器写入》经验，为你挑选了2个好方法。 ... [详细]
程序员
检查String是否是列表中元素的串联

如何解决《检查String是否是列表中元素的串联》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在常规语法的模型中实现通配符,字符类,否定字符类等？

如何解决《如何在常规语法的模型中实现通配符,字符类,否定字符类等？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Typescript - TypeError myclass.myFunction不是函数

如何解决《Typescript-TypeErrormyclass.myFunction不是函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何禁用snackbar的轻扫到解雇行为

如何解决《如何禁用snackbar的轻扫到解雇行为》经验，为你挑选了3个好方法。 ... [详细]
程序员
角度2组件未显示

如何解决《角度2组件未显示》经验，为你挑选了1个好方法。 ... [详细]
程序员
"获取"的隐含声明

如何解决《"获取"的隐含声明》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何从Google Custom Search API获得100多个结果

如何解决《如何从GoogleCustomSearchAPI获得100多个结果》经验，为你挑选了1个好方法。 ... [详细]
程序员
鼠标悬停在阴谋和闪亮

如何解决《鼠标悬停在阴谋和闪亮》经验，为你挑选了1个好方法。 ... [详细]
程序员
Scalamock 3.模拟重载方法没有参数

如何解决《Scalamock3.模拟重载方法没有参数》经验，为你挑选了3个好方法。 ... [详细]
程序员
Picasso for android主要错误

如何解决《Picassoforandroid主要错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
在终端（Mac）中的目录之间复制所有文件

如何解决《在终端（Mac）中的目录之间复制所有文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
nuspec contentFiles示例

如何解决《nuspeccontentFiles示例》经验，为你挑选了1个好方法。 ... [详细]
程序员
Google地图 - Safari中某些缩放级别的奇怪垂直和水平线条

如何解决《Google地图-Safari中某些缩放级别的奇怪垂直和水平线条》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用multiprocessing.pool.map传递kwargs

如何解决《使用multiprocessing.pool.map传递kwargs》经验，为你挑选了2个好方法。 ... [详细]
程序员
检查数组中是否包含除null之外的其他内容？

如何解决《检查数组中是否包含除null之外的其他内容？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我不能在数据模板中使用{x:Bind {RelativeSource Self}}？

如何解决《为什么我不能在数据模板中使用{x:Bind{RelativeSourceSelf}}？》经验，为你挑选了1个好方法。 ... [详细]

重庆制造漫画社

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章