当前位置：首页 > 科技 > 软件

使用Ray轻松进行Python分布式计算

来源：责编：时间：2023-11-02 09:09:39 483观看

导读即使是具有多个CPU核心的单处理器计算机（处理器具有一个或多个核心，计算机具有一个或多个处理器），也会给人一种能够同时运行多个任务的错觉。当我们拥有多个处理器时，就可以真正以并行的方式执行计算。一、并行计算与分布

即使是具有多个CPU核心的单处理器计算机（处理器具有一个或多个核心，计算机具有一个或多个处理器），也会给人一种能够同时运行多个任务的错觉。当我们拥有多个处理器时，就可以真正以并行的方式执行计算。

一、并行计算与分布式计算的区别

并行计算在现代计算中非常有用，几乎是必需的，目的是实现最大性能。开发者将运行时间较长的计算任务分成较小的块，并将其分配给不同的处理器。这种策略使开发者能够在相同的时间内进行更多的计算。对于构建基于GUI的应用程序，总是需要对系统进行并行设计，以便一个线程可以保持可用状态以更新GUI并响应用户输入。

并行计算和分布式计算的区别在于，对于并行计算，多个处理器位于同一主板上。分布式计算则使用多台计算机同时解决问题。现代分布式系统能够在网络（局域网/广域网）上进行通信。分布式计算的优点在于其价格和可扩展性。如果开发者需要更多的计算能力，那么可以很轻松地添加更多的计算机。

从根本上讲，并行计算和分布式计算的架构非常相似。主要区别在于分布式计算使用的是分布式内存空间，而不是共享内存空间。它具有能够为开发者的应用程序提供统一逻辑（而不是物理）内存空间的软件层，可以帮助开发者将为并行计算编写的代码应用于分布式计算。

在本文中将介绍如何使用开源Python库Ray来帮助开发者进行并行和分布式计算，Ray将Pythonic函数和类转换为分布式设置中的任务和角色。本文将只介绍函数的示例，但是类的概念非常相似。

二、使用pip安装Ray

这将安装支持仪表板+集群启动器的Ray。

pip install 'ray[default]'

如果只想进行最小化安装：

pip install -U ray

三、使用Ray进行并行计算任务

接下来执行一个示例，该示例使用concurrent.futures，并将其与使用ray执行相同任务的运行进行比较。

import timeimport concurrent.futuresStime = time.perf_counter()tasks = []sleepTimes = [0.1, 0.2, 0.1, 0.5, 0.7, 0.9, 0.5,              0.4, 1.5, 1.3, 1.0, 0.3, 0.7, 0.6, 0.3, 0.8]print(f"Total time of sleep: {sum(sleepTimes)} for {len(sleepTimes)} tasks")def my_awesome_function(sleepTime=0.1):    time.sleep(sleepTime)    return f"Sleep time {sleepTime}"all_results = []with concurrent.futures.ProcessPoolExecutor() as executor:    tasks = [executor.submit(my_awesome_function, sleep)             for sleep in sleepTimes]    for ff in concurrent.futures.as_completed(tasks):        all_results.append(ff.result())print(f"Finished in {time.perf_counter()-Stime:.2f}")

这将返回：

$ python test_ray.py Total time of sleep: 9.9 for 16 tasks Finished in 1.65

这项工作在顺序执行时需要9.9秒完成。由于本文执行的是并行执行，因此在示例中只用了1.65秒就完成了这项工作。请注意，这个时间可能因为不同的计算机而有所不同。

现在使用Ray来完成同样的工作。本文首先使用ray.init()初始化Ray。然后，装饰器ray.remote将Python函数转换为可以异步远程执行的函数。它会立即返回N个可以并行执行的函数副本。

import timeimport rayimport concurrent.futuresStime = time.perf_counter()tasks = []sleepTimes = [0.1, 0.2, 0.1, 0.5, 0.7, 0.9, 0.5,              0.4, 1.5, 1.3, 1.0, 0.3, 0.7, 0.6, 0.3, 0.8]print(f"Total time of sleep: {sum(sleepTimes)} for {len(sleepTimes)} tasks")# 初始化Ray。ray.init()@ray.remote #convert to a function that can be executed remotely and asynchronouslydef my_awesome_function(sleepTime=0.1):    time.sleep(sleepTime)    return f"Sleep time {sleepTime}"tasks = []for sleep in sleepTimes:    tasks.append(my_awesome_function.remote(sleep))all_results = ray.get(tasks)print(f"Finished in {time.perf_counter()-Stime:.2f}")

这将返回：

Total time of sleep: 9.9 for 16 tasks Finished in 3.18

由于存在一些开销，会有一些延迟，但对于大型计算来说，这种延迟可以忽略不计。

四、大规模计算的聚合值

Ray可以轻松地用于聚合多个值，这对于构建需要跨多台机器进行计算的大型应用程序非常重要。对于大规模计算，Ray可以将聚合的运行时间从线性改为对数。

接下来看一个示例：

import timeimport rayimport numpy as npStime = time.perf_counter()@ray.remotedef create_matrix(size):    return np.random.normal(size=size)@ray.remotedef multiply_matrices(x, y):    return np.dot(x, y)@ray.remotedef sum_matrices(x, y):    return np.add(x, y)m1 = create_matrix.remote([1000, 1000])m2 = create_matrix.remote([1000, 1000])m3 = create_matrix.remote([1000, 1000])m4 = create_matrix.remote([1000, 1000])m12 = multiply_matrices.remote(m1, m2)m34 = multiply_matrices.remote(m3, m4)a12_34 =  sum_matrices.remote(m12, m34)## 结果MM = ray.get(a12_34)print(f"Finished in {time.perf_counter()-Stime:.2f}")

在上面的示例中，本文首先创建了四个矩阵，将它们分为两组，对每组中的矩阵进行乘法运算，然后对每组的乘法结果进行求和。在这里，乘法运算是并行进行的，然后将结果聚合以获得求和结果。

参考资料

【安装Ray】：https://docs.ray.io/en/latest/ray-overview/installation.html
Pierfederici, F. (2016). 《Distributed Computing with Python》. Journal of Physics A: Mathematical and Theoretical (Vol. 44, Issue 8). Packt Publishing Ltd.

本文链接：http://www.28at.com/showinfo-26-16533-0.html使用Ray轻松进行Python分布式计算

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：彩虹桥架构演进之路-性能篇

下一篇：七个杀手级IntelliJ IDEA插件

标签：

热门焦点

俄罗斯：将审查iPhone等外国公司设备保数据安全

iPhone和特斯拉都属于在各自领域领头羊的品牌，推出的产品也也都是数一数二的，但对于一些国家而言，它们的产品可靠性和安全性还是在限制范围内。近日，俄罗斯联邦通信、信息技术
8月总票房已突破10亿！《封神》第一：口碑已经成了

8月5日消息，据灯塔专业版数据，截至8月5日9时35分，8月总票房（含预售）已突破10亿。其中，《封神》以大比分的优势领先。根据官方消息，目前该片总票房已经超过14.
从 Pulsar Client 的原理到它的监控面板

背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题，比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态，
学习JavaScript的10个理由...

作者 | Simplilearn编译 | 王瑞平当你决心学习一门语言的时候，很难选择到底应该学习哪一门，常用的语言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
华为发布HarmonyOS 4：更好玩、更流畅、更安全

在8月4日的华为开发者大会2023（HDC.Together）大会上，HarmonyOS 4正式发布。自2019年发布以来，HarmonyOS一直以用户为中心，经历四年多的发展HarmonyOS已
苹果公司要求三星和LG Display生产「无边框」OLED iPhone显示屏

据 The Elec 报道，苹果已要求其供应商为未来的 iPhone 型号开发「无边框」OLED 显示面板。苹果显然已要求三星和 LG Display 开发新的 OLED 显示面
机构称Q2全球智能手机出货量同比下滑11% 苹果份额依旧第2

7月20日消息，据外媒报道，研究机构的报告显示，由于需求下滑，今年二季度全球智能手机的出货量，同比下滑了11%，三星、苹果等主要厂商的销量，较去年同期均有下
2022爆款：ROG魔霸6 冰川散热系统持续护航

喜逢开学季，各大商家开始推出自己的新产品，进行打折促销活动。对于忠实的端游爱好者来说，能够拥有一款梦寐以求的笔记本电脑是一件十分开心的事。但是现在的
Meta盲目扩张致超万人被裁，重金押注元宇宙而前景未明

图片来源：图虫创意日前，Meta创始人兼CEO 马克·扎克伯发布公开信，宣布Meta计划裁员超11000人，占其员工总数13%。他公开承认了自己的预判失误：“不仅

使用Ray轻松进行Python分布式计算

一、并行计算与分布式计算的区别

二、使用pip安装Ray

三、使用Ray进行并行计算任务

四、大规模计算的聚合值

参考资料

俄罗斯：将审查iPhone等外国公司设备保数据安全

8月总票房已突破10亿！《封神》第一：口碑已经成了

从 Pulsar Client 的原理到它的监控面板

学习JavaScript的10个理由...

华为发布HarmonyOS 4：更好玩、更流畅、更安全

苹果公司要求三星和LG Display生产「无边框」OLED iPhone显示屏

机构称Q2全球智能手机出货量同比下滑11% 苹果份额依旧第2

2022爆款：ROG魔霸6 冰川散热系统持续护航

Meta盲目扩张致超万人被裁，重金押注元宇宙而前景未明

最新推荐

猜你喜欢

热门推荐

相关资讯