用户指南
安装
使用
首先,您必须导入 pandarallel:
然后,你必须初始化它。
该方法接受5个可选参数:
shm_size_mb: 已弃用 - 请勿使用。nb_workers: 并行化使用的工作线程数量。 (int) 如果未设置,则默认为可用核心的数量。progress_bar: 如果设置为True,则显示进度条。 (bool,默认值为False)verbose: 详细级别(整数,默认值为2)0- 不显示任何日志1- 仅显示警告日志2- 显示所有日志
use_memory_fs: (bool,None默认值)- 如果设置为 None,并且内存文件系统可用,
pandarallel将使用它在主进程和工作线程之间传输数据。如果内存文件系统不可用,pandarallel将默认使用多进程数据传输(管道)。 - 如果设置为
True,pandarallel将使用内存文件系统在主进程和工作线程之间传输数据,并将在内存文件系统不可用时引发SystemError。 - 如果设置为
False,pandarallel将使用多进程数据传输(管道)在主进程和工作线程之间传输数据。
- 如果设置为 None,并且内存文件系统可用,
使用内存文件系统可以减少主进程与工作进程之间的数据传输时间,尤其是在大数据场景下。
内存文件系统只有在目录 /dev/shm 存在且用户具有读取和写入权限时才被认为可用。
基本上,内存文件系统仅在某些Linux发行版上可用(包括Ubuntu)。