17.2.286. MPI_Publish_name

MPI_Publish_name — 发布与端口关联的服务名称

17.2.286.1. 语法

17.2.286.1.1. C语法

#include <mpi.h>

int MPI_Publish_name(const char *service_name, MPI_Info info,
     const char *port_name)

17.2.286.1.2. Fortran 语法

USE MPI
! or the older form: INCLUDE 'mpif.h'
MPI_PUBLISH_NAME(SERVICE_NAME, INFO, PORT_NAME, IERROR)
     CHARACTER*(*)   SERVICE_NAME, PORT_NAME
     INTEGER         INFO, IERROR

17.2.286.1.3. Fortran 2008 语法

USE mpi_f08
MPI_Publish_name(service_name, info, port_name, ierror)
     TYPE(MPI_Info), INTENT(IN) :: info
     CHARACTER(LEN=*), INTENT(IN) :: service_name, port_name
     INTEGER, OPTIONAL, INTENT(OUT) :: ierror

17.2.286.2. 输入参数

  • service_name: 服务名称(字符串)。

  • info: 命名服务函数的选项(句柄)。

  • port_name: 端口名称(字符串)。

17.2.286.3. 输出参数

  • ierror: 仅限Fortran:错误状态(整数)。

17.2.286.4. 描述

该例程发布(service_name, port_name)这对参数,使得应用程序可以通过调用MPI_Lookup_name并以service_name作为参数来获取port_name。重复发布相同的service_name,或使用调用进程未通过MPI_Open_port调用事先打开的port_name参数均会导致错误。

17.2.286.5. 信息参数

以下是info可识别的键:

Key                   Type      Description
---                   ----      -----------

ompi_global_scope     bool      If set to true, publish the name in
                                the global scope.  Publish in the local
                                scope otherwise.  See the NAME SCOPE
                                section for more details.

ompi_unique           bool      If set to true, return an error if the
                                specified service_name already exists.
                                Default to overwriting any pre-existing
                                value.

bool类型的info键实际上是字符串,但会按以下规则进行求值:如果字符串值是数字,则转换为整数并强制转为布尔值(即零值为假,非零值为真)。如果字符串值为(不区分大小写)"yes"或"true",则布尔值为真。如果字符串值为(不区分大小写)"no"或"false",则布尔值为假。所有其他字符串值均不被识别,因此视为假。

如果未提供信息键,该函数将首先检查是否已指定全局服务器且可用。如果是,则发布函数将默认首先使用全局范围,其次是本地范围。否则,数据将默认以本地范围发布。

17.2.286.6. 名称作用域

Open MPI 支持两种命名作用域:全局本地。本地作用域会将指定的服务/端口对存储在调用进程作业的mpirun所在的数据存储中。因此,使用本地作用域发布的数据只能被该mpirun启动的作业中的进程访问——例如,调用进程所在作业中的进程,或通过MPI_Comm_spawn启动的作业中的进程。

全局范围将指定的服务/端口对放置在位于中央服务器上的数据存储中,该服务器可被集群或环境中运行的所有作业访问。因此,使用全局范围发布的数据可以被多个mpirun访问,并用于作业间的MPI_Comm_connectMPI_Comm_accept操作。

请注意,全局范围操作需要中央服务器存在且调用进程能够与该服务器通信。如果指定了全局范围但未指定或无法找到全局服务器,MPI_Publish_name将返回错误。

Open MPI提供了一个名为ompi-server的服务器来支持全局范围操作。有关数据存储/查找操作的更详细说明,请参阅其手册页。

为了说明这些作用域规则的影响,假设有一个通过mpirun启动的作业——我们称之为“job1”。job1中的一个进程使用本地作用域创建并发布了一个服务/端口对。Open MPI会将这些数据存储在mpirun内部的数据存储中。

作业1中的一个进程(可能是执行发布的同一个进程,也可能是作业中的其他进程)随后调用MPI_Comm_spawn在此mpirun下启动另一个作业(称为"job2")。由于两个作业共享同一个mpirun,因此两个作业都可以访问本地范围数据。因此,job2中的进程可以使用本地范围执行MPI_Lookup_name来检索信息。

然而,假设另一个用户使用mpirun启动了一个作业——称之为"job3"。由于job1发布的服务/端口数据指定了本地作用域,job3中的进程无法访问该数据。相反,如果数据是以全局作用域发布的,那么只要mpirun知道如何联系中央服务器且进程能与其建立通信,job3中的任何进程都可以访问该数据。

17.2.286.7. 错误

几乎所有MPI例程都会返回一个错误值;C语言例程通过函数返回值返回,Fortran例程则通过最后一个参数返回。

在返回错误值之前,会调用与通信对象(如通信器、窗口、文件)关联的当前MPI错误处理程序。如果MPI调用未关联任何通信对象,则该调用被视为附加到MPI_COMM_SELF,并将调用关联的MPI错误处理程序。当MPI_COMM_SELF未初始化时(即在MPI_Init/MPI_Init_thread之前、MPI_Finalize之后,或仅使用会话模型时),错误会触发初始错误处理程序。初始错误处理程序可通过在使用世界模型时调用MPI_Comm_set_errhandler来修改MPI_COMM_SELF,或通过mpiexec的mpi_initial_errhandler命令行参数,或MPI_Comm_spawn/MPI_Comm_spawn_multiple的info键来设置。如果未设置其他适当的错误处理程序,则MPI I/O函数将调用MPI_ERRORS_RETURN错误处理程序,而其他所有MPI函数将调用MPI_ERRORS_ABORT错误处理程序。

Open MPI 包含三个可使用的预定义错误处理器:

  • MPI_ERRORS_ARE_FATAL 导致程序中止所有连接的MPI进程。

  • MPI_ERRORS_ABORT 一个可在通信器、窗口、文件或会话上调用的错误处理程序。当在通信器上调用时,其行为类似于在该通信器上调用MPI_Abort。如果在窗口或文件上调用,则行为类似于在包含对应窗口或文件中进程组的通信器上调用MPI_Abort。如果在会话上调用,则仅中止本地进程。

  • MPI_ERRORS_RETURN 向应用程序返回一个错误代码。

MPI应用程序也可以通过调用以下方式实现自己的错误处理程序:

请注意,MPI不保证MPI程序在出现错误后能够继续运行。

查看MPI手册页获取完整的MPI错误代码列表。

有关更多信息,请参阅MPI-3.1标准中的错误处理部分。