17.2.474. MPIX_Comm_revoke

MPIX_Comm_revoke - 撤销一个通信器,导致在该通信器上进行非本地操作时,所有进程都会引发错误。

这是用户级故障缓解ULFM扩展的一部分。

17.2.474.1. 语法

17.2.474.1.1. C语法

#include <mpi.h>
#include <mpi-ext.h>

int MPIX_Comm_revoke(MPI_Comm comm)

17.2.474.1.2. Fortran语法

USE MPI
USE MPI_EXT
! or the older form: INCLUDE 'mpif.h'

MPIX_COMM_REVOKE(COMM, IERROR)
     INTEGER COMM, IERROR

17.2.474.1.3. Fortran 2008 语法

USE mpi_f08
USE mpi_ext_f08

MPIX_Comm_revoke(comm, ierror)
     TYPE(MPI_Comm), INTENT(IN) :: comm
     INTEGER, OPTIONAL, INTENT(OUT) :: ierror

17.2.474.2. 输入参数

  • comm: 通信器(句柄)。

17.2.474.3. 输出参数

  • ierror: 仅限Fortran:错误状态(整数)。

17.2.474.4. 描述

此函数将通信器comm标记为在与其关联的组(本地和远程)中的所有MPI进程中已撤销。该函数不是集体操作,因此在远程MPI进程上无需匹配调用。

MPIX_Comm_is_revoked的文档详细说明了通信器在本地被撤销的条件,以及在被撤销的通信器上适用的语义。简而言之,当通信器被撤销时,非本地操作会引发MPIX_ERR_REVOKED类异常,但某些容错操作除外。

17.2.474.5. 撤销状态的传播与排序

该实现以容错方式传播撤销状态;因此,即使存在故障进程,属于comm的所有未故障MPI进程中的通信器都将被撤销。

在另一个进程的撤销调用与本地进程操作完成之间没有特定的顺序关系,例如,即使发送操作过程在发送方的撤销过程之前被调用,接收操作仍可能引发MPIX_ERR_REVOKED类错误。

17.2.474.6. 错误

几乎所有MPI例程都会返回一个错误值;C语言例程通过函数返回值返回,Fortran例程则通过最后一个参数返回。

在返回错误值之前,会调用与通信对象(如通信器、窗口、文件)关联的当前MPI错误处理程序。如果MPI调用未关联任何通信对象,则该调用被视为附加到MPI_COMM_SELF,并将调用关联的MPI错误处理程序。当MPI_COMM_SELF未初始化时(即在MPI_Init/MPI_Init_thread之前、MPI_Finalize之后,或仅使用会话模型时),错误会触发初始错误处理程序。初始错误处理程序可通过在使用世界模型时调用MPI_Comm_set_errhandler来修改MPI_COMM_SELF,或通过mpiexec的mpi_initial_errhandler命令行参数,或MPI_Comm_spawn/MPI_Comm_spawn_multiple的info键来设置。如果未设置其他适当的错误处理程序,则MPI I/O函数将调用MPI_ERRORS_RETURN错误处理程序,而其他所有MPI函数将调用MPI_ERRORS_ABORT错误处理程序。

Open MPI 包含三个可使用的预定义错误处理器:

  • MPI_ERRORS_ARE_FATAL 导致程序中止所有连接的MPI进程。

  • MPI_ERRORS_ABORT 一个可在通信器、窗口、文件或会话上调用的错误处理程序。当在通信器上调用时,其行为类似于在该通信器上调用MPI_Abort。如果在窗口或文件上调用,则行为类似于在包含对应窗口或文件中进程组的通信器上调用MPI_Abort。如果在会话上调用,则仅中止本地进程。

  • MPI_ERRORS_RETURN 向应用程序返回一个错误代码。

MPI应用程序也可以通过调用以下方式实现自己的错误处理程序:

请注意,MPI不保证MPI程序在出现错误后能够继续运行。

查看MPI手册页获取完整的MPI错误代码列表。

有关更多信息,请参阅MPI-3.1标准中的错误处理部分。