Instalación de HTCondorCE - nodo SLURM submit

Requisitos

  • Se requiere que entre los nodos se pueda acceder por medio de llaves con la cuenta root.

  • Configuración del archivo /etc/hosts en el nodo submit con la información ip-hostname de todos los nodos, incluyendo el mismo nodo submit.

SELinux

La instalación de HTCondor requiere desactivar SELinux. Para ello, se realizan los siguientes pasos:

Se edita el archivo /etc/selinux/config y se cambia la línea:

SELINUX=enforcing

por:

SELINUX=disabled

Debido a que SELinux es un módulo del Kernel, se debe reiniciar el sistema para que los cambios se apliquen.

Si por alguna razón no es posible reiniciar en este momento, se puede cambiar el modo de SELinux a permisivo para que no interfiera con la instalación de HTCondor. Para ello se puede utilizar el comando:

# setenforce 0

Podemos comprobar que SELinux se encuentra en modo permisivo con el comando:

# getenforce

Note

El modo permisivo no deshabilita SELinux, sin embargo, no bloquea ninguna petición que vaya en contra de las políticas, sólo lo registra en la bitácora. Es decir, el modo permisivo y desactivar SELinux funcionan igual con la diferencia de que el modo permisivo registra en las bitácoras.

HTCondor-ce

Para poder instalar HTCondor-ce se debe agregar el repositorio oficial, para ello se utiliza el siguiente comando:

# yum -y install https://research.cs.wisc.edu/htcondor/repo/9.0/htcondor-release-current.el7.noarch.rpm

Una vez que el repositorio se haya agregado, sólo hay que instalar el paquete htcondor-ce-slurm con el gestor de paquetes yum.

# yum -y install htcondor-ce-slurm

El instalador creará un usuario “condor”. Es necesario replicar en todos los nodos al usuario “condor” con su identificador de usuario y su grupo primario. Se puede conocer la información del usuario condor en el nodo submit utilizando el comando:

$ id condor

Conociendo el UID y GID del usuario, se puede agregar utilizando el comando useradd en los nodos restantes. Por ejemplo, si el usuario “condor” se creó con UID 990 y GID 990, los comandos a ejecutar en los nodos restantes serían:

# groupadd -g 990 condor
# useradd -m -u 990 -g condor -d /var/lib/condor -c “Owner of HTCondor Daemons” -s /sbin/nologin condor

Contribución


Autores de esta página: Eduardo Iván Ortega Alarcón

Autores del sitio:

Última revisión de esta página: 2023-03-21

Créditos


Todos los derechos reservados © 2022 Universidad Nacional Autónoma de México.
Prohibida la reproducción parcial o total sin autorización expresa de la
Universidad Nacional Autónoma de México – UNAM.
Ciudad Universitaria, Ciudad de México. México.