524px-Slurm_logo.svg.png

1. Slurm의 개념

1. Slurm 이란?

  1. Slurm은 다양한 사용자들의 다양한 요구를 수용하고(Job Submit), 각 사용자들의 작업을 스케줄링하며(Task Scheduling), 자원을 관리(Resource Management)하는 Linux 유틸리티 입니다.
  2. 여러 명의 사용자가 UBAI 클러스터를 이용하는데 있어서 원할한 실험 및 계산을 위한 중재자 역할을 수행합니다.

2. 클러스터 ( Cluster ) 란?

3. 작업 ( Job ) 이란?

4. 작업 스케줄러 ( Job Scheduler ) 란?

5. 노드 ( Node ) 란?

2. Slurm의 사용목적

3. Slurm의 특징

  1. 자료 접근의 용이성

    Linux 기반으로 개발이 된 오픈소스로서 자료 접근에 용이합니다.

  2. 높은 확장성

    수천 개의 노드와 수백 만 개의 코어를 지원하며, 큰 규모의 클러스터에서 매우 효율적으로 작동합니다.

  3. 다양한 스케줄링 알고리즘

    다양한 스케줄링 알고리즘을 지원하며, 우선 순위, 공정성 그리고 자원 사용률을 최적화 가능합니다.

  4. 리소스 관리

    CPU, 메모리, 디스크 공간, GPU 등 다양한 리소스를 효과적으로 관리할 수 있으며, 사용자나 작업 단위로 리소스 사용량을 제한하고 모니터링 가능합니다.

  5. 시스템 효율적 관리

    작업의 실행 상태, 자원 사용량, 성능 통계 등을 기록하고 모니터링 할 수 있어, 시스템의 효율성과 안정성을 유지하는 데에 도움이 됩니다.