OMSA 패키지 설치

$ apt-get update
$ apt-get install gpg libssl-dev
$ echo 'deb http://linux.dell.com/repo/community/openmanage/11000/jammy jammy main' > /etc/apt/sources.list.d/linux.dell.com.sources.list
$ wget https://linux.dell.com/repo/pgp_pubkeys/0x1285491434D8786F.asc
$ apt-key add 0x1285491434D8786F.asc
$ apt-get update
$ apt-get install srvadmin-all

 

 

OMSA 관련 명령어 소프트 링크 설정(omreport, racadm 명령어)

$ ln -s /opt/dell/srvadmin/sbin/omreport /usr/bin/omreport
$ ln -s /opt/dell/srvadmin/sbin/racadm /usr/bin/racadm


$ ls -al /usr/bin/omreport
lrwxrwxrwx 1 root root 32 Sep  8 15:19 /usr/bin/omreport -> /opt/dell/srvadmin/sbin/omreport


$ ls -al /opt/dell/srvadmin/sbin/racadm
lrwxrwxrwx 1 root root 21 Mar 15 04:43 /opt/dell/srvadmin/sbin/racadm -> racadm-wrapper-idrac7
 
 

3. OMSA 설치 확인(https:[서버IP]:1311 접속)

 

 

수동 설치 가이드 : https://www.dell.com/support/kbdoc/ko-kr/000185829/openmanage-server-administrator-on-linux-%EC%84%A4%EC%B9%98-%EB%B0%A9%EB%B2%95

모델/OS 버전별 OMSA Version 가이드 : https://linux.dell.com/repo/community/openmanage/

 

 

1. 메모리 계층 구조 

  • 메모리를 필요에 따라 여러 종류로 나누어 두는 것 → CPU가 메모리에 더 빨리 접근 가능

 

  • 컴퓨터 설계에 있어 각각의 특징이 있는 서로 다른 여러 종류의 저장 장치를 함께 사용하여 최적의 효율을 도출
    명칭 위치 접근 속도
    레지스터 CPU 내부 빠름
    캐시 CPU 내부 빠름
    메모리 CPU 외부 레지스터와 캐시보다 속도 느림
    하드디스크 CPU 직접 접근 불가 데이터를 메모리로 이동시켜 접근 가능

 

1.1. 레지스터 

  • CPU(중앙처리장치)가 요청을 처리하는데 필요한 데이터를 일시적으로 저장하는 기억 장치
    • 컴퓨터에서 4대 주요 기능(기억, 해석, 연산, 제어)를 관할하는 장치
    • 프로세서에 위치한 고속 메모리로, 프로세스가 바로 사용할 수 있는 데이터(소량 데이터, 처리 중인 중간 결과 등)를 담고 있는 영역

 

  • CPU는 자체적으로 데이터를 저장할 방법이 없으므로 메모리로 직접 데이터 전송 불가
  • 연산을 위해 반드시 레지스터를 거쳐야 하며, 이를 위해 레지스터는 특정 주소를 가리키거나 값을 읽기 가능 

  • CPU 내부 레지스터 종류
    종류 설명
    프로그램 계수기 (PC, Program Counter) 다음에 실행할 명령어(instruction)의 주소를
    가지고 있는 레지스터
    누산기 (AC, Accumulator) 연산 결과 데이터를 일시적으로 저장하는 레지스터
    명령어 레지스터(IR, Instruction Register) 현재 수행 중인 명령어를 가지고 있는 레지스터
    상태 레지스터(SR, Status Register) 현재 CPU의 상태를 가지고 있는 레지스터
    메모리 주소 레지스터
    (MAR, Memory Address Register)
    메모리로부터 읽어오거나 메모리에 쓰기 위한
    주소를 가지고 있는 레지스터
    메모리 버퍼 레지스터
    (MBR, Memory Buffer Register)
    메모리로부터 읽어온 데이터 또는
    메모리에 써야할 데이터를 가지고 있는 레지스터
    입출력 주소 레지스터
    (I/O AR, I/O Address Register)
    입출력 장치에 따른 입출력 모듈의 주소를
    가지고 있는 레지스터
    입출력 버퍼 레지스터
    (I/O BR, I/O Buffer Register)
    입출력 모듈과 프로세서 간의 데이터 교환을 위해 사용되는 레지스터

 

1.2. 캐시

  • 캐시 개념
    • 데이터나 값을 미리 복사해 놓는 임시 장소
    • 시스템의 효율성을 위해 사용
    • 캐시의 접근 시간에 비해 원래 데이터를 접근하는 시간이 오래 걸리는 경우
    • 값을 다시 계산하는 시간을 절약하고 싶은 경우
    • 속도가 빠른 장치와 느린 장치 사이에서 속도 차에 따른 병목 현상을 완화하기 위한 범용 메모리
      ※ 캐싱(caching) : 더 빠른 메모리 영역으로 데이터를 가져와서 저장하는 방식 

  • 캐시 종류
    • 1. CPU 캐시
      • 대용량의 메인 메모리 접근을 빠르게 하기 위해 CPU 칩 내부나 바로 옆에 탑재하는 작은 메모리

      • 하드웨어를 통해 CPU 캐시 관리
        종류 설명 CPU 성능에
        직접적인 영향
        L1 캐시 일반적으로 CPU 칩안에 내장되어 데이터 사용 및
        참조에 가장 먼저 사용되는 캐시 메모리
        O
        L2 캐시 L1 캐시 메모리와 용도와 역할이 비슷
        속도 : L1 캐시 > L2 캐시 > 일반메모리(RAM)
        O
        L3 캐시 L1 캐시, L2 캐시와 동일한 원리로 작동
        대부분 CPU가 아닌 메인 보드에 내장
        X
    • 2. 디스크 캐시
      • 하드디스크에 내장된 디스크에 입출력되는 데이터를 저장하는 작은 메모리
    • 3. 그 외 캐시(예시: 페이지 캐시)
      • 운영 체제의 메인 메모리를 하드디스크에 복사해 놓는 캐시 (ex. 웹 브라우저의 웹 페이지 캐시)

  • 캐시 지역성
    • 데이터 접근이 시간적, 혹은 공간적으로 가깝게 일어나는 것
    • 캐시가 효율적으로 동작하기 위해서는 캐시가 저장할 데이터 지역성 필요

    • 지역성 종류
      종류 설명
      시간적 지역성 특정 데이터가 한 번 접근되었을 경우,
      가까운 미래에 또 한 번 데이터에 접근할 가능성이 높음
      공간적 지역성 액세스 된 기억장소와 인접한 기억장소가 액세스 될 가능성이 높음

 

1.3. 메인 메모리

  • 메인 메모리 개념
    • 주기억장치 (1차 기억 장치)
    • 컴퓨터에서 수치, 명령, 자료 등을 기억하는 컴퓨터 하드웨어 장치

  • 메인 메모리 구성
     1. RAM(Random Access Memory) : 휘발성 기억 장치
         • 컴퓨터가 빠른 액세스를 하기 위해 데이터를 단기간 저장하는 구성 요소
         • 사용자가 요청하는 프로그램이나 문서를 스토리지 디스크에서 메모리로 로드하여 각각 정보에 access
         • 전원이 유지되는 동안 CPU의 연산 및 동작에 필요한 모든 내용 저장 

     2. ROM(Read Only Memory) : 고정 기억 장치 
         • 컴퓨터에 지시 사항을 영구히 저장하는 비휘발성 메모리 
         • 전원 종료 시 기억된 내용 유지
         • 변경 가능성이 희박한 기능 및 부품에 사용   
             1. 소프트웨어 : 초기 부팅 관련 부분
             2. 하드웨어 : 프린터 작동에 관여하는 펌웨어 명령 등

 

1.4. 하드디스크 드라이브

  • 하드디스크 개념
      •  비휘발성, 순차 접근이 가능한 컴퓨터의 보조 기억 장치
      •  비휘발성 데이터 저장소 가운데 가장 대중적이며 용량 대비 가격기 가장 저렴 

  • 하드디스크 작동 원리
      •  보호 케이스 내부의 플래터 회전 → 플래터에 자기 패턴으로 정보 기록
      •  플래터 표면의 코팅된 자성체에 데이터 기록
      •  회전하는 플래터 위에 부상하는 입출력 헤드에 의해 자기적으로 데이터 기록 및 조회 가능

  • 하드디스크 구성 요소
    요소 설명
    제어회로 하드 디스크의 총괄적인 부분을 제어하는 회로
    제어 회로 내부의 버퍼 메모리는 하드 디스크에 입출력 될 데이터를 임시 저장
    스핀들 모터 플래터의 회전을 담당하는 부분
    플래터 데이터 기록 담당
    하나의 하드디스크에 한 개 이상 장착
    플래터 수 ↑  →  용량 저장 크기 ↑, 안정성 ↓
    액추에이터 제어 회로의 명령에 따라 액추에이터 암 구동 → 헤드가 원하는 데이터 조회 가능
    액추에이터 암 액추에이터를 통해 구동
       1. 하나의 디스크에 여러 개 존재
       2. 암의 끝 부분에 입출력을 위한 헤드 존재
    헤드 데이터를 읽고 쓰는 헤드

 

 

 

2. 메모리 계층 구조 필요성

2.1. 디코딩(명령어 해독 단계) 속도

  • 디코딩(Decoding) : 복호화, 부호화(Encoding)된 정보를 부호(code)화 전으로 되돌리는 처리 혹은 처리 방식
  • CPU는 3개의 버스를 통해 메모리에 접근
    1. 주소 전달 버스 : CPU가 메모리 어느 부분에 접근할지 나타냄
    2. 데이터 전달 버스 : 메모리와 CPU 간 데이터 전송
    3. 컨트롤 신호 버스 : CPU의 메모리 접근 여부 표시

  • 주소 전달 버스 및 데이터 전달 버스에 값이 존재하고 컨트롤 신호 전송 → CPU와 메모리 업무 수행
  • 큰 메모리 용량을 사용할 경우 디코딩 시 많은 시간 소요 → CPU가 빠른 속도로 데이터에 접근하기 위해서 데이터를 저장하는 메모리가 작아야 함

 

2.2. 참조의 지역성

  • 큰 메모리를 사용한다고 해도 그 안의 모든 데이터에 고르게 접근하지 않고 자주 쓰이는 데이터와 자주 쓰이지 않는 데이터로 나누어짐
  • 운영체제•CPU → 자주 쓰이거나 쓰일 것 같은 데이터를 메모리에서 캐시로 읽어옴 
  • 자주 쓰이는 데이터는 전체 데이터 양에 비해 작은 양이므로 캐시는 메모리보다, 메모리는 하드디스크 보다 ↓

 

2.3. 경제성

  • 메모리 구조에서 상층에 속할수록 가격 ↑
  • 메모리 계층 구조의 모양이 피라미드인 이유
       1. 가격이 높은 하드웨어의 경우 필요한 만큼의 크기만 사용
       2. 가격이 저렴한 하드웨어를 넉넉한 크기만큼 사용

 

 

1. 물리서버

  • 하드웨어 장비 및 데이터 흐름

 

1.1. 서버 외관 및 설치

  • 서버는 랙에 장착되며, 랙에는 서버 외에도 HDD가 장착되어 있는 저장소나 인터넷 및 LAN을 연결하기 위한 스위치 등도 탑재
  • 전원이나 네트워크 케이블 배선 등은 모두 랙 뒷면에서 연결

  • 랙 규격
    • 대부분 랙의 폭은 19인치
    • 높이는 한 눈금에 약 4.5cm
    • 서버 높이의 단위 : 한 눈금당 1U(2U 서버는 2눈금, 높이 약 9cm의 서버)
  • 서버 장착 시 중요 정보
    • 서버 크기(1U), 소비 전력(A), 중량(kg)

 

1.2. 서버 내부 구성

  • 서버 내부 구성
    • CPU가 2개 연결되어 있으며 옆에 메모리 배치, CPU와 메모리는 물리적으로 직접 연결
    • CPU를 중심으로 HDD나 NIC는 메모리에 비해 떨어진 곳에 위치
    • 각 컴퍼넌트(부품)을 연결하는 선 버스(bus)
    • PCI Express 슬롯 : 외부 장치 연결하는 곳
    • NIC : 네트워크 인터페이스

 

1.3. CPU(Central Processing Unit)

  • 서버 중심에 위치해서 연산 처리
  • CPU는 OS(운영체제)라는 소프트웨어에서 명령을 받아 연산을 실행하고 결과 반환
    • 프로세스(OS상에서 동작하는 웹 서버나 데이터베이스)와 사용자 키보드, 마우스를 통한 입력으로 OS에 명령
    • 키보드, 마우스, 프로세스 → OS → CPU
  • 명령과 데이터는 기억 장치나 입출력 장치를 통해 전달
  • 연산은 1초에 1억회 이상 실행
  • CPU 안에서 물리적인 연산(데이터 처리)을 담당하는 코어는 각자 독립된 처리가 가능하며, 하나의 CPU에 여러 개의 코어가 존재(멀티 코어)
  • 명령이나 데이터는 기억 장치(메모리, HDD)에 존재

 

1.4. 메모리

  • 기억 영역으로 CPU 옆에 위치
  • CPU에 전달하는 내용이나 데이터를 저장하거나 처리 결과를 수신
  • 메모리에 저장되는 정보는 영구성이 없으며, 서버를 재시작하면 데이터 존재 X
  • 메모리 액세스가 매우 빠르게 이루어지며, 전기적인 처리만으로 데이터 저장
  • CPU 자체의 메모리를 레지스터, 1차(L1)/2차(L2) 캐시라고 호칭 → 메모리보다 빠르지만 용량이 메모리보다 작은 형태
  • 캐시를 여러 단으로 배치해서 대기 시간 축소
  • L1, L2 캐시에 있는 데이터는 L3 캐시에도 존재 → 다른 코어는 자신 이외의 캐시를 확인하지 않고 L3 캐시만 확인
  • 메모리 영역이 CPU 안에 여러 개 존재하는 이유
    • 처리 지연을 줄이기 위해 가장 자주 사용하는 명령/데이터를 코어 가까운 곳에 배치
      1. 메모리를 이용하려면 메모리 컨트롤러를 경유해 CPU 외부로 나가야 함
      2. 메모리를 사용하면 처리 지연 발생(latency)
    • 액세스 속도
      1. 일반적으로 캐시 메모리가 커질수록 액세스 속도 저하
      2. 초고속으로 액세스하고 싶은 데이터는 L1 캐시, 고속으로 액세스하고 싶은 데이터는 L2 캐시에 캐싱하는 형태
  • 메모리 인터러빙(memory interleaving) : 데이터를 미리 CPU에 전달해서 처리 지연을 줄이는 메모리 기능
    1. 채널 : CPU와 메모리 간의 데이터 경로
    2. 뱅크 : 하나의 채널 안에서 하나 또는 그 이상의 메모리 묶음
    3. 최대 3개의 채널을 사용해서 데이터 1을 요구하면 데이터 2와 데이터 3도 함께 보내는 형태
    4. 대부분 데이터가 연속해서 액세스 된다는 규칙을 기반으로



2. I/O 장치

2.1. 하드 디스크 드라이브(HDD)

  • CPU와 떨어져 있으며 주로 장기 저장 목적의 데이터 저장 장소로 사용
  • 메모리는 전기가 흐르지 않으면 데이터가 사라지지만, 디스크는 전기가 없어도 데이터 사라지지 않는 형태
  • HDD 내부
    • 자기 원반이 여러 개 들어있는데, 이것이 고속으로 회전하고 레코드 바늘 같은 것을 사용해서 읽기/쓰기 처리
    • 메모리처럼 빠른 속도로 액세스 할 수 없으며, 일반적으로 수 밀리초에서 수십 밀리초 정도의 시간 소요(메모리는 수~수십 마이크로초)
  • 최근에는 SSD(Solid State Disk)를 많이 사용
    • 물리적인 회전 요소를 사용하지 않는 디스크
    • 메모리와 기억 장치 간 속도 차이 거의 x
  • HDD가 여러 개 탑재된 하드웨어를 스토리지(storage, 저장소)라고 호칭
    • 스토리지는 I/O 서브 시스템이라고 불리는 장치
    • 내부에 CPU와 캐시가 존재하고 수많은 HDD 외에도 여러 기능 탑재
  • 서버 I/O 시에는 HDD가 직접 데이터를 교환하지 않고 캐시 이용
    • 저장소 캐시는 CPU 캐시 이용 방법과 동일
  • 대형 저장소와 연결할 때는 파이버 채널이라는 케이블을 사용하여 SAN(Storage Area Network)를 경유
    • SAN에 접속하기 위한 파이버 채널 인터페이스를 FC 포트로 호칭
    • 보통 서버 시스템 포트에 FC 포트가 없기 때문에 PCI 슬롯에 HBA 카드를 삽입해서 사용

 

2.1.1. 하드 디스크 내부 구조

  • 하드디스크 내부 구조
    1. 전원 커넥터 : 하드디스크에 전원을 공급하는 역할
    2. 데이터 커넥터 : 하드디스크와 컴퓨터 사이의 데이터를 전송해주는 단자
    3. 헤드 : 데이터를 읽어주는 역할
    4. 액추에이터암 : 헤드를 데이터가 있는 곳으로 움직이는 역할
    5. 플래터 : 실제로 데이터가 저장
    6. 스핀들 : 플래터를 돌려주는 역할
  • 트랙, 섹터
    • 하드 디스크 기록 단위의 하나로 자기 매체에 늘어선 동심원으로 구획된 하나하나를 트랙이라고 부르며, 그 트랙들을 작은 단위로 쪼갠 것을 섹터라고 호칭
    • 디스크에서 데이터를 읽고 쓰는 단위는 섹터 512가 아니며 4KB인 disk block으로 나누어 관리
  • 실린더
    • 다수개의 플래터의 트랙을 수직적으로 관통하는 3차원 적인 스택
    • 하드 용량 = (헤드수) * (실린더 수) * (섹터수) * (섹터당 기록 용량) 의 공식으로 계산
    • 모든섹터가 같은 길이를 갖도록 데이터를 기록하는 방식을 사용하는 것이 일반적인 추세
    • 하드디스크의 헤드 위치에 관한 정보를 읽을 수 있도록 별도의 헤드를 하나 더 사용



2.1.2. 하드 디스크 각종 규격

  1. SATA(Serial Advanced Technology Attachment)
    • SATA_1 규격에서는 초당 150MB, SATA_2는 초당 300MB의 전송 속도
    • STAT_2 규격에서는 USB처럼 하나의 포트에 여러 개의 하드 디스크 연결 가능
    • PC를 끄지 않고 장치를 연결할 수 있는 핫플러그 기능 추가
  2. SCSI (Small Computer System Interface)
    • 서버나 워크스테이션 등에 쓰이는 고속 인터페이스
    • 사용을 위해 별도 확장 카드 필요
    • 이를 대체하는 SAS 인터페이스가 등장하면서 사용도 저하
  3. SAS(Serial Attached SCSI)
    • SCSI 규격을 한 단계 발전한 것으로 서버 등의 주로 사용
  4. SSD(Solid State Drive, Solid State Disk)
    • 하드디스크 드라이브와 비슷하게 동작하면서 기계적 장치인 HDD와 다르게 반도체를 이용해 정보 저장

 

2.2. 네트워크 인터페이스

  • 서버와 외부 장비를 연결, 이더넷 네트워크 어댑터
  • OSI 7 계층에서 데이터 링크 계층과 달리 물리 계층 사이에서 통신 가능하게 함
  • 통신을 위해 인터페이스 역할 수행하며 고성능의 데이터 처리를 위해 송수신 되는 데이터 압축
  • NIC 카드에는 물리적인 하드웨어 주소인 MAC 주소 할당

 

 

3. 버스

  • 서버 내부의 컴포넌트들을 서로 연결시키는 회선
  • 버스가 어느 정도의 데이터 전송 능력을 갖고 있는지 중요

 

3.1. 대역

  • IT 인프라에서 대역은 데이터 전송 능력 의미
  • 한 번에 데이터를 보낼 수 있는 데이터의 폭(전송폭), 1초에 전송할 수 있는 횟수(전송 횟수)로 결정
  • 전송 횟수 → 1초 / 1 처리 당 소요 시간(응답 시간)
  • 대역을 스루풋(throughput, 처리량)이라고 호칭 → 대역은 전송 폭*전송 횟수

 

3.2. 버스 대역

  • CPU와 가까운 쪽이 1초당 전송량 ↑
  • 일상에서 접하는 대역
  • 버스 흐름에서 CPU와 장치 사이에 병목 현상이 없어야 함

 

1. OMSA 시작

$ /opt/dell/srvadmin/sbin/srvadmin-services.sh start

2. OMSA 멈춤

$ /opt/dell/srvadmin/sbin/srvadmin-services.sh stop

3. OMSA 재시작

$ /opt/dell/srvadmin/sbin/srvadmin-services.sh restart

4. OMSA 상태 확인

$ /opt/dell/srvadmin/sbin/srvadmin-services.sh status

5. OMSA 런레벨 2, 3, 5에서 enable 설정

$ /opt/dell/srvadmin/sbin/srvadmin-services.sh enable

6. OMSA 런레벨 2, 3, 5에서 disable 설정

$ /opt/dell/srvadmin/sbin/srvadmin-services.sh disable

7. OMSA가 실행 중인지 체크

$ /opt/dell/srvadmin/sbin/srvadmin-services.sh is-enabled
instsvcdrv: enabled
dsm_sa_datamgrd: enabled
dsm_sa_eventmgrd: enabled
dsm_sa_snmpd: enabled
dsm_om_connsvc: enabled

1. 재시작

  • 정상적인 절차를 사용하여 장치를 다시 시작
  • reboot 명령어나 shutdown 명령어를 사용

2. 재설정

  • 장치가 명령에 응답하지 않는 경우 전원 단추를 10초 동안 누름
  • 전원이 꺼지면 디바이스가 다시 시작됨

3. 하드 리셋

  • 위의 두 절차로 문제가 해결되지 않거나 일부 구성 요소가 응답하지 않는 경우 하드 리셋을 수행 필요
  • 하드 리셋 진행 절차
    1. 서버 전원을 끕니다.
    2. 모든 전원 케이블, 네트워크 케이블에서 서버를 분리합니다.
    3. 전원 버튼을 10초 이상 계속 누릅니다.
    4. 전원 케이블 및 네트워크 케이블을 시스템에 다시 삽입합니다.
    5. 서버를 켜기 전에 iDRAC가 초기화될 때까지 약 2분 정도 기다립니다.
    6. 시스템의 전원을 켭니다. → 재시작
    7. 정상적인 절차를 사용하여 장치를 다시 시작합니다.

DELL의 BIOS System Profile의 설정 값

1. Performance Per Watt(DAPC)

  • Performance Per Watt(DAPC)는 BIOS System Profile의 기본값
  • 전력 소비 감소와 균형을 이루는 뛰어난 성능 조합
  • Dell Active Power Control (또는 DAPC)은 대부분의 환경에서 성능에 미치는 영향을 최소화하면서 뛰어난 전력 효율성 이점을 제공하는 BIOS 중심의 전원 제어 메커니즘을 사용
  • 전체 시스템 프로필에 대한 CPU 전원 관리 선택

2. Performance Per Watt(OS)

  • CPU 전원 관리를 제외한 모든 하위 옵션에 대한 DAPC 프로필과 유사
  • Performance Per Watt(OS)는 전원 관리 체계를 "OS DBPM"이라고 함
  • 운영 체제가 더 높은 전력 효율성을 위해 프로세서 주파수를 조작 가능
  • 전체 시스템 전력 소비를 줄이는 효과는 운영 체제가 하드웨어 리소스를 얼마나 효과적으로 제어 할 수 있는지에 따라 달라짐
  • Performance Per Watt(OS)는 운영 체제에서 영향받음

3. Performance

  • Performance는 프로세서 주파수를 최대화
  • C-states 및 같은 특정 절전 기능을 비활성화하여 잠재적으로 향상된 성능을 제공
  • 성능 최적화

4. Dense Configuration

  • 상당한 성능을 희생하면서 신뢰성 기능을 향상시키고 전력 소비를 줄여줌
  • 향상된 안정성이 요구되고 온도가 밀도가 낮은 데이터 센터에서 발생하는 임계 값을 초과 할 수있는 운영 환경을 대상으로 사용

5. custom

  • custom으로 설정하면 각 옵션의 설정 변경 가능


OMSA에서 BIOS의 System Profile 확인 절차

  1. 서버 IP:1311을 통해 OMSA 접속 후 System → Main System Chassis → BIOS 클릭

  2. Setup 클릭

  3. System Profile Settings 클릭

  4. System Profile으로 설정 값 확인


  • 서버의 Power supply redundant 는 두가지 모드가 존재
    1. A/B Grid Redundant (1+1)
    2. PSU Redundant (2+0)

 

1. Grid redundant

  • Grid redundant의 다른 말로 A/B Grid Redundant(1+1)이라고 함
  • 평소에는 파워서플라이 하나로만 운영하다가 전력 소모가 늘어나면 나머지 하나를 추가하여 절반씩 전력을 사용
  • 버려지는 전력 소모를 줄이고자 서버의 전력 사용량이 475W 이하일때는 Primary PSU만 사용하고 그 이상일때 두 개를 모두 사용
  • 1번 파워가 Primary PSU 로 설정되어 있고 서버의 전력 사용량이 475W 이하일 때에는 2번 파워는 사용 X
  • PSU 2를 사용하지 않을 때, PSU 1에서 AC lost가 발생
    1. Primary PSU가 넘어가는 과정에서 PSU 2의 Power supply의 전력이 부족하면서 서버의 전반적인 퍼포먼스가 떨어지거나 hang 발생
    2. 전력이 많이 부족하다면 재부팅 또는 전원 off 발생 가능

 

2. PSU Redundant (2+0)

  • PSU Redundant (2+0)의 다른 말로 Not Redundant이라고 함
  • 전력 소모량과 상관없이 무조건 두 개를 함께 사용 → 모든 PSU가 Online 상태로 유지
  • PSU Redundant (2+0)는 이중화가 아님
  • 전력을 효율적 사용하지는 못하지만, 1개의 PSU에 문제가 발생하였을 때도 서버에 문제가 발생하지 않음

 

TRIM이란

  • TRIM은 ATA 인터페이스를 위한 명령어
  • TRIM 명령어는 인터페이스마다, 운영 체제에 따라 이름도 모두 다르지만, 일반적으로 "Trim"이라고 칭함
  • TRIM은 SSD(Solid State Drive)에 어떤 데이터를 삭제할 수 있는지 알려줌
  • TRIM은 능동적 데이터 재배치와 함께 SSD(Solid State Drive)를 말끔하게 정리함
  • TRIM은 매우 유용하지만 필수 기능은 아님
  • 일부 운영 체제의 경우 Trim을 지원하지 않기 때문에 SSD 제조업체들은 Trim을 사용하지 않는다는 가정하에 드라이브를 설계, 생성 및 검증함
  • TRIM 명령을 사용하면 운영 체제에서 더 이상 사용되지 않는 것으로 간주되는 데이터 블록을 SATA SSD에서 삭제 가능
  • TRIM은 지원되는 운영 체제에 대한 Write amplification(쓰기 증폭)를 해결 가능
  • 운영 체제에서 파일이 삭제된 경우 파일은 파일 시스템에서 삭제로 표시되지만 디스크 컨텐츠는 실제로 지워지지 않음 → TRIM의 도입으로 파일이 삭제된 경우 운영 체제에서 유효한 데이터를 포함하지 않는 LBA로 TRIM 명령을 전송


TRIM의 역할

  • TRIM 명령어는 특정 영역에 더 이상 사용하지 않는 데이터가 있음을 SSD에 알려줌
  • 사용자의 관점에서는 해당 데이터는 문서에서 삭제된 것임 → 실제 SSD(Solid State Drive)가 정보를 읽고 쓰는 방식 때문에 해당 데이터는 사용자의 명령에 의해 드라이브에서 삭제된 상태가 아님
  • 사용자의 관점에서 삭제는 SSD에서 해당 데이터를 포함하는 SSD 영역은 더 이상 사용하지 않는 것으로 표시됨
  • TRIM 명령어는 해당 데이터가 삭제될 수 있음을 드라이브에 알려줌 → 컴퓨터가 유휴 상태가 되면, 능동적 데이터 재배치를 통해 해당 데이터는 삭제
  • TRIM 명령어가 존재하지 않았을 경우, SSD(Solid State Drive)는 드라이브의 일부 구간에 유효하지 않은 정보가 포함되어 있다는 것을 알지 못하며 추후 컴퓨터가 해당 위치에 새 정보를 쓰기 위해 이를 드라이브에 알려줄 때 비로소 인식
  • 드라이브는 기존 정보를 삭제한 다음에야 새 정보를 쓸 수 있음 → 단순히 새 정보를 쓰는 시간보다 더 많은 시간이 걸림
  • TRIM과 능동형 GC(Garbage Collect)을 활용한다면 SSD는 쓰기 명령을 더 빨리 실행 가능
  • TRIM을 사용하면 SSD(Solid State Drive)의 수명에도 영향 有
  • 유휴 시간 동안 삭제 가능한 셀을 SSD에 알려주고, 드라이브는 남아 있는 데이터가 채워진 셀과 쓰기 가능한 빈 셀을 정리하므로 불필요한 삭제 및 다시 쓰기를 하지 않아도 됨(SSD 블록의 수명을 균형있게 해줌)


TRIM의 이점

  1. 쓰기 과정에 많은 시간을 사용하여 유효하지 않은 데이터를 삭제하는 대신에 컴퓨터가 유휴 상태일 때 SSD(Solid State Drive)에서 데이터를 삭제하여 시간을 절약 가능
  2. TRIM는 능동형 GC(Garbage Collect)이 함께 작동하여 SSD의 수명을 늘릴 수 있음
  3. 능동형 GC(Garbage Collect)은 데이터 중에 관련 세그먼트를 나란히 위치할 수 있도록 이동시키므로 역동적이고 효과적인 Ware leveling 가능


TRIM 지원 환경

1. TRIM을 지원하는 SSD 환경(TRIM & GC를 지원)

  • Intel RAID controller를 사용하기에 SSD에 TRIM 사용 불가
  • SSD에서 TRIM을 지원하는 지 확인하는 방법
    1. hdparm -I /dev/sda 명령어
    2. lsblk -D 명령어
    3. /sys/block/sda/queue/discard_max_bytes 내용 확인
    4. /sys/block/sda/queue/discard_granularity 내용 확인

2. TRIM을 지원하는 커널 버전 → uname -r으로 확인 가능

  • 일반 SSD TRIM 지원 : Linux kernel 2.6.33 이상
  • NVMe SSD TRIM 지원 : Linux kernel 3.3 이상
  • RHEL6부터 TRIM 지원

3. 파일 시스템 확인 → TRIM 기능을 활성화 하기 위해 ext4 또는 xfs를 사용 → mount | grep -i "/dev/sd"로 확인

  • ext4에 TRIM을 적용하기 위해서는 명령어로 discard를 추가하거나 또는 /etc/fstab에 아래 discard를 추가

    # 명령어로 파일시스템에 TRIM 가능하도록 설정
    $ mount -t ext4 -o discard /dev/sda3 /
    
    # 영구적으로 파일시스템에 TRIM 가능하도록 설정
    $ vi /etc/fstab
    /dev/sda1 / ext4 defaults,discard 0 0



※ TRIM 사용 시 주의 사항

  • TRIM을 사용하는 조건은 까다롭기에 Linux 커널 버전, SSD TRIM 지원, 파일시스템(ext4, xfs)을 충족해야 실행 가능
  • 위 조건을 모두 충족하더라도, 현재 사용하고 있는 RAID contoller가 Intel RAID controller를 사용하는 경우 TRIM 사용 불가
  • Intel RAID controller에서 Window는 지원하는데, 아직 Linux는 지원 X
  • 향후 Inter RAID controller가 Linux도 TRIM을 실행할 수 있는 것을 대비하여 학습 진행
  • Boss card RAID contoller를 사용하는 경우 TRIM 사용 가능

+ Recent posts