HBM

 

High Bandwidth Memory
고대역폭 메모리
1. 개요
2. 상세
2.1. 특징
2.2. 동세대 GDDR 계열 SGRAM과 비교
2.2.1. 장점
2.2.1.1. 짧은 메모리 레이턴시와 높은 메모리 대역폭
2.2.1.2. 작은 칩 면적과 작은 컨트롤러 면적
2.2.1.3. 낮은 전력 소모
2.2.2. 단점
2.2.2.1. 높은 구현 난이도
2.2.2.2. 낮은 메모리 클럭과 불리한 메모리 용량 확장성
2.3. HMC와 비교
2.3.1. 적층형 메모리 중에 그나마 구현이 쉬운 규격
2.4. 규격 일람
3. 관련 문서


1. 개요


2013년에 발표된 적층형 메모리 규격.

2. 상세



2.1. 특징


기존의 GDDR 계열 SGRAM을 대체하고 보다 고대역폭의 메모리 성능을 달성하기 위해 제안되었으며, 2013년에 반도체 표준협회인 JEDEC에 의해 채택되었다. '''메모리 다이를 적층'''하여 실리콘을 관통하는 통로(TSV)를 통해 주 프로세서와 통신을 한다는 것으로, 이를 위해서 직접 인쇄 회로 기판 위에 올려지는 GDDR 계열 SGRAM과는 달리 '''인터포저'''라는 중간 단계를 필요로 한다.

2.2. 동세대 GDDR 계열 SGRAM과 비교



2.2.1. 장점



2.2.1.1. 짧은 메모리 레이턴시와 높은 메모리 대역폭

메모리 적층을 통해 여러 메모리 채널을 갖추어 GDDR 계열 SGRAM에 비해 짧은 레이턴시와 높은 대역폭을 동시에 구현할 수 있다.

2.2.1.2. 작은 칩 면적과 작은 컨트롤러 면적

PCB에서 차지하는 메모리 칩(모듈)의 총 면적을 줄일 수 있고, 프로세서 내부에 탑재되는 내장 메모리 컨트롤러 자체도 기존 GDDR 계열 SGRAM 대비 더 작은 편이기 때문에 면적 대비 고대역폭에 유리하다. 당장 최상위 GPU에 탑재되는 GDDR6 SGRAM 컨트롤러의 총 면적만 봐도 HBM 컨트롤러보다 훨씬 더 넓은 면적으로 차지하고 있다.

2.2.1.3. 낮은 전력 소모

소비 전력도 낮은 편이다. (참고1, 참고2)

2.2.2. 단점



2.2.2.1. 높은 구현 난이도

인터포저 때문에 GDDR 계열 SGRAM보다 구현이 어렵다는 단점이 있다. 사실상 인터포저 때문에 HBM의 장점을 다 깎아먹고 있다고 봐도 과언이 아니다. 지지부진한 수율 상승과 GDDR 계열 SGRAM의 최신 규격인 GDDR6에 비해서 뚜렷하게 우세하지 못한 성능과 높은 구현 난이도로 인해 마냥 장밋빛 전망인 것은 아니다.

2.2.2.2. 낮은 메모리 클럭과 불리한 메모리 용량 확장성

기본적으로 1세대 HBM은 대역폭은 GDDR 대비 엄청나게 넓지만, 동작 속도 자체는 훨씬 낮기 때문에 성능향상에 한계가 있다. 그리고 현재 4층까지 적층할 수 있는데 층당 용량한계가 2 GB이기 때문에 8 GB 용량이 한계이다. 이게 무슨 뜻인지 모르겠다면 아래 그림을 참조하자.
[image]
그림에서 보이는 것처럼 GDDR의 경우 넓은 기판 전·후면에 수십 개씩 칩을 박아 넣는 식으로 용량을 늘릴 수 있지만, HBM은 실리콘 인터포저를 사용하는 방식의 한계 때문에 이런 무식한 용량 확대가 불가능하다.

2.3. HMC와 비교



2.3.1. 적층형 메모리 중에 그나마 구현이 쉬운 규격


HBM은 프로세서의 바로 위로 적층하는 것은 불가능하여 완전한 원칩은 구현할 수 없다. 이를 구현하는 것을 목표로 하는 마이크론의 HMC(Hybrid Memory Cube)와 비교했을 때 다소 완전하지 않은 모습으로 인해 3D가 아닌 2.5D라고 불리기도 한다. 하지만 HMC는 기술적으로 구현이 매우 어려워 존재감이 미미한 상태인 반면, HBM은 현재 삼성과 SK하이닉스가 대량 생산하고 있으며, AMD와 NVIDIA의 그래픽 카드에 채택되는 등 활약을 하고 있다. 또한 프로세서에도 TSV를 통과시켜야 하는 HMC에 비해서 단순히 인터포저 위에 올리기만 하면 되어 구현 난이도가 비교적 낮다는 것과, HBM이 그래픽 카드 업체에게 보다 사용하기 편한 것이 HBM의 성공에 보탬이 되었다.

2.4. 규격 일람


규격
다이당 채널 구성과
스택당 다이 구성
스택당
최대 용량
스택당
버스 폭
전압
클럭
(비트레이트)
핀당
I/O 데이터
전송률
스택당
대역폭
개발
표준화
적용
HBM
2 채널 × 128-bit × 4-Hi
4 GB
1024-bit
1.3 V
500 MHz
(1 Gbps)
1 GT/s
128 GB/s
2013년
2013년
2015년
HBM2
2 채널 × 128-bit × 8-Hi
8 GB
1024-bit
1.2 V
1000 MHz
(2 Gbps)
2 GT/s
256 GB/s
2015년
2016년
2016년
HBM2E
2 채널 × 128-bit × 12-Hi
24 GB
1024-bit
1.2 V
1200 MHz
(2.4 Gbps)
2.5 GT/s
307.2 GB/s
2019년
2018년
2020년
HBM3
2 채널 × 128-bit × ??-Hi
?? GB
????-bit
?.? V
???? MHz
(? Gbps)
4 GT/s
512 GB/s
????년
????년
????년
일반적인 HBM은 그래픽 카드의 GDDR을 대체하는 용도로 활용된다. 그리고 성능 면에서도 GDDR과 자주 비교 되며, 일반적인 비교 기준은 다음과 같다.
  • HBM vs GDDR5 SGRAM
  • HBM2 vs GDDR5X SGRAM
  • HBM2E vs GDDR6 SGRAM
물론 근본적인 구조의 차이 때문에 이렇게 서로 비교를 하더라도 대역폭 면에서는 HBM이 월등하게 우수하다. 그러나 GDDR5X부터는 대역폭의 급격한 향상으로 인해 HBM3의 개발이 늦춰지고 있는 추세다. 그 대신 HBM2E가 대타로 투입될 예정으로, 이를 개발한 삼성은 스택당 최대 8-Hi, 최대 3.2 GT/s, 410 GB/s, 총 16 GB를 지원하는 플래시볼트 HBM2E를 2020년 2월에 양산했다. SK하이닉스도 스택당 최대 8-Hi, 최대 3.6 GT/s, 460 GB/s, 총 16 GB를 지원하는 HBM2E를 개발하여 2020년 7월 대량 생산에 돌입했다고 한다. 그리고 2020년 11월 16일, NVIDIA가 3.2 Gbps와 총 2 TB/s 대역폭을 지니는 HBM2E로 업그레이드된 A100 80 GB 연산 카드를 발표했다.

3. 관련 문서