
삼성 HBM4E 샘플 세계 최초 출하
48GB·3.6TB/s, AI 메모리 경쟁 새 국면
1 HBM4E는 HBM4보다 무엇을 끌어올렸나
HBM4E(고대역폭 메모리 4E)는 HBM4를 완전히 대체하는 새로운 세대가 아니다. HBM4가 닦아놓은 광대역 인터페이스를 그대로 쓰면서 속도·용량·전력 효율을 더 끌어올린 확장판으로 보면 된다.
HBM4를 스마트폰 기본 모델, HBM4E를 성능 강화 Pro 모델이라고 생각하면 쉽다. 완전히 새로 만든 게 아니라, 같은 기반 위에서 속도와 저장공간을 더 키운 것이다.
이번에 출하된 샘플의 주요 사양을 정리하면 이렇다. 12층 스택으로 48GB 용량을 담았고, 데이터 전송 속도는 안정적으로 14Gbps(기가비트 퍼 세컨드), 최대 16Gbps까지 지원된다. 1스택당 메모리 대역폭은 최대 3.6TB/s에 달한다.
비교 대상인 삼성 HBM4는 2026년 2월 양산이 시작된 제품이다. HBM4의 안정 동작 속도는 11.7Gbps, 최대 13Gbps, 대역폭은 최대 3.3TB/s였다. 삼성은 HBM4E가 HBM4보다 속도를 20% 이상 높였다고 밝혔다.
용량 라인업도 주목할 만하다. 삼성은 12층 48GB 외에도 8층 32GB와 16층 64GB 제품으로 확대할 계획을 밝혔다. AI 모델을 학습시키거나 대규모 추론을 할 때는 칩 옆에 얼마나 빠른 메모리를 얼마나 많이 붙일 수 있느냐가 핵심 병목이 된다.
주의할 점이 하나 있다. 2026년 3월 NVIDIA GTC 행사에서는 HBM4E 사양을 16Gbps·4.0TB/s로 소개했지만, 이번 고객 출하 샘플 기준 공식 수치는 최대 3.6TB/s로 조정됐다. 전시 시의 최고치보다 실제 안정 동작 조건을 반영한 수치라고 보면 된다.
2 경쟁 핵심이 DRAM에서 로직 베이스다이로 이동했다
HBM4 세대부터 메모리 경쟁의 판이 바뀌었다. HBM3E(고대역폭 메모리 3E)까지는 DRAM(데이터를 저장하는 반도체) 적층 수, 속도, 수율이 주된 승부처였다. HBM4부터는 베이스다이(HBM 스택 맨 아래에 있는 로직 칩)의 성능이 전체 성능을 좌우한다.
HBM을 고층 아파트라고 하면, 지금까지는 각 층(DRAM)의 품질이 중요했다. HBM4부터는 건물 기초 공사(베이스다이)를 얼마나 잘 만드느냐가 전체 성능을 결정한다.
삼성 HBM4E의 베이스다이는 두 가지 기술의 결합이다. 하나는 6세대 10나노급 DRAM 공정인 1c DRAM이고, 다른 하나는 삼성 파운드리(반도체 위탁 생산)의 4nm(나노미터, 매우 작은 단위) 로직 공정이다. 이 두 기술을 한 회사 안에서 결합할 수 있다는 것이 삼성이 강조하는 강점이다.
메모리 + 파운드리 + 첨단 패키징을 한 회사에서 처리. 설계 협력과 공급 일정 조율이 유리하다.
4nm 로직 베이스다이와 1c DRAM을 동시에 높은 수율로 만들 수 있는지가 고객 인증의 핵심 관문이다.
인터페이스 폭이 HBM3E의 1,024핀에서 HBM4 세대에 2,048핀으로 두 배로 늘어났다. 핀이 많아질수록 전력 소비와 발열 문제가 커지기 때문에, 베이스다이에서 이를 얼마나 효율적으로 제어하느냐가 곧 제품 경쟁력이 된다.
HBM4E 샘플 출하는 단순한 성능 발표가 아니다. 삼성의 메모리·파운드리 수직 통합 모델이 실제 AI 메모리 양산에서 통하는지를 고객이 직접 평가하는 시험대다.
3 전력·열 특성 개선이 데이터센터에서 왜 중요한가
삼성은 HBM4E가 전 세대 대비 에너지 효율을 16% 높이고, 열저항(열이 빠져나가는 저항)을 14% 이상 개선했다고 밝혔다. 속도나 용량만큼 눈에 띄지 않지만, AI 데이터센터를 운영하는 기업들에게는 이 수치가 매우 중요하다.
데이터센터는 수천 개의 AI 칩을 동시에 돌린다. 칩 하나가 열을 조금 덜 내면, 수천 개가 모였을 때 에어컨 비용과 전기세를 크게 줄일 수 있다. 1%의 효율 개선이 수억 원의 절감으로 이어지는 세계다.
AI 모델을 학습시키거나 대규모 추론(AI가 실제로 답변을 생성하는 작업)을 할수록 연산 성능이 높아질수록 메모리 쪽이 병목이 된다. GPU(그래픽 처리 장치)가 아무리 빠르게 계산해도 메모리가 데이터를 충분히 빠르게 공급하지 못하면 GPU가 쉬어야 한다.
그런데 메모리 속도를 높이면 전력 소비와 발열이 함께 늘어난다. 발열이 심해지면 GPU나 ASIC(특정 용도 전용 칩)이 과열을 막기 위해 스스로 속도를 낮추게 된다. 결국 성능이 오히려 떨어지는 상황이 생긴다.
HBM4E의 가치는 최고 속도 수치 하나로 결정되지 않는다. 실제 AI 클러스터 전체의 운영 비용을 얼마나 낮추느냐가 고객의 최종 판단 기준이다.
4 아직 확정되지 않은 사항들 — 샘플과 양산의 차이
이번 발표는 삼성에게 분명한 진전이다. 하지만 아직 확정되지 않은 중요한 부분들이 남아 있다.
HBM4 양산·상용 출하 발표. HBM4E 샘플 공급은 하반기로 계획했다.
2분기 안에 최초 HBM4E 샘플을 공급하겠다고 발표. 일정을 앞당겼다.
세계 최초 HBM4E 샘플 출하 발표. 주요 글로벌 고객에게 평가 시작.
고객 인증·최적화·공급 계약 완료 후 양산 시작 예정. 구체적 날짜는 미발표.
첫 번째 미확정 사항은 고객 이름이다. 삼성은 '주요 글로벌 고객'이라고만 밝혔다. 어떤 GPU 제조사나 클라우드 기업, 맞춤형 AI 칩 회사가 평가에 참여했는지는 공개되지 않았다.
두 번째는 양산 시기다. 삼성은 고객 일정에 맞춰 양산을 시작할 것이라고 했다. HBM은 GPU와 매우 밀접하게 설계된 부품이기 때문에 샘플 출하부터 실제 채택 확정까지 시간이 오래 걸린다.
세 번째는 라인업 확대 계획이다. 8층 32GB와 16층 64GB 제품은 아직 계획 단계다. 특히 16층 64GB는 매력적으로 보이지만, 16층 구조는 열과 접합(칩을 쌓을 때 연결 부분), 수율 면에서 난이도가 훨씬 높다.
경쟁 환경도 정체돼 있지 않다. SK하이닉스는 HBM4E 샘플을 2026년 하반기에 공급하고 2027년에 양산할 계획을 밝혔다. 마이크론도 2027년 HBM4E 로드맵을 제시하고 있다. 삼성의 이번 강점은 HBM4 양산 경험을 바탕으로 빠르게 HBM4E 샘플 단계로 진입한 것에 있다.
AI 인프라 경쟁에서 이기는 건 발표 순서가 아니다. 고객 인증을 통과한 뒤 안정적인 양산 수율과 장기 공급 능력을 증명하는 쪽이 최종 승자가 된다.
'관심가는이야기' 카테고리의 다른 글
| 현금 부자 NVIDIA가 250억 달러 빚을 낸 진짜 이유 (0) | 2026.06.16 |
|---|---|
| Exynos 2600 HPB, 액체 질소 Snapdragon 지속 성능 앞질렀다 (0) | 2026.06.15 |
| iPhone 18 Pro 가변 조리개, 렌즈 부품 50% 비싸진다 (0) | 2026.06.13 |
| 2027년 메모리 공급 과잉 경고…삼성 전 반도체 수장의 예측 (0) | 2026.06.12 |
| 그린란드 희토류 15년 계약, 미국 공급망 판도 바뀐다 (0) | 2026.06.11 |