NVIDIA GPU 제품별 연산 성능 비교

NVIDIA GPU 제품별 연산 성능 및 처리 속도를 비교합니다.

견적요청하기

연산 성능, 중요한 이유는 무엇입니까?

학습 사이클의 단축: 한 달 넘게 걸리던 학습을 일주일 만에 끝내고 결과물을 확인할 수 있습니다.

렌더링의 실시간화: 밤새 걸어두고 퇴근해야 했던 고해상도 3D 영상 렌더링을 커피 한 잔 마시는 사이에 완료할 수 있습니다.

모델 파라미터의 확장: 메모리와 연산 속도 한계 때문에 포기했던 1,000억 개 이상의 파라미터를 가진 초거대 AI 모델을 돌릴 수 있습니다.

초정밀 시뮬레이션: 기존 1km 단위로 분석하던 기상 예측을 10m 단위의 쪼개어 정밀하게 분석할 수 있습니다.

실시간 대화형 AI: 질문을 던지자마자 한 자씩 타이핑하는 게 아니라, 완성된 문단을 통째로 출력하는 수준의 반응 속도를 체감하게 됩니다.

대역폭의 해방: 데이터가 들어오는 대로 즉시 처리, 연산 장치가 데이터를 기다리며 노는 시간(Idle time) 없이 100% 풀가동되는 쾌감을 느낄 수 있습니다.

퀀텀브릭스는 합리적인 가격으로 GPU 서버를 공급합니다.

탑재수량별 GPU 서버 가격

#이미지: B200 GPU 8장이 탑재된 NVIDIA DGX B200 GPU 서버 전면 이미지

비교표 목록

#01. NVIDIA GPU 제품별 연산성능 (FP32)

#02. NVIDIA GPU 제품별 연산성능 (FP16)

#03. NVIDIA GPU 제품별 연산성능 (FP8)

#04. NVIDIA GPU 제품별 연산성능 (FP4)

* Tip: 목록을 클릭하면 해당 비교표로 이동, TOP 버튼을 클릭하면 상단으로 올라옵니다.

#01. NVIDIA GPU 제품별 연산 성능 비교표(FP32)

FP32 및 NVIDIA GPU 1장 당 기준으로 연산 성능 및 처리 속도를 비교합니다.

구분

메모리 대역폭

FP32 연산 성능

Rubin

22.0TB/s

0.26 PFLOPS

B300

8.0TB/s

1.2 PFLOPS

B200

8.0TB/s

1.2 PFLOPS

H200

4.8TB/s

0.12 PFLOPS

H100

3.9TB/s

0.12 PFLOPS

A100

1.9TB/s

0.039 PFLOPS

L40S

0.864TB/s

0.183 PFLOPS

RTX 6K*

1.597TB/s

0.240 PFLOPS

<참고사항>

본 도표의 연산 성능은 희소성(Sparsity) 기준이며, 밀집/고밀도(Dense) 기준에서는 약 50% 성능을 보입니다.

B300, B200, Rubin(루빈) : DGX / HGX / SXM 타입 GPU 1장 당 기준입니다.

H200, H100, A100, L40S, RTX 6K(RTX Pro 6000 Blackwell)은 NVL / PCIe 타입 GPU 1장 당 기준입니다.

1 PFLOPS: 전 세계 인구 80억 명이 계산기를 들고 1초에 한 번씩, 쉬지 않고 약 35시간 동안 계산해야 하는 일을 1초만에 끝냅니다.

1 TB/s: 5GB 고화질(HD) 영화 200편을 1초만에 통째로 옮길 수 있습니다.

RTX 6K* : RTX Pro 6000 Blackwell Server Edition (96GB)

본 도표는 NVIDIA 홈페이지 및 데이터 시트를 참고로 작성됐습니다.

전체 GPU 서버 가격 페이지 또는 견적 요청 시 48시간 내 제공 페이지를 참고 바랍니다.

#02. NVIDIA GPU 제품별 연산 성능 비교표(FP16)

FP16 및 NVIDIA GPU 1장 당 기준으로 연산 성능 및 처리 속도를 비교합니다.

구분

메모리 대역폭

FP16 연산 성능

Rubin

22.0TB/s

4.0 PFLOPS

B300

8.0TB/s

4.5 PFLOPS

B200

8.0TB/s

4.5 PFLOPS

H200

4.8TB/s

1.6 PFLOPS

H100

3.9TB/s

1.6 PFLOPS

A100

1.9TB/s

0.6 PFLOPS

L40S

0.864TB/s

0.7 PFLOPS

RTX 6K*

1.597TB/s

1.0 PFLOPS

<참고사항>

본 도표의 연산 성능은 희소성(Sparsity) 기준이며, 밀집/고밀도(Dense) 기준에서는 약 50% 성능을 보입니다.

B300, B200, Rubin(루빈) : DGX / HGX / SXM 타입 GPU 1장 당 기준입니다.

H200, H100, A100, L40S, RTX 6K(RTX Pro 6000 Blackwell)은 NVL / PCIe 타입 GPU 1장 당 기준입니다.

1 PFLOPS: 전 세계 인구 80억 명이 계산기를 들고 1초에 한 번씩, 쉬지 않고 약 35시간 동안 계산해야 하는 일을 1초만에 끝냅니다.

1 TB/s: 5GB 고화질(HD) 영화 200편을 1초만에 통째로 옮길 수 있습니다.

RTX 6K* : RTX Pro 6000 Blackwell Server Edition (96GB)

본 도표는 NVIDIA 홈페이지 및 데이터 시트를 참고로 작성됐습니다.

전체 GPU 서버 가격 페이지 또는 견적 요청 시 48시간 내 제공 페이지를 참고 바랍니다.

#03. NVIDIA GPU 제품별 연산 성능 비교표(FP8)

FP8 및 NVIDIA GPU 1장 당 기준으로 연산 성능 및 처리 속도를 비교합니다.

구분

메모리 대역폭

FP8 연산 성능

Rubin

22.0TB/s

17.5 PFLOPS

B300

8.0TB/s

9 PFLOPS

B200

8.0TB/s

9 PFLOPS

H200

4.8TB/s

3.3 PFLOPS

H100

3.9TB/s

3.3 PFLOPS

A100

1.9TB/s

FP8 미 지원

L40S

0.864TB/s

1.4 PFLOPS

RTX 6K*

1.597TB/s

2.0 PFLOPS

<참고사항>

본 도표의 연산 성능은 희소성(Sparsity) 기준이며, 밀집/고밀도(Dense) 기준에서는 약 50% 성능을 보입니다.

B300, B200, Rubin(루빈) : DGX / HGX / SXM 타입 GPU 1장 당 기준입니다.

H200, H100, A100, L40S, RTX 6K(RTX Pro 6000 Blackwell)은 NVL / PCIe 타입 GPU 1장 당 기준입니다.

A100 : FP8 미 지원, INT8은 1,248TOPS 입니다.

1 PFLOPS: 전 세계 인구 80억 명이 계산기를 들고 1초에 한 번씩, 쉬지 않고 약 35시간 동안 계산해야 하는 일을 1초만에 끝냅니다.

1 TB/s: 5GB 고화질(HD) 영화 200편을 1초만에 통째로 옮길 수 있습니다.

RTX 6K* : RTX Pro 6000 Blackwell Server Edition (96GB)

본 도표는 NVIDIA 홈페이지 및 데이터 시트를 참고로 작성됐습니다.

전체 GPU 서버 가격 페이지 또는 견적 요청 시 48시간 내 제공 페이지를 참고 바랍니다.

#04. NVIDIA GPU 제품별 연산 성능 비교표(FP4)

FP4 및 NVIDIA GPU 1장 당 기준으로 연산 성능 및 처리 속도를 비교합니다.

구분

메모리 대역폭

FP4 연산 성능

Rubin

22.0TB/s

50 PFLOPS

B300

8.0TB/s

18 PFLOPS

B200

8.0TB/s

18 PFLOPS

H200

4.8TB/s

FP4 미 지원

H100

3.9TB/s

FP4 미 지원

A100

1.9TB/s

FP4 미 지원

L40S

0.864TB/s

FP4 미 지원

RTX 6K*

1.597TB/s

4.0 PFLOPS

<참고사항>

본 도표의 연산 성능은 희소성(Sparsity) 기준이며, 밀집/고밀도(Dense) 기준에서는 약 50% 성능을 보입니다.

B300, B200, Rubin(루빈) : DGX / HGX / SXM 타입 GPU 1장 당 기준입니다.

H200, H100, A100, L40S, RTX 6K(RTX Pro 6000 Blackwell)은 NVL / PCIe 타입 GPU 1장 당 기준입니다.

1 PFLOPS: 전 세계 인구 80억 명이 계산기를 들고 1초에 한 번씩, 쉬지 않고 약 35시간 동안 계산해야 하는 일을 1초만에 끝냅니다.

1 TB/s: 5GB 고화질(HD) 영화 200편을 1초만에 통째로 옮길 수 있습니다.

RTX 6K* : RTX Pro 6000 Blackwell Server Edition (96GB)

본 도표는 NVIDIA 홈페이지 및 데이터 시트를 참고로 작성됐습니다.

전체 GPU 서버 가격 페이지 또는 견적 요청 시 48시간 내 제공 페이지를 참고 바랍니다.

엔비디아 GPU, 어떤 제품을 선택해야 하나요?

NVIDIA GPU 1장에 올릴 수 있는 LLM 모델의 크기는 메모리 용량을 기준으로 계산됩니다.

메모리 용량 / 대역폭 비교표

메모리 용량의 1차적인 역할은 올릴 수 있는 LLM 모델의 크기를 결정합니다.

비교표 자세히 보기

파인튜닝 가능 LLM 크기

엔비디아 GPU 제품별 풀 파인 튜닝이 가능한 모델의 크기를 비교합니다.

비교표 자세히 보기

전력소모량 비교표

엔비디아 GPU 제품별로 전력 소모량 및 최대 전력 소모량을 비교합니다.

비교표 자세히 보기

추론 성능(TPS) 비교표

TPS(초당 토큰 생성 수)는 얼마나 빨리 답을 내느냐를 보여주는 수치입니다.

비교표 자세히 보기

학습 가능 LLM 크기

엔비디아 GPU 제품별, 학습 시, 적재할 수 있는 모델의 크기를 비교합니다.

비교표 자세히 보기

RAG 시스템 구축

RAG 시스템 구축 및 운영에 적합한 GPU 제품 및 서버를 비교합니다.

비교표 자세히 보기

연산 성능(FLOPS) 비교표

엔비디아 GPU 제품별로 정밀도별 연산 성능 및 처리 속도를 비교합니다.

비교표 자세히 보기

추론 가능 LLM 크기

엔비디아 GPU 제품별 추론 시, 적재할 수 있는 LLM 크기를 비교합니다.

비교표 자세히 보기

2가지 타입 GPU 비교

단품 구매 가능, 탑재 수량 선택 가능 등 2가지 타입 GPU 를 비교합니다.

비교표 자세히 보기

탑재수량별 GPU 서버 사양 및 가격표

퀀텀브릭스는 합리적인 가격으로 GPU 서버를 공급하여 고객사 및 파트너의 AI 비지니스를 지원합니다.

파트 #A. NVIDIA 직접 제조 제품

#01. Rubin NVL72 | 루빈 x 72장

#02. GB300 NVL72 | B300 x 72장

#03. GB200 NVL72 | B200 x 72장

#04. DGX Rubin NVL8 | 루빈 x 8장

#05. DGX B300 | B300 x 8장

#06. DGX B200 | B200 x 8장

#07. DGX H200 | H200 x 8장

* Tip: 항목을 클릭하면 사양 및 가격으로 이동합니다.

NVIDIA DGX B200, B300 시리즈 등은 엔비디아가 직접 설계 및 제조한 AI 전용 완제품 GPU 서버입니다.

엔비디아 스타트업 프로그램에 가입하면, DGX 시리즈 구매 시, 최대 30%까지 할인을 받을 수 있습니다.

자세한 사항은 각 제품 상세 페이지, 최대 48시간 내 견적서 제공 및 실시간 문의하기를 참고 바랍니다.

파트 #B. HPE, Dell 등 벤더 제조 제품

* Tip: 항목을 클릭하면 사양 및 가격으로 이동합니다.

* RTX 6K : RTX Pro 6000 Blackwell Server Edition

문의하기

메세지를 남겨주시면 빠르게 답변 드립니다.

대략적인 가격은 탑재수량별 GPU 서버 가격 페이지를 참고 바랍니다.

퀀텀브릭스는 합리적인 가격으로 GPU 서버를 공급하여, 고객사 및 파트너의 AI 비지니스 확산을 빠르게 지원합니다.

실시간 문의하기

견적요청 하기

최단 24시간, 최대 48시간 이내 (영업일 기준) 견적서를 보내 드립니다.

엔비디아 루빈(Rubin), B300, B200, H200, L40S 등 모든 GPU 서버를 공급합니다.

퀀텀브릭스는 NVIDIA 직접 제조 제품부터 HPE, Dell 등 벤더 제조 제품까지, 모든 타입의 GPU 서버를 합리적인 가격으로 공급합니다.

견적요청하기

사양 및 가격

NVIDIA GPU 비교 및 선택

견적요청 및 문의

회사소개 및 블로그

NVIDIA GPU 제품별 연산 성능 비교

연산 성능, 중요한 이유는 무엇입니까?

비교표 목록

#01. NVIDIA GPU 제품별 연산 성능 비교표(FP32)

#02. NVIDIA GPU 제품별 연산 성능 비교표(FP16)

#03. NVIDIA GPU 제품별 연산 성능 비교표(FP8)

#04. NVIDIA GPU 제품별 연산 성능 비교표(FP4)

엔비디아 GPU, 어떤 제품을 선택해야 하나요?

탑재수량별 GPU 서버 사양 및 가격표

파트 #A. NVIDIA 직접 제조 제품

파트 #B. HPE, Dell 등 벤더 제조 제품

문의하기

견적요청 하기

​사양 및 가격

NVIDIA GPU 비교 및 선택

​견적요청 및 문의

회사소개 및 블로그

NVIDIA GPU 제품별 연산 성능 비교

연산 성능, 중요한 이유는 무엇입니까?

비교표 목록

#01. NVIDIA GPU 제품별 연산 성능 비교표(FP32)

#02. NVIDIA GPU 제품별 연산 성능 비교표(FP16)

#03. NVIDIA GPU 제품별 연산 성능 비교표(FP8)

#04. NVIDIA GPU 제품별 연산 성능 비교표(FP4)

엔비디아 GPU, 어떤 제품을 선택해야 하나요?

탑재수량별 GPU 서버 사양 및 가격표

파트 #A. NVIDIA 직접 제조 제품

파트 #B. HPE, Dell 등 벤더 제조 제품

​문의하기

​견적요청 하기

사양 및 가격

견적요청 및 문의

문의하기

견적요청 하기