2.1.1. NV10(Celsius) 마이크로아키텍처
2.1.2. NV20(Kelvin) 마이크로아키텍처
2.1.3. NV30(Rankine) 마이크로아키텍처
2.1.4. NV40(Curie) 마이크로아키텍처
2.1.5. G80(Tesla) 마이크로아키텍처
2.2.1. NV10(Celsius) 마이크로아키텍처
2.2.2. NV20(Kelvin) 마이크로아키텍처
2.2.3. NV30(Rankine) 마이크로아키텍처
2.2.4. NV40(Curie) 마이크로아키텍처
2.2.5. G80(Tesla) 마이크로아키텍처
3.1.1. NV10(Celsius) 마이크로아키텍처
3.1.2. NV30(Rankine) 마이크로아키텍처
3.1.3. NV40(Curie) 마이크로아키텍처
3.1.4. G80(Tesla) 마이크로아키텍처
3.2.1. NV40(Curie) 마이크로아키텍처
3.2.2. G80(Tesla) 마이크로아키텍처
4. 데이터 센터 GPU 제품군 (구 Tesla)
1. 개요
NVIDIA의
워크스테이션용 GPU 목록. 용도별로 그래픽 정밀 렌더링용인 Quadro, 비즈니스 멀티 모니터 출력용인 NVS, 고성능 컴퓨팅용인 Tesla, 가상 작업 공간용인 GRID, 암호화폐 채굴용인 Mining 제품군이 있다.
2. Quadro 제품군
1999년 지포스와 비슷한 시기에 탄생했다. 지포스와 다르게 일반 사용자가 아닌 전문가를 대상으로 정밀 렌더링 작업용으로 내놓은 제품이다. 하지만, GPU 칩셋 자체는 지포스와 같다. 같은 칩셋을 쓰고 있음에도 불구하고 단일이 아닌 두 제품군으로 내놓는 것은 하드웨어 자원은 한정되어 있으므로 용도별 드라이버 소프트웨어로 자원 분배를 차등해야 하기 때문이다. 게이밍용인 지포스는 빠른 프레임율을 추구하는 방향으로, 쿼드로는 프레임율이 다소 느려도 정확한 렌더링을 추구하는 방향으로 차등해 놓았다. 전문가용 시장 공략에 대성공한데다가 근본적인 알맹이가 똑같은 게이밍용 지포스보다 전문가용이라는 이유로 훨씬 비싸게 판매해서 더 많은 이득을 보고 있다. 하지만 최근에는 지포스도 렌더링 성능이 세대를 거듭하면서 크게 향상되어 작업용으로 쓰는 사람들이 점점 많아졌다. 그래서 쿼드로의 존재감이 조금씩 퇴색하고 있지만 정밀 렌더링만큼은 쿼드로가 우위에 있기 때문에 그런 용도로써 효용성이 있다. 최근에는 ECC/REG 같은 오류 보정 기능이 있는 서버용 메모리를 탑재해 차등화하기도 한다. 지포스 시리즈는 오류 보정 기능이 없는 일반 메모리를 탑재했다. 이는 AMD의
Radeon Instinct 제품군도 마찬가지로 라데온 시리즈와의 차별화를 두고 있다.
2002년부터는 지포스와 마찬가지로 쿼드로에도 랩톱 제품군이 투입되었지만, 랩톱이라는 작고 얇은 제약된 공간 특성상 데스크톱용보다 사양을 낮췄고, 그런 점에서는 랩톱용 지포스와 비슷하다. 모바일 워크스테이션에 탑재하는 쿼드로는 외장 그래픽으로 내놓은 쿼드로 제품군 대부분을 탑재하고 있다. 하지만 전문가용이라 웬만한 게이밍 랩톱보다 훨씬 비싸다. 이에 관한 자세한 내용은
모바일 워크스테이션 문서 참조.
2020년 10월 암페어 아키텍쳐 기반의 RTX A6000과 A40이 출시되었는데 쿼드로 브랜드가 사라진 채 발표되었다. 이미 사라진 테슬라와 균형을 맞추기 위한 것인지는 확실히 밝혀지지 않았지만, 일단 엔비디아 홈페이지에서는 신형 쿼드로로 소개하고 있다. 다만 제품 명칭에서는 확실하게 사라졌다. 테슬라야 그렇다 쳐도 쿼드로는 지포스와 같이 20년을 이어져 온 브랜드인데 왜 갑자기 사라졌는지가 의문점이다.
2.1. Quadro 데스크톱용 제품군
2.1.1. NV10(Celsius) 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PP:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
'''Quadro'''
| NV10 (220㎚) (111㎟)
| 4:4:4
| 135
| 128
| SDR
| 166
| 32
| ?
| ?
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]===== Quadro 2 =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PP:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro 2 Pro'''
| NV15 (180㎚) (90㎟)
| 4:4:4
| 200
| 128
| DDR
| 250 (500)
| 64
| ?
| ?
|
'''Quadro 2 MXR'''
| NV11 (180㎚) (65㎟)
| 2:4:4
| SDR
| 183
| 32
| ?
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PP:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro 4 550 XGL'''
| NV17 (150㎚) (65㎟)
| 2:4:4
| 270
| 128
| DDR
| 200 (400)
| 64
| ?
| ?
|
'''Quadro 4 500 XGL'''
| 250
| SDR
| 166
| 128
| ?
| ?
|
'''Quadro 4 580 XGL'''
| NV18 (150㎚) (65㎟)
| 300
| DDR
| 200 (400)
| 64
| ?
| ?
|
'''Quadro 4 380 XGL'''
| 275
| 256 (512)
| 128
| ?
| ?
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== NV20(Kelvin) 마이크로아키텍처 ========= Quadro DCC =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
'''Quadro DCC'''
| NV20 (150㎚) (128㎟)
| 4:1:4:4
| 200
| 128
| SDR
| 230
| 64
| ?
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro 4 900 XGL'''
| NV25 (150㎚) (142㎟)
| 4:2:8:8
| 300
| 128
| DDR
| 325 (650)
| 128
| ?
| ?
|
'''Quadro 4 750 XGL'''
| 275
| 225 (450)
| ?
| ?
|
'''Quadro 4 700 XGL'''
| 64
| ?
| ?
|
'''Quadro 4 980 XGL'''
| NV28 (150㎚) (101㎟)
| 300
| 325 (650)
| 128
| ?
| ?
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== NV30(Rankine) 마이크로아키텍처 ========= Quadro FX (x000) =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 1000'''
| NV30 (130㎚) (200㎟)
| 4:2:8:4
| 300
| 128
| GDDR2
| 300 (600)
| 128
| ?
| ?
|
'''Quadro FX 2000'''
| 400
| 400 (800)
| ?
| ?
|
'''Quadro FX 3000'''
| NV35 (130㎚) (207㎟)
| 4:3:8:8
| 256
| DDR
| 425 (850)
| 256
| ?
| ?
|
'''Quadro FX 700'''
| 4:1:4:4
| 275
| 128
| 275 (550)
| 128
| ?
| ?
|
'''Quadro FX 600''' [1]
| NV34 (150㎚) (91㎟)
| 4:2:4:4
| 270
| 240 (480)
| ?
| ?
|
'''Quadro FX 500'''
| 4:1:4:4
| ?
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.1.1.4. Quadro FX (x100)
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
'''Quadro FX 1100'''
| NV36 (130㎚) (125㎟)
| 4:3:4:4
| 425
| 128
| GDDR2
| 325 (650)
| 256
| ?
| ?
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]===== Quadro FX (x300) =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 1300'''
| NV38 (130㎚) (207㎟)
| 8:3:8:8
| 350
| 128
| DDR
| 275 (550)
| 128
| ?
| ?
|
'''Quadro FX 330'''
| NV35 (130㎚) (207㎟)
| 4:2:4:2
| 250
| 64
| GDDR2
| 200 (400)
| 64
| ?
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.1.2. NV40(Curie) 마이크로아키텍처
2.1.2.1. Quadro FX (x000)
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 4000'''
| NV40 (130㎚) (287㎟)
| 12:5:12:8
| 375
| 256
| GDDR3
| 500 (1000)
| 256
| ?
| ?
|
'''Quadro FX 4000 SDI'''
| NV41 (130㎚) (225㎟)
| 12:5:12:12
| 425
| ?
| ?
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]===== Quadro FX (x400) =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 4400'''
| NV40 (AGP) (130㎚) (287㎟)
| 12:5:12:12
| 375
| 256
| GDDR3
| 525 (1050)
| 256
| ?
| ?
|
'''Quadro FX 3450'''
| NV41 (PCIe) (130㎚) (225㎟)
| 425
| 500 (1000)
| ?
| ?
|
'''Quadro FX 3400'''
| NV45 (PCIe) (130㎚) (287㎟)
| 350
| 450 (900)
| ?
| ?
|
'''Quadro FX 1400'''
| NV41 (PCIe) (130㎚) (225㎟)
| 12:5:12:8
| 128
| DDR
| 300 (600)
| 128
| ?
| ?
|
'''Quadro FX 540'''
| NV43 (PCIe) (110㎚) (150㎟)
| 8:4:8:8
| 300
| GDDR3
| 250 (500)
| ?
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.1.2.2. Quadro FX (x500)
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 4500'''
| G70 (110㎚) (333㎟)
| 24:8:24:16
| 430
| 256
| GDDR3
| 525 (1050)
| 512
| ?
| ?
|
'''Quadro FX 5500'''
| G71 (90㎚) (196㎟)
| 650
| 505 (1010)
| 1024
| ?
| ?
|
'''Quadro FX 4500 X2'''
| 24:8:24:16 x2
| 375
| 256 x2
| 605 (1210)
| 512 x2
| ?
| ?
|
'''Quadro FX 3500'''
| 20:7:20:16
| 450
| 256
| 660 (1320)
| 256
| ?
| ?
|
'''Quadro FX 1500'''
| 325
| 625 (1250)
| ?
| ?
|
'''Quadro FX 560'''
| G73 (90㎚) (125㎟)
| 12:5:12:8
| 350
| 128
| 600 (1200)
| 128
| ?
| ?
|
'''Quadro FX 550'''
| NV43 (110㎚) (150㎟)
| 8:4:8:8
| 360
| 400 (800)
| ?
| ?
|
'''Quadro FX 350'''
| G72 (90㎚) (81㎟)
| 4:3:4:2
| 550
| 64
| DDR2
| 405 (810)
| ?
| ?
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== G80(Tesla) 마이크로아키텍처 ========= Quadro FX (x600) =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''FX 5600'''
| G80 (90㎚) (484㎟)
| 128:32:24 (8, 16)
| 600 (코어) 1350 (셰이더)
| 384
| GDDR3
| 800 (1600)
| 1536
| 171
| 2999
|
'''FX 4600'''
| 96:24:24 (6, 12)
| 500 (코어) 1200 (셰이더)
| 700 (1400)
| 768
| 134
| 1999
|
<rowcolor=white> - 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.1.2.3. Quadro FX (x700)
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''FX 3700'''
| G92 (65㎚) (324㎟)
| 112:56:16 (7, 14)
| 500 (코어) 1250 (셰이더)
| 256
| GDDR3
| 800 (1600)
| 512
| 78
| 1599
|
'''FX 4700 X2'''
| 128:64:16 (8 x2, 16 x2) x2
| 600 (코어) 1500 (셰이더)
| 256 x2
| 1024 x2
| 226
| 2999
|
'''FX 1700'''
| G84 (80㎚) (169㎟)
| 32:16:8 (2, 4)
| 460 (코어) 920 (셰이더)
| 256
| DDR2
| 400 (800)
| 512
| 42
| 699
|
'''FX 570'''
| 16:8:8 (1, 2)
| 128
| 256
| 38
| 199
|
'''FX 370'''
| 16:8:4 (1, 2)
| 360 (코어) 720 (셰이더)
| 64
| 500 (1000)
| 35
| 129
|
'''FX 370 LP'''
| G98 (65㎚) (86㎟)
| 8:8:4 (1, 1)
| 540 (코어) 1080 (셰이더)
| 25
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]===== Quadro FX (x800) =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''FX 5800'''
| G200B (55㎚) (470㎟)
| 240:80:32 (10, 30)
| 500 (코어) 1250 (셰이더)
| 256
| GDDR3
| 800 (1600)
| 512
| 78
| 1599
|
'''FX 4800'''
| 192:64:24 (8, 24)
| 602 (코어) 1204 (셰이더)
| 384
| 1536
| 150
| 1799
|
'''FX 3800'''
| 192:64:16 (8, 24)
| 256
| 1024
| 108
| 799
|
'''FX 1800'''
| G94 (65㎚) (240㎟)
| 64:32:12 (4, 8)
| 550 (코어) 1375 (셰이더)
| 192
| 768
| 59
| 489
|
'''FX 580'''
| G96C (55㎚) (121㎟)
| 32:16:8 (2, 4)
| 450 (코어) 1125 (셰이더)
| 128
| 512
| 40
| 199
|
'''FX 380'''
| G96 (65㎚) (144㎟)
| 16:8:8 (1, 2)
| 450 (코어) 1100 (셰이더)
| 700 (1400)
| 256
| 34
| 129
|
'''FX 380 LP'''
| GT218 (40㎚) (57㎟)
| 16:8:4 (1, 2)
| 650 (코어) 1375 (셰이더)
| 64
| 800 (1600)
| 512
| 28
| 169
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
'''CX'''
| G200B (55㎚) (470㎟)
| 192:64:24 (8, 24)
| 602 (코어) 1204 (셰이더)
| 384
| GDDR3
| 800 (1600)
| 1536
| 150
| 1999
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]===== Quadro VX =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
'''VX 200'''
| G92 (65㎚) (324㎟)
| 112:56:16 (7, 14)
| 450 (코어) 1125 (셰이더)
| 256
| GDDR3
| 800 (1600)
| 512
| 75
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.1.3. Fermi 마이크로아키텍처
2.1.3.1. Quadro (x000)
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''7000'''
| GF110 (40㎚) (520㎟)
| 512:64:48 (4, 16)
| 651 (코어) 1301 (셰이더)
| 768
| 384
| GDDR5
| 924 (3696)
| 6
| 204
| 14499
|
'''6000'''
| GF100 (40㎚) (529㎟)
| 448:56:48 (4, 14)
| 574 (코어) 1147 (셰이더)
| 747 (2988)
| 4399
|
'''5000'''
| 352:44:40 (3, 11)
| 513 (코어) 1026 (셰이더)
| 640
| 320
| 750 (3000)
| 2.5
| 152
| 2499
|
'''4000'''
| 256:32:32 (2, 8)
| 475 (코어) 950 (셰이더)
| 512
| 256
| 702 (2808)
| 2
| 142
| 1199
|
'''2000'''
| GF106 (40㎚) (238㎟)
| 192:32:16 (1, 4)
| 625 (코어) 1250 (셰이더)
| 256
| 128
| 650 (2600)
| 1
| 62
| 599
|
'''600'''
| GF108 (40㎚) (116㎟)
| 96:16:8 (1, 2)
| 640 (코어) 1280 (셰이더)
| DDR3
| 800 (1600)
| 40
| 179
|
'''400'''
| GT216 (40㎚) (100㎟)
| 48:16:8 (2, 6)
| 450 (코어) 1125 (셰이더)
| -
| 64
| 770 (1540)
| 0.5
| 32
| 169
|
<-11><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GF100, GF110 칩셋 한정 → (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
GF106, GF108 칩셋 한정 → (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== Kepler 마이크로아키텍처 ========= Quadro K =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMX/SMM)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900>'''K6000'''
| GK110 (28㎚) (561㎟)
| 2880:240:48 (5, 15)
| 797 (기본) 902 (부스트)
| 1536
| 384
| GDDR5
| 1502 (6008)
| 12
| 225
| 5265
|
'''K5200'''
| 2304:192:48 (4, 12)
| 667 (기본) 771 (부스트)
| 1024
| 256
| 8
| 150
| ?
|
'''K5000'''
| GK104 (28㎚) (294㎟)
| 1536:128:32 (4, 8)
| 706 (기본)
| 512
| 1350 (5400)
| 4
| 122
| 2499
|
'''K4200'''
| 1344:112:32 (4, 7)
| 771 (기본) 784 (부스트)
| 108
| ?
|
'''K4000'''
| GK106 (28㎚) (221㎟)
| 768:64:24 (2, 4)
| 810 (기본)
| 384
| 192
| 1404 (5616)
| 3
| 80
| 1269
|
'''K2200'''
| GM107 (28㎚) (148㎟)
| 640:40:16 (1, 5)
| 1046 (기본) 1124 (부스트)
| 2048
| 128
| 1253 (5012)
| 4
| 68
| ?
|
'''K2000'''
| GK107 (28㎚) (118㎟)
| 384:32:16 (1, 2)
| 954 (기본)
| 256
| 1000 (4000)
| 2
| 51
| 599
|
'''K1200'''
| GM107 (28㎚) (148㎟)
| 512:32:16 (1, 4)
| 1058 (기본) 1124 (부스트)
| 2048
| 1250 (5000)
| 4
| 45
| ?
|
'''K620'''
| 384:16:16 (1, 3)
| 1058 (기본) 1124 (부스트)
| DDR3
| 900 (1800)
| 2
| 41
| ?
|
'''K600'''
| GK107 (28㎚) (118㎟)
| 192:16:16 (1, 1)
| 876 (기본)
| 256
| 891 (1792)
| 1
| 41
| 199
|
'''K420'''
| ?
|
'''K410'''
| 192:16:8 (1, 1)
| 706 (기본)
| 128
| 64
| 0.5
| 38
| 149
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] GK110 칩셋 한정 → (단정밀도 연산 속도) ÷ 3 = (배정밀도 연산 속도) [GFLOPS] GK104, GK106, GK107 칩셋 한정 → (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS] GM107 칩셋 한정 → (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.1.4. Maxwell 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMX/SMM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''M6000'''
| GM200 (28㎚) (601㎟)
| 3072:192:96 (6, 24)
| 988 (기본) 1114 (부스트)
| 3
| 384
| GDDR5
| 1653 (6612)
| 12 24
| 250
| 4999
|
'''M5000'''
| GM204 (28㎚) (398㎟)
| 2048:128:64 (4, 16)
| 861 (기본) 1038 (부스트)
| 2
| 256
| 8
| 150
| ?
|
'''M4000'''
| 1664:104:64 (4, 13)
| 773
| 120
| ?
|
'''M3000 SE'''
| 1024:64:32 (2, 8)
| 540
| 1253 (5012)
| 4
| 75
| ?
|
'''M2000'''
| GM206 (28㎚) (228㎟)
| 768:48:32 (2, 6)
| 872 (기본) 1180 (부스트)
| 1
| 128
| 1653 (6612)
| ?
|
<-11><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== Pascal 마이크로아키텍처 ========= Quadro P =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''GP100'''
| GP100 (16㎚) (610㎟)
| 3584:224:96 (6, 56)
| 1380 (기본) 1441 (부스트)
| 4
| 4096
| HBM2
| 900 (1800)
| 16
| 235
| 6999
|
'''P6000'''
| GP102 (16㎚) (471㎟)
| 3840:240:96 (6, 30)
| 1417 (기본) 1531 (부스트)
| 3
| 384
| GDDR5X
| 1127 (9016)
| 24
| 250
| 4999
|
'''P5000'''
| GP104 (16㎚) (314㎟)
| 2560:160:64 (4, 20)
| 1607 (기본) 1733 (부스트)
| 2
| 256
| 16
| 180
| 2499
|
'''P4000'''
| 1792:112:64 (4, 14)
| 1202 (기본) 1480 (부스트)
| GDDR5
| 1901 (7604)
| 8
| 105
| 815
|
'''P2000'''
| GP106 (16㎚) (200㎟)
| 1024:64:40 (2, 8)
| 1076 (기본) 1480 (부스트)
| 1.25
| 160
| 1752 (7008)
| 5
| 75
| ?
|
'''P1000'''
| GP107 (16㎚) (132㎟)
| 640:40:32 (1, 5)
| 1266 (기본) 1480 (부스트)
| 1
| 128
| 1253 (5012)
| 4
| 47
| ?
|
'''P620'''
| 384:24:16 (1, 3)
| 1354 (기본) 1455 (부스트)
| 1003 (4012)
| 2
| 40
| ?
|
'''P600'''
| 1329 (기본) 1557 (부스트)
| 0.5
| 64
| ?
|
'''P400'''
| 256:16:16 (1, 2)
| 1228 (기본) 1328 (부스트)
| 30
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.1.5. Volta 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TS:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
'''GV100'''
| GV100 (12㎚) (815㎟)
| 5120:640:320:128 (6, 80)
| 1132 (기본) 1628 (부스트)
| 8
| 4096
| HBM2
| 850 (1700)
| 32
| 250
| 8999
|
<-11><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== Turing 마이크로아키텍처 ========= Quadro RTX =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TS:TMU:RT:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''RTX 8000'''
| TU102 (12㎚) (754㎟)
| 4608:576:288:72:96 (6, 72)
| 1005 (기본) 1200 (부스트)
| 6
| 384
| GDDR6
| 1750 (14000)
| 48
| 250
| 9999
|
'''RTX 6000'''
| 1440 (기본) 1770 (부스트)
| 24
| 6299
|
'''RTX 5000'''
| TU104 (12㎚) (545㎟)
| 3072:384:192:48:64 (6, 48)
| 1620 (기본) 1815 (부스트)
| 4
| 256
| 16
| 200
| 2299
|
'''RTX 4000'''
| 2304:288:144:36:64 (5, 36)
| 1215 (기본) 1710 (부스트)
| 1625 (13000)
| 8
| 160
| 899
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.1.6. Ampere 마이크로아키텍쳐
2.1.6.1. Quadro RTX A6000
2.2. Quadro 모바일용 제품군
2.2.1. NV10(Celsius) 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PP:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
'''Quadro 4 500 Go GL'''
| NV17 (150㎚) (65㎟)
| 2:4:2
| 220
| 128
| SDR
| 220
| 64
| ?
|
<-9><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== NV20(Kelvin) 마이크로아키텍처 ========= Quadro 4 Go =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
'''Quadro 4 700 Go GL'''
| NV28 (150㎚) (101㎟)
| 4:2:4:4
| 176
| 128
| SDR
| 200
| 64
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.2.2. NV30(Rankine) 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
'''Quadro FX Go 1000'''
| NV36 (130㎚) (125㎟)
| 4:3:4:4
| 295
| 128
| DDR
| 285 (570)
| 128
| ?
|
<-9><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== NV40(Curie) 마이크로아키텍처 ========= Quadro FX Go =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro FX Go 1400'''
| NV41 (130㎚) (225㎟)
| 8:5:8:8
| 275
| 256
| DDR
| 295 (590)
| 256
| ?
|
'''Quadro FX Go 540'''
| NV43 (110㎚) (150㎟)
| 8:4:8:8
| 300
| 128
| 225 (450)
| 128
| 25
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.2.2.2. Quadro FX (x500M)
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 3500M'''
| G71 (90㎚) (196㎟)
| 24:8:24:16
| 575
| 256
| GDDR3
| 600 (1200)
| 512
| 45
|
'''Quadro FX 2500M'''
| 500
|
'''Quadro FX 1500M'''
| 20:7:24:16
| 375
| 500 (1000)
|
'''Quadro FX 550M'''
| G73 (90㎚) (125㎟)
| 12:5:12:8
| 480
| 128
| 35
|
'''Quadro FX 350M'''
| G72 (90㎚) (81㎟)
| 4:3:4:2
| 450
| 450 (900)
| 256
| 15
|
<-9><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== G80(Tesla) 마이크로아키텍처 ========= Quadro FX (x600M) =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''FX 3600M'''
| G92 (65㎚) (324㎟)
| 96:48:16 (6, 12)
| 500 (코어) 1250 (셰이더)
| 256
| GDDR3
| 800 (1600)
| 512
| 70
|
'''FX 2600M'''
| 64:32:16 (4, 8)
| 799 (1598)
|
'''FX 1600M'''
| G84 (80㎚) (169㎟)
| 32:16:8 (2, 4)
| 625 (코어) 1250 (셰이더)
| 128
| 800 (1600)
| 50
|
'''FX 360M'''
| G86 (80㎚) (127㎟)
| 16:8:4 (1, 2)
| 400 (코어) 800 (셰이더)
| 64
| DDR2
| 600 (1200)
| 256
| 17
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.2.2.3. Quadro FX (x700M)
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''FX 3700M'''
| G92 (65㎚) (324㎟)
| 128:64:16 (8, 16)
| 550 (코어) 1375 (셰이더)
| 256
| GDDR3
| 800 (1600)
| 1024
| 75
|
'''FX 2700M'''
| G94 (65㎚) (240㎟)
| 48:24:16 (3, 6)
| 530 (코어) 1325 (셰이더)
| 799 (1598)
| 512
| 65
|
'''FX 1700M'''
| G96 (65㎚) (144㎟)
| 32:16:8 (2, 4)
| 625 (코어) 1550 (셰이더)
| 128
| 800 (1600)
| 50
|
'''FX 770M'''
| 500 (코어) 1250 (셰이더)
| 35
|
'''FX 570M'''
| G84 (80㎚) (169㎟)
| 475 (코어) 950 (셰이더)
| 700 (1400)
| 45
|
'''FX 370M'''
| G98 (65㎚) (86㎟)
| 8:4:4 (1, 1)
| 550 (코어) 1400 (셰이더)
| 64
| 600 (1200)
| 256
| 20
|
<-9><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]===== Quadro FX (x800M) =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''FX 3800M'''
| G92 (65㎚) (324㎟)
| 128:64:16 (8, 16)
| 675 (코어) 1650 (셰이더)
| 256
| GDDR3
| 1000 (2000)
| 1024
| 100
|
'''FX 2800M'''
| 96:48:16 (6, 12)
| 600 (코어) 1500 (셰이더)
| 75
|
'''FX 1800M'''
| GT215 (40㎚) (144㎟)
| 72:24:8 (3, 9)
| 561 (코어) 1125 (셰이더)
| 128
| GDDR5
| 550 (2200)
| 45
|
'''FX 880M'''
| GT216 (40㎚) (100㎟)
| 48:16:8 (2, 6)
| 500 (코어) 1250 (셰이더)
| GDDR3
| 790 (1580)
| 35
|
'''FX 380M'''
| GT218 (40㎚) (57㎟)
| 16:8:4 (1, 2)
| 550 (코어) 1400 (셰이더)
| 64
| 512
| 25
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.2.3. Fermi 마이크로아키텍처
2.2.3.1. Quadro (x000M)
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''5010M'''
| GF110 (40㎚) (520㎟)
| 384:48:32 (3, 12)
| 450 (코어) 900 (셰이더)
| 512
| 256
| GDDR5
| 650 (2600)
| 4
| 100
|
'''5000M'''
| GF100 (40㎚) (529㎟)
| 320:40:32 (3, 10)
| 405 (코어) 810 (셰이더)
| 600 (2400)
| 1.75
|
'''4000M'''
| GF104 (40㎚) (332㎟)
| 336:56:32 (2, 7)
| 475 (코어) 950 (셰이더)
| 625 (2500)
| 2
|
'''3000M'''
| 240:40:32 (2, 5)
| 450 (코어) 900 (셰이더)
| 75
|
'''2000M'''
| GF106 (40㎚) (238㎟)
| 192:32:16 (1, 4)
| 550 (코어) 1100 (셰이더)
| 256
| 128
| DDR3
| 900 (1800)
| 55
|
'''1000M'''
| GF108 (40㎚) (116㎟)
| 96:16:4 (1, 2)
| 700 (코어) 1400 (셰이더)
| 45
|
'''500M'''
| 1
| 35
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GF100, GF110 칩셋 한정 → (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
GF104, GF106, GF108 칩셋 한정 → (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== Kepler 마이크로아키텍처 ========= Quadro Kx000M =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMX)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''K5000M'''
| GK104 (28㎚) (294㎟)
| 1344:112:32 (4, 7)
| 601 (기본)
| 512
| 256
| GDDR5
| 750 (3000)
| 4
| 100
|
'''K4000M'''
| 960:80:32 (3, 5)
| 700 (2800)
|
'''K3000M'''
| 576:48:32 (2, 3)
| 654 (기본)
| 2
| 75
|
'''K2000M'''
| GK107 (28㎚) (118㎟)
| 384:32:16 (1, 2)
| 745 (기본)
| 256
| 128
| DDR3
| 900 (1800)
| 55
|
'''K1000M'''
| 192:16:16 (1, 1)
| 850 (기본)
| 45
|
'''K500M'''
| 192:16:8 (1, 1)
| 128
| 64
| 800 (1600)
| 1
| 35
|
'''K200M'''
|
'''K100M'''
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.2.3.2. Quadro Kx100M
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMX)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''K5100M'''
| GK104 (28㎚) (294㎟)
| 1536:128:32 (4, 8)
| 771 (기본)
| 512
| 256
| GDDR5
| 900 (3600)
| 8
| 100
|
'''K4100M'''
| 1152:96:32 (3, 6)
| 706 (기본)
| 800 (3200)
| 4
|
'''K3100M'''
| 768:64:32 (2, 4)
| 75
|
'''K2100M'''
| GK106 (28㎚) (221㎟)
| 576:48:16 (2, 3)
| 667 (기본)
| 256
| 128
| 752 (3016)
| 2
| 55
|
'''K1100M'''
| GK107 (28㎚) (118㎟)
| 384:32:16 (1, 2)
| 706 (기본)
| 700 (2800)
| 45
|
'''K610M'''
| GK208 (28㎚) (87㎟)
| 192:16:8 (1, 1)
| 980 (기본)
| 128
| 64
| 650 (2600)
| 1
| 30
|
'''K510M'''
| 846 (기본)
| 600 (2400)
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== Maxwell 마이크로아키텍처 ========= Quadro Kx200M =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''K2200M'''
| GM107 (28㎚) (148㎟)
| 640:40:16 (1, 5)
| 667 (기본)
| 2
| 128
| GDDR5
| 1253 (5012)
| 2
| 65
|
'''K620M'''
| GM108 (28㎚) (81㎟)
| 384:24:8 (1, 3)
| 1029 (기본)
| 1
| 64
| DDR3
| 900 (1800)
| 30
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.2.3.3. Quadro Mx000M
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''M5000M'''
| GM204 (28㎚) (398㎟)
| 1536:96:64 (3, 12)
| 975 (기본)
| 2
| 256
| GDDR5
| 1253 (5012)
| 8
| 100
|
'''M4000M'''
| 1280:80:64 (3, 10)
| 4
|
'''M3000M'''
| 1024:64:32 (2, 8)
| 1050 (기본)
| 1
| 128
| 75
|
'''M2000M'''
| GM107 (28㎚) (148㎟)
| 640:40:16 (1, 5)
| 1029 (기본) 1098 (부스트)
| 2
| 55
|
'''M1000M'''
| 512:32:16 (1, 4)
| 993 (기본)
| 2
| 40
|
'''M600M'''
| 384:24:8 (1, 3)
| 1029 (기본) 1124 (부스트)
| 30
|
'''M500M'''
| GM108 (28㎚) (81㎟)
| 1
| 64
| DDR3
| 900 (1800)
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]===== Quadro Mxx00 =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''M5500'''
| GM204 (28㎚) (398㎟)
| 2048:128:64 (4, 16)
| 861 (기본) 1038 (부스트)
| 2
| 256
| GDDR5
| 1753 (7012)
| 8
| 150
|
'''M2200'''
| GM206 (28㎚) (228㎟)
| 1024:64:32 (2, 8)
| 1025 (기본)
| 1
| 128
| 1375 (5500)
| 4
| 55
|
'''M1200'''
| GM107 (28㎚) (148㎟)
| 640:40:16 (1, 5)
| 1093 (기본)
| 2
| 128
| 1253 (5012)
| 45
|
'''M620'''
| 512:32:16 (1, 4)
| 756 (기본) 977 (부스트)
| 2
| 30
|
'''M520'''
| GM108 (28㎚) (81㎟)
| 384:24:8 (1, 3)
| 1041 (기본)
| 1
| 64
| 25
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.2.4. Pascal 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''P5200'''
| GP104 (16㎚) (314㎟)
| 2560:160:64 (4, 20)
| 1556 (기본) 1746 (부스트)
| 2
| 256
| GDDR5
| 1800 (7200)
| 16
| 100
|
'''P5000'''
| 2048:128:64 (4, 16)
| 1278 (기본) 1582 (부스트)
| 1502 (6008)
|
'''P4200'''
| 2304:144:64 (4, 18)
| 1227 (기본) 1647 (부스트)
| 8
|
'''P4000'''
| 1792:112:64 (3, 14)
| 1227 (기본)
|
'''P3200'''
| 1328 (기본) 1476 (부스트)
| 1.5
| 192
| 1753 (7012)
| 6
| 75
|
'''P3000'''
| 1280:80:48 (2, 10)
| 1088 (기본) 1215 (부스트)
|
'''P2000'''
| GP107 (16㎚) (132㎟)
| 768:48:32 (1, 6)
| 1557 (기본) 1607 (부스트)
| 1
| 128
| 1502 (6008)
| 4
| 50
|
'''P1000'''
| 512:32:16 (1, 4)
| 1303 (기본) 1493 (부스트)
| 40
|
'''P600'''
| 384:24:16 (1, 3)
| 1430 (기본) 1557 (부스트)
| 1253 (5012)
| 25
|
'''P500'''
| GP108 (16㎚) (74㎟)
| 256:16:16 (1, 2)
| 1228 (기본) 1455 (부스트)
| 0.5
| 64
| 2
| 18
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]===== Quadro Pxx00 Max-Q =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''P5200 Max-Q'''
| GP104 (16㎚) (314㎟)
| 2560:160:64 (4, 20)
| 1316 (기본) 1569 (부스트)
| 2
| 256
| GDDR5
| 1804 (7216)
| 16
| 100
|
'''P4000 Max-Q'''
| 1792:112:64 (4, 14)
| 1114 (기본) 1228 (부스트)
| 1502 (6008)
| 8
|
'''P3200 Max-Q'''
| 1139 (기본) 1404 (부스트)
| 1.5
| 192
| 1753 (7012)
| 6
| 75
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
2.2.5. Turing 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TS:TMU:RT:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''RTX 5000'''
| TU104 (12㎚) (545㎟)
| 3072:384:192:48:64 (6, 48)
| (기본)
(부스트)
| 4
| 256
| GDDR6
| 1750 (14000)
| 16
| 110
|
|
'''RTX 4000'''
| 2560:320:160:40:64 (5, 40)
| 1110 (기본) 1560 (부스트)
| 8
|
|
'''RTX 3000'''
| TU106 (12㎚) (445㎟)
| 2304:288:144:36:48 (5, 36)
| 945 (기본) 1380 (부스트)
| 6
| 60~80
|
|
'''RTX T2000'''
| TU117 (12㎚) (200㎟)
| 1024:0:64:0:32 (2, 0)
| 1575 (기본) 1785 (부스트)
| 1
| 128
| GDDR5
| 2000 (8000)
| 4
| 60
|
|
'''RTX T1000'''
| 896:0:56:0:32 (2, 0)
| 1395 (기본) 1455 (부스트)
| 40~50
|
|
<-11><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]===== Quadro RTX Max-Q =====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TS:TMU:RT:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''RTX 5000 Max-Q'''
| TU104 (12㎚) (545㎟)
| 3072:384:192:48:64 (6, 48)
| 600 (기본) 1350 (부스트)
| 4
| 256
| GDDR6
| 1750 (14000)
| 16
| 80
|
|
'''RTX 4000 Max-Q'''
| 2560:320:160:40:64 (5, 40)
| 1005 (기본) 1200 (부스트)
| 1625 (13000)
| 8
|
|
'''RTX 3000 Max-Q'''
| TU106 (12㎚) (445㎟)
| 2304:288:144:36:48 (5, 36)
| 600 (기본) 1215 (부스트)
| 6
| 60
|
|
'''RTX T2000 Max-Q'''
| TU117 (12㎚) (200㎟)
| 1024:0:64:0:32 (2, 0)
| (기본)
(부스트)
| 1
| 128
| GDDR5
| 2000 (8000)
| 4
| 40
|
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
3. NVS 제품군
2003년부터 등장한 비즈니스 멀티 모니터 출력용 제품군으로, 본래 쿼드로에서 파생된 녀석이라 2009년까지는 제품명이 NVS 앞에 쿼드로가 붙여 있었다가 2010년 이후에 출시된 제품부터 쿼드로를 뺀 것이 현재의 모습이다. 멀티 모니터용으로써는 과거엔 매트록스가 꽉 잡고 있었기 때문에 지포스에서는 좀처럼 볼 수 없는 하위 GPU를 2개 붙인 형태의 제품을 통해 멀티 모니터 지원을 꽤 하기도 했지만 현재까지도 인지도는 낮은 편. 2015년 11월에 발매한 맥스웰 아키텍처 기반의 NVS 810이 최신 NVS 제품으로 이 제품이 나와서야 멀티 모니터 출력용 그래픽 카드에 걸맞는 스펙을 갖추었다. 최대 8개의 디스플레이 출력을 지원하는데 80만원을 호가할 만큼 만만한 제품이 아니다. 이보다 하위 제품은 최대 4개로 4개의 출력은 지포스 제품군에서도 흔하게 볼 수 있어서 4개 이하의 모니터 출력만큼은 효용성이 많이 줄어든 상태. 가격 대비 더 많은 모니터 출력 지원이라면 NVIDIA보단 차라리 AMD 라데온을 알아보는게 더 나을 정도.
쿼드로와 마찬가지로 NVS도 랩톱용 제품군이 존재한다. 그런데 저렴한 중고 워크스테이션 랩톱을 구한답시고 알아본 그래픽의 스펙이 NVS가 붙은 경우가 제법 많이 보이는데 광고 카탈로그에도 NVS 계열 모델에 대한 제원이 자세하지 않은 경우가 많아서 뭔가 좋아보이는 네이밍으로 착각해 낭패볼 수 있으니 주의할 것. NVS는 지금까지 NVS 510M(G71 칩셋 즉 지포스 Go 7900 GTX)을 제외하면 메인스트림 이상의 체급인 칩셋이 사용된 적이 별로 없고 로우엔드 칩셋이 주로 사용되는 멀티 모니터 출력용인 모델이다. 그래픽 정밀 렌더링용 중고 워크스테이션 랩톱을 알아보고 있는데 뭐가 뭔지 잘 모르겠다면 너무 저렴해 보이는 워크스테이션 랩톱은 일단 거르는 것이 좋은데 쿼드로가 아닌 NVS가 탑재된 제품일 확률이 높다.
NVS에 대한 정보는
해당 공식 홈페이지에서도 확인할 수 있다.[2] 직접 4200M을 사용해본 결과, 게임은 마인크래프트 하옵이 일부 경우 40을 넘지 못하지만, 경우에 따라 1440P 유튜브 영상은 네트워크가 좋다는 전제 하에 '''재생 가능.''' avi 같은 파일로 1440P 영상은 당연하게 재생이 가능하다. 전체적 시스템은 i5-2520M+8GB 랩톱용 DDR3 메모리 싱글채널+HM65 칩셋+Windows 7+SanDisk 256G SSD이며 유튜브는 버전 54 베타 채널이다.
[3] 모바일용으로는 페르미 기반(GF108, GF117) 칩셋 모델까지만 나왔다.
3.1. NVS 데스크톱용 제품군
3.1.1. NV10(Celsius) 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PP:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro 4 100 NVS'''
| NV17 (150㎚) (65㎟)
| 2:4:2
| 250
| 128
| DDR
| 166 (332)
| 64
| ?
| ?
|
'''Quadro 4 200 NVS'''
| 250 (500)
| ?
| ?
|
'''Quadro 4 400 NVS PCI'''
| 220
| 166 (332)
| ?
| ?
|
'''Quadro NVS 280 PCI'''
| NV18 (150㎚) (65㎟)
| 275
| 250 (500)
| ?
| ?
|
'''Quadro NVS 280 SD'''
| 250
| 64
| 200 (400)
| ?
| ?
|
'''Quadro NVS 55 PCI'''
| ?
| ?
|
'''Quadro NVS 50 PCI'''
| ?
| ?
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== NV30(Rankine) 마이크로아키텍처 ====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 280 AGP'''
| NV34 (150㎚) (91㎟)
| 4:1:4:4
| 275
| 128
| DDR
| 250 (500)
| 64
| ?
| ?
|
'''Quadro NVS 280 PCIe'''
| NV37 (150㎚) (91㎟)
| 13
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
3.1.2. NV40(Curie) 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 440'''
| NV43 (110㎚) (150㎟)
| 8:4:8:8 x2
| 275
| 128 x2
| DDR
| 250 (500)
| 128 x2
| 31
| ?
|
'''Quadro NVS 285'''
| NV44 (150㎚) (91㎟)
| 4:3:4:2
| 128
| 128
| 18
| ?
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== G80(Tesla) 마이크로아키텍처 ====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 290'''
| G86 (80㎚) (127㎟)
| 16:8:4 (1, 2)
| 459 (코어) 918 (셰이더)
| 64
| DDR2
| 400 (800)
| 256
| 21
| 149
|
'''Quadro NVS 295'''
| G98 (65㎚) (86㎟)
| 8:8:4 (1, 1)
| 540 (코어) 1300 (셰이더)
| GDDR3
| 695 (1390)
| 23
| ?
|
'''Quadro NVS 420'''
| 8:8:4 x2 (1 x2, 1 x2)
| 550 (코어) 1400 (셰이더)
| 64 x2
| 700 (1400)
| 256 x2
| 40
| ?
|
'''Quadro NVS 450'''
| 480 (코어) 1200 (셰이더)
| 35
| ?
|
'''NVS 300'''
| GT218 (40㎚) (57㎟)
| 16:8:4 (1, 2)
| 520 (코어) 1230 (셰이더)
| 64
| 790 (1380)
| 512
| 18
| 109
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
3.1.3. Fermi 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''NVS 310'''
| GF119 (40㎚) (79㎟)
| 48:8:4 (1, 1)
| 523 (코어) 1046 (셰이더)
| 128
| 64
| DDR3
| 875 (1750)
| 0.5
| 20
| 159
|
'''NVS 315'''
| 1
| 19
|
<-11><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== Kepler 마이크로아키텍처 ====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMX)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
'''NVS 510'''
| GK107 (28㎚) (118㎟)
| 192:16:16 (1, 1)
| 797 (기본)
| 256
| 128
| DDR3
| 891 (1782)
| 2
| 35
| 449
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
3.1.4. Maxwell 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
'''NVS 810'''
| GM107 (28㎚) (148㎟)
| 512:32:16 x2 (1 x2, 4 x2)
| 902 (기본) 1033 (부스트)
| 0.5 x2
| 64 x2
| DDR3
| 900 (1800)
| 2 x2
| 68
| ?
|
<-11><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]=== NVS 모바일용 제품군 ======= NV40(Curie) 마이크로아키텍처 ====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| PS:VS:TMU:ROP
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 510M'''
| G71 (90㎚) (196㎟)
| 24:8:24:16
| 450
| 128
| GDDR3
| 600 (1200)
| 256
| 35
|
'''Quadro NVS 300M'''
| G73 (90㎚) (125㎟)
| 4:3:4:2
| 500
| 700 (1400)
| 16
|
'''Quadro NVS 120M'''
| G72 (90㎚) (81㎟)
| 450
| 64
| DDR2
| 512
| 10
|
'''Quadro NVS 110M'''
| 300
| DDR
| 300 (600)
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
3.1.5. G80(Tesla) 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 320M'''
| G84 (80㎚) (169㎟)
| 32:16:8 (1, 2)
| 575 (코어) 1150 (셰이더)
| 128
| GDDR3
| 700 (1400)
| 512
| 20
|
'''Quadro NVS 160M'''
| G98 (65㎚) (86㎟)
| 8:8:4 (1, 1)
| 580 (코어) 1450 (셰이더)
| 64
| 256
| 12
|
'''Quadro NVS 150M'''
| 530 (코어) 1300 (셰이더)
| 10
|
'''Quadro NVS 140M'''
| G86 (80㎚) (127㎟)
| 16:8:4 (1, 2)
| 400 (코어) 800 (셰이더)
| 64
| DDR2
| 600 (1200)
| 512
| 12
|
'''Quadro NVS 135M'''
| 594 (1188)
| 256
| 10
|
'''Quadro NVS 130M'''
| 8:4:4 (1, 1)
| DDR
| 700 (1400)
|
'''NVS 5100M'''
| GT216 (40㎚) (100㎟)
| 48:16:8 (2, 6)
| 550 (코어) 1210 (셰이더)
| 128
| GDDR3
| 800 (1600)
| 1024
| 35
|
'''NVS 3100M'''
| GT218 (40㎚) (57㎟)
| 16:8:4 (1, 2)
| 606 (코어) 1468 (셰이더)
| 64
| 790 (1580)
| 512
| 14
|
'''NVS 2100M'''
| 535 (코어) 1230 (셰이더)
| 11
|
<-9><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== Fermi 마이크로아키텍처 ====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''NVS 5400M'''
| GF108 (40㎚) (116㎟)
| 96:16:4 (1, 2)
| 660 (코어) 1320 (셰이더)
| 256
| 128
| DDR3
| 900 (1800)
| 2 [4] 다만 제조사에 따라 1기가만 장착하는 경우도 있다.
| 35
|
'''NVS 5200M'''
| 672 (코어) 1344 (셰이더)
| 128
| 64
| GDDR5
| 785 (3140)
| 1
| 25
|
GF117 (28㎚) (116㎟)
| DDR3
| 900 (1800)
|
'''NVS 4200M'''
| GF119 (40㎚) (79㎟)
| 48:8:4 (1, 1)
| 810 (코어) 1620 (셰이더)
| 800 (1600)
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
4. 데이터 센터 GPU 제품군 (구 Tesla)
2020년 5월까지 사용되던 상표는 '''Tesla'''
2007년 5월부터 내놓은 상표로, GPU가 게임용 연산에만 사용되는 것이 아닌 범용 연산(GPGPU)용으로 확대되면서 고성능 연산 작업을 목적으로 하는 곳을 공략하기 위한 제품군이다. Tesla도 알맹이는 지포스와 같지만 대체로 디스플레이 출력 단자가 없는데다 연산에 주로 사용되기 때문에 GPU 내부에 있는 텍스처 유닛과 ROP이 쓸 일은 없다. 게임 그래픽과는 거리가 먼 분야에 사용되기 때문. 물론 페르미 아키텍처 기반의 일부 제품 한정으로 DVI 단자 1개가 탑재되기도 했지만 케플러 아키텍처부터는 디스플레이 단자가 다시 빠지면서 지금까지 이어져오고 있다. 명색이 전문가를 넘어선 데이터 센터를 주로 공략하는 시장인만큼 가격도 매우 비싼 편인데 지포스와 같은 GPU라 훨씬 저렴한 지포스로 연산 작업을 하면 되지 않겠냐고 반문할 수도 있지만, 쿼드로와 마찬가지로 Tesla용 드라이버가 따로 있고 단일 GPU인 제품은 주로 하위 라인에나 해당되는 제품이지 최상위로 올라가면 GPU가 2개는 물론이고 4개를 한 기판에 탑재된 쿼드 GPU 타입 제품도 있다. GPU를 복수로 붙이면서 전력 소모량, 발열, 부피를 감안해서라도 당대 최고의 고성능 연산을 구현하는 것을 추구하는 방향이기 때문이다. 테슬라는 탑재 대상 컴퓨터들이 최소 워크스테이션에서 최대로는 슈퍼 컴퓨터와 데이터 센터급이며 소비 전력이 엄청 나기 때문에 모바일 제품군이 없다.
2020년 5월에 브랜드가 폐지되었는데.
모 자동차 회사와의 혼동 때문이라는게 공식적인 설명이다. 엔비디아 역시 자율주행 자동차 사업에 진출해 있고 여기에 사용되는 연산용 GPGPU의 명칭이 가장 큰 경쟁사의 명칭과 겹친다는게 좀 아니라고 생각했는듯. 이후 출시된 RTX A100부터는 '''데이터 센터 GPU'''라는 명칭으로 불리고 있다.( )
4.1. G80(Tesla) 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (TPC, SM)
| 클럭 (MHz)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (MB)
|
<colbgcolor=black><colcolor=#76b900> '''S870'''
| G80 (90㎚) (484㎟)
| 128:32:24 x4 (8 x4, 16 x4)
| 600 (코어) 1350 (셰이더)
| 384 x4
| GDDR3
| 800 (1600)
| 1536 x4
| 800
| 11999
|
'''D870'''
| 128:32:24 x2 (8 x2, 16 x2)
| 384 x2
| 1536 x2
| 520
| 7499
|
'''C870'''
| 128:32:24 (8, 16)
| 384
| 1536
| 171
| 1499
|
'''S1075'''
| G200B (55㎚) (470㎟)
| 240:80:32 x4 (10 x4, 30 x4)
| 610 (코어) 1296 (셰이더)
| 512 x4
| 4096 x4
| 800
| ?
|
'''S1070'''
| 7999
|
'''C1060'''
| 240:80:32 (10, 30)
| 512
| 4096
| 188
| ?
|
'''M1060'''
| 2048
| 1699
|
'''T10'''
| 4096
| ?
|
<-10><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
G200B 칩셋 한정 → (단정밀도 연산 속도) ÷ 8 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]=== Fermi 마이크로아키텍처 ===
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''S2050'''
| GF100 (40㎚) (529㎟)
| 448:56:48 x4 (4 x4, 14 x4)
| 574 (코어) 1147 (셰이더)
| 768 x4
| 384 x4
| GDDR5
| 773 (3092)
| 3 x4
| 900
| 11999
|
'''M2050'''
| 448:56:48 (4, 14)
| 575 (코어) 1150 (셰이더)
| 768
| 384
| 3
| 225
| 2699
|
'''M2070'''
| 574 (코어) 1150 (셰이더)
| 783 (3132)
| 6
| 225
| 3099
|
'''M2070-Q'''
| 5489
|
'''C2050'''
| 575 (코어) 1150 (셰이더)
| 750 (3000)
| 3
| 238
| ?
|
'''C2070'''
| 6
| ?
|
'''X2090'''
| GF110 (40㎚) (520㎟)
| 512:64:48 (4, 16)
| 650 (코어) 1300 (셰이더)
| 925 (3700)
| 225
| ?
|
'''X2070'''
| ?
|
'''M2090'''
| 250
| ?
|
'''C2090'''
| ?
|
'''M2075'''
| 448:56:48 (4, 14)
| 574 (코어) 1147 (셰이더)
| 783 (3132)
| 225
| 2399
|
'''C2075'''
| 575 (코어) 1150 (셰이더)
| 750 (3000)
| 247
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
4.2. Kepler 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| 최대 연산 성능
| TDP
| 지원 API
|
<rowcolor=white> 칩셋명
| CUDA 코어
| 클럭
| 버스
| 규격
| 클럭
| 용량
| 단정밀도 (FP32) (GFLOPS)
| 배정밀도 (FP64) (GFLOPS)
|
<colbgcolor=black><colcolor=#76b900>'''K10'''
| 2×GK104
| 2×1536
| 745MHz
| 2×256bit
| GDDR5
| 2500MHz (5000MT/s)
| 2×4GB
| 4577
| 190.7
| 225W
| CUDA 3.0
|
'''K20'''
| GK110
| 2496
| 706MHz
| 320bit
| 2600MHz (5200MT/s)
| 5GB
| 3524
| 1175
| CUDA 3.5
|
'''K20X'''
| GK110
| 2688
| 732MHz
| 384bit
| 2600MHz (5200MT/s)
| 6GB
| 3935
| 1312
| 235W
|
'''K40'''
| GK110B
| 2880
| 745MHz (기본) 875MHz (부스트)
| 384bit
| 2500MHz (5000MT/s)
| 12GB
| 5040
| 1680
|
'''K80'''
| 2×GK210
| 2×2496
| 560MHz (기본) 875MHz (부스트)
| 2×384bit
| 2750MHz (5500MT/s)
| 2×12GB
| 8736
| 2912
| 300W
| CUDA 3.7
|
4.3. Maxwell 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| 단정밀도(FP32) 최대 연산 성능 (GFLOPS)
| TDP
| 지원 API
|
<rowcolor=white> 칩셋명
| CUDA 코어
| 클럭
| 버스
| 규격
| 클럭
| 용량
|
<colbgcolor=black><colcolor=#76b900>'''M4'''
| GM206
| 1024
| 872MHz (기본) 1072MHz (부스트)
| 128bit
| GDDR5
| 2750MHz (5500MT/s)
| 4GB
| 2195
| 50~75W
| CUDA 5.2
|
'''M6'''
| GM204
| 1536
| 722MHz (기본) 1051MHz (부스트)
| 256bit
| 2300MHz (4600MT/s)
| 8GB
| 3229
| 75~100W
|
'''M10'''
| 4×GM107
| 4×512
| 1033MHz
| 4×128bit
| 2099MHz (5188MT/s)
| 4×8GB
| 5289
| 225W
|
'''M40'''
| GM200
| 3072
| 948MHz (기본) 1114MHz (부스트)
| 384bit
| 3000MHz (6000MT/s)
| 12GB
| 6844
| 250W
|
'''M60'''
| 2×GM204
| 2×2048
| 899MHz (기본) 1178MHz (부스트)
| 2×256bit
| 2500MHz (5000MT/s)
| 2×8GB
| 9650
| 225~300W
|
4.4. Pascal 마이크로아키텍처
P100은 GP100 컷칩이면서 HBM2 규격을 채택한 모델로 FP64 연산이 5.3 TFLOPS다. P40과 P4는 각각 GP102 풀칩과 GP104 풀칩을 기반으로 개발된 모델이다.
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| 최대 연산 성능
| TDP
| 지원 API
|
<rowcolor=white> 칩셋명
| CUDA 코어
| 클럭
| 버스
| 규격
| 클럭
| 용량
| 바이트 정수형 (INT8) (TOPS)
| 반정밀도 (FP16) (GFLOPS)
| 단정밀도 (FP32) (GFLOPS)
| 배정밀도 (FP64) (GFLOPS)
|
<colbgcolor=black><colcolor=#76b900>'''P4'''
| GP104
| 2560
| 810MHz (기본) 1063MHz (부스트)
| 256bit
| GDDR5
| 1500MHz (6000MT/s)
| 8GB
| 22
| 42.5
| 5443
| 170.1
| 50~75W
| CUDA 6.1
|
'''P40'''
| GP102
| 3840
| 1303MHz (기본) 1531MHz (부스트)
| 384bit
| 1800MHz (7200MT/s)
| 24GB
| 47
| 91.9
| 11758
| 367.4
| 250W
|
'''P100 (PCIe)'''
| GP100
| 3584
| 1126MHz (기본) 1303MHz (부스트)
| 3072bit
| HBM2
| 703MHz (1406MT/s)
| 12GB
| -
| 18680
| 9340
| 4670
| 250W
| CUDA 6.0
|
4096bit
| 16GB
| CUDA 6.0
|
'''P100 (NVLink)'''
| 1380MHz (기본) 1480MHz (부스트)
| 21218
| 10609
| 5340
| 300W
| CUDA 6.0
|
4.5. Volta 마이크로아키텍처
일부 잘못된 내용이 있을 수 있으니 주의할 것.
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| 최대 연산 성능
| TDP
| 지원 API
|
<rowcolor=white> 칩셋명
| CUDA 코어
| 클럭
| 버스
| 규격
| 클럭
| 용량
| 단정밀도 (FP32) (TFLOPS)
| 배정밀도 (FP64) (TFLOPS)
|
<colbgcolor=black><colcolor=#76b900>'''V100 (PCIe)'''
| GV100
| 5120
| 1245MHz (기본) 1380MHz (부스트)
| 4096bit
| HBM2
| 877MHz (1754MT/s)
| 16GB
| 14
| 7
| 250W
| ?
|
'''V100 (NVlink)'''
| ?MHz (기본) 1533MHz (부스트)
| 32GB
| 15.7
| 7.8
| 300W
| ?
|
'''V100S (PCIe)'''
| ?MHz (기본) 1600MHz (부스트)
| 1107MHz (2214MT/s)
| 32GB
| 16.4
| 8.2
| 300W
| ?
|
4.6. Turing 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| 최대 연산 성능
| TDP
| 지원 API
|
<rowcolor=white> 칩셋명
| CUDA 코어
| 클럭
| 버스
| 규격
| 클럭
| 용량
| 4비트 정수형 (INT4) (TOPS)
| 바이트 정수형 (INT8) (TOPS)
| 반정밀도 (FP16) (TFLOPS)
| 단정밀도 (FP32) (TFLOPS)
|
'''T4'''
| TU104
| 2560
| 585 MHz (기본) 1590 MHz (부스트)
| 256 bit
| GDDR6
| 1250 MHz (10000 MT/s)
| 16GB
| 260.504
| 130.252
| 65.126
| 8.141
| 70 W
| ?
|
5. GRID 제품군
5.1. Kepler 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMX)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''K1'''
| GK107 (28㎚) (118㎟)
| 192:16:16 x4 (1 x4, 1 x4)
| 850 (기본)
| 256 x4
| 128 x4
| DDR3
| 891 (1782)
| 4 x4
| 130
| 4140
|
'''K180Q'''
| 192:16:16 (1, 1)
| 256
| 128
| 1
| 125
|
'''K160Q'''
|
'''K140Q'''
|
'''K120Q'''
| 0.5
|
'''K100'''
| 0.25
| 63
|
<-11><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== GRID K2 ====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMX)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''K2'''
| GK104 (28㎚) (294㎟)
| 1536:128:32 x2 (4 x2, 8 x2)
| 745 (기본)
| 512 x2
| 256 x2
| GDDR5
| 1250 (5000)
| 4 x2
| 225
| 5199
|
'''K280Q'''
| 1536:128:32 (4, 8)
| 512
| 256
| 4
| 1875
|
'''K260Q'''
| 2
| 937
|
'''K240Q'''
| 1
| 469
|
'''K220Q'''
| 0.5
|
'''K200'''
| 0.25
| 235
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMX)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
'''K340'''
| GK107 (28㎚) (118㎟)
| 384:32:8 x4 (1 x4, 2 x4)
| 950 (기본)
| 128 x4
| 64 x4
| GDDR5
| 900 (3600)
| 1 x4
| 225
| 3299
|
<-11><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]==== GRID K5 ====
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMX)
| 클럭 (MHz)
| L2 캐시 (KB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''K560Q'''
| GK104 (28㎚) (294㎟)
| 1536:128:32 x2 (4 x2, 8 x2)
| 745 (기본)
| 512 x2
| 256 x2
| GDDR5
| 1250 (5000)
| 4 x2
| 225
| 3599
|
'''K540Q'''
|
'''K520Q'''
|
'''K520'''
|
'''K500'''
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
5.2. Maxwell 마이크로아키텍처
<rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SMM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''M60-8Q'''
| GM204 (28㎚) (398㎟)
| 2048:128:64 (4, 16)
| 930 (기본) 1180 (부스트)
| 2
| 256
| GDDR5
| 1253 (5012)
| 8
| 225
| 3599
|
'''M60-4A'''
| 4
| ?
|
'''M60-2Q'''
| 2
| ?
|
'''M60-1Q'''
| 1
| ?
|
'''M6-8Q'''
| 1536:96:64 (3, 12)
| 722 (기본)
| 8
| 100
| ?
|
'''M10-8Q'''
| GM107 (28㎚) (148㎟)
| 640:40:16 (1, 5)
| 1033 (기본) 1306 (부스트)
| 128
| 1300 (5200)
| 225
| ?
|
'''M3-3020'''
| 2
| ?
| ?
|
'''M40'''
| 384:32:16 (1, 3)
| 930 (기본) 1000 (부스트)
| 1350 (5400)
| 4
| 50
| ?
|
<-11><bgcolor=#76b900>
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]== Mining 제품군 ==이름에서 보듯 채굴기이다. 그래서 모니터 연결용 단자가 없다. === Pascal 마이크로아키텍처 ===
| <rowcolor=white> 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 칩셋명 (공정) (면적)
| CUDA:TMU:ROP (GPC, SM)
| 클럭 (MHz)
| L2 캐시 (MB)
| 버스 (bit)
| 규격
| 클럭 (전송률) (MHz) (Mbps)
| 용량 (GB)
|
<colbgcolor=black><colcolor=#76b900> '''P102-101'''
| GP102 (16㎚) (471㎟)
| 3200:200:80 (5, 25)
| 1557 (기본) 1670 (부스트)
| 2.5
| 320
| GDDR5
| 2002 (8008)
| 10
| 250
| ?
|
'''P102-100'''
| 1481 (기본) 1582 (부스트)
| GDDR5X
| 1251 (10008)
| 5
| ?
|
'''P104-101'''
| GP104 (16㎚) (314㎟)
| 2560:160:64 (4, 20)
| 1607 (기본) 1733 (부스트)
| 2
| 256
| 8
| ?
| ?
|
'''P104-100'''
| 1920:120:64 (3, 15)
| 4
| ?
| ?
|
'''P106-100'''
| GP106 (16㎚) (200㎟)
| 1280:80:48 (2, 10)
| 1506 (기본) 1709 (부스트)
| 1.5
| 192
| GDDR5
| 2002 (8008)
| 6
| 120
| ?
|
'''P106-090'''
| 768:48:48 (2, 6)
| 1354 (기본) 1531 (부스트)
| 3
| 75
| ?
|
- 【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}
|
}}}
6. 관련 문서