NVIDIA/워크스테이션 GPU

 



1. 개요
2. Quadro 제품군
2.1. Quadro 데스크톱용 제품군
2.1.1. NV10(Celsius) 마이크로아키텍처
2.1.1.1. Quadro
2.1.1.2. Quadro 2
2.1.1.3. Quadro 4 XGL
2.1.2. NV20(Kelvin) 마이크로아키텍처
2.1.2.1. Quadro DCC
2.1.2.2. Quadro 4 XGL
2.1.3. NV30(Rankine) 마이크로아키텍처
2.1.3.1. Quadro FX (x000)
2.1.3.2. Quadro FX (x100)
2.1.3.3. Quadro FX (x300)
2.1.4. NV40(Curie) 마이크로아키텍처
2.1.4.1. Quadro FX (x000)
2.1.4.2. Quadro FX (x400)
2.1.4.3. Quadro FX (x500)
2.1.5. G80(Tesla) 마이크로아키텍처
2.1.5.1. Quadro FX (x600)
2.1.5.2. Quadro FX (x700)
2.1.5.3. Quadro FX (x800)
2.1.5.4. Quadro CX
2.1.5.5. Quadro VX
2.1.6. Fermi 마이크로아키텍처
2.1.6.1. Quadro (x000)
2.1.7. Kepler 마이크로아키텍처
2.1.7.1. Quadro K
2.1.8. Maxwell 마이크로아키텍처
2.1.8.1. Quadro M
2.1.9. Pascal 마이크로아키텍처
2.1.9.1. Quadro P
2.1.10. Volta 마이크로아키텍처
2.1.10.1. Quadro V
2.1.11. Turing 마이크로아키텍처
2.1.11.1. Quadro RTX
2.1.12. Ampere 마이크로아키텍쳐
2.1.12.1. Quadro RTX A6000
2.2. Quadro 모바일용 제품군
2.2.1. NV10(Celsius) 마이크로아키텍처
2.2.1.1. Quadro 4 Go
2.2.2. NV20(Kelvin) 마이크로아키텍처
2.2.2.1. Quadro 4 Go
2.2.3. NV30(Rankine) 마이크로아키텍처
2.2.3.1. Quadro FX Go
2.2.4. NV40(Curie) 마이크로아키텍처
2.2.4.1. Quadro FX Go
2.2.4.2. Quadro FX (x500M)
2.2.5. G80(Tesla) 마이크로아키텍처
2.2.5.1. Quadro FX (x600M)
2.2.5.2. Quadro FX (x700M)
2.2.5.3. Quadro FX (x800M)
2.2.6. Fermi 마이크로아키텍처
2.2.6.1. Quadro (x000M)
2.2.7. Kepler 마이크로아키텍처
2.2.7.1. Quadro Kx000M
2.2.7.2. Quadro Kx100M
2.2.8. Maxwell 마이크로아키텍처
2.2.8.1. Quadro Kx200M
2.2.8.2. Quadro Mx000M
2.2.8.3. Quadro Mxx00
2.2.9. Pascal 마이크로아키텍처
2.2.9.1. Quadro Pxx00
2.2.9.2. Quadro Pxx00 Max-Q
2.2.10. Turing 마이크로아키텍처
2.2.10.1. Quadro RTX
2.2.10.2. Quadro RTX Max-Q
3. NVS 제품군
3.1. NVS 데스크톱용 제품군
3.1.1. NV10(Celsius) 마이크로아키텍처
3.1.2. NV30(Rankine) 마이크로아키텍처
3.1.3. NV40(Curie) 마이크로아키텍처
3.1.4. G80(Tesla) 마이크로아키텍처
3.1.5. Fermi 마이크로아키텍처
3.1.6. Kepler 마이크로아키텍처
3.1.7. Maxwell 마이크로아키텍처
3.2. NVS 모바일용 제품군
3.2.1. NV40(Curie) 마이크로아키텍처
3.2.2. G80(Tesla) 마이크로아키텍처
3.2.3. Fermi 마이크로아키텍처
4. 데이터 센터 GPU 제품군 (구 Tesla)
4.1. G80(Tesla) 마이크로아키텍처
4.2. Fermi 마이크로아키텍처
4.3. Kepler 마이크로아키텍처
4.4. Maxwell 마이크로아키텍처
4.5. Pascal 마이크로아키텍처
4.6. Volta 마이크로아키텍처
4.7. Turing 마이크로아키텍처
5. GRID 제품군
5.1. Kepler 마이크로아키텍처
5.1.1. GRID K1
5.1.2. GRID K2
5.1.3. GRID K3
5.1.4. GRID K5
5.2. Maxwell 마이크로아키텍처
5.2.1. GRID M
6. Mining 제품군
6.1. Pascal 마이크로아키텍처
7. 관련 문서


1. 개요


NVIDIA워크스테이션용 GPU 목록. 용도별로 그래픽 정밀 렌더링용인 Quadro, 비즈니스 멀티 모니터 출력용인 NVS, 고성능 컴퓨팅용인 Tesla, 가상 작업 공간용인 GRID, 암호화폐 채굴용인 Mining 제품군이 있다.

2. Quadro 제품군


1999년 지포스와 비슷한 시기에 탄생했다. 지포스와 다르게 일반 사용자가 아닌 전문가를 대상으로 정밀 렌더링 작업용으로 내놓은 제품이다. 하지만, GPU 칩셋 자체는 지포스와 같다. 같은 칩셋을 쓰고 있음에도 불구하고 단일이 아닌 두 제품군으로 내놓는 것은 하드웨어 자원은 한정되어 있으므로 용도별 드라이버 소프트웨어로 자원 분배를 차등해야 하기 때문이다. 게이밍용인 지포스는 빠른 프레임율을 추구하는 방향으로, 쿼드로는 프레임율이 다소 느려도 정확한 렌더링을 추구하는 방향으로 차등해 놓았다. 전문가용 시장 공략에 대성공한데다가 근본적인 알맹이가 똑같은 게이밍용 지포스보다 전문가용이라는 이유로 훨씬 비싸게 판매해서 더 많은 이득을 보고 있다. 하지만 최근에는 지포스도 렌더링 성능이 세대를 거듭하면서 크게 향상되어 작업용으로 쓰는 사람들이 점점 많아졌다. 그래서 쿼드로의 존재감이 조금씩 퇴색하고 있지만 정밀 렌더링만큼은 쿼드로가 우위에 있기 때문에 그런 용도로써 효용성이 있다. 최근에는 ECC/REG 같은 오류 보정 기능이 있는 서버용 메모리를 탑재해 차등화하기도 한다. 지포스 시리즈는 오류 보정 기능이 없는 일반 메모리를 탑재했다. 이는 AMD의 Radeon Instinct 제품군도 마찬가지로 라데온 시리즈와의 차별화를 두고 있다.
2002년부터는 지포스와 마찬가지로 쿼드로에도 랩톱 제품군이 투입되었지만, 랩톱이라는 작고 얇은 제약된 공간 특성상 데스크톱용보다 사양을 낮췄고, 그런 점에서는 랩톱용 지포스와 비슷하다. 모바일 워크스테이션에 탑재하는 쿼드로는 외장 그래픽으로 내놓은 쿼드로 제품군 대부분을 탑재하고 있다. 하지만 전문가용이라 웬만한 게이밍 랩톱보다 훨씬 비싸다. 이에 관한 자세한 내용은 모바일 워크스테이션 문서 참조.
2020년 10월 암페어 아키텍쳐 기반의 RTX A6000과 A40이 출시되었는데 쿼드로 브랜드가 사라진 채 발표되었다. 이미 사라진 테슬라와 균형을 맞추기 위한 것인지는 확실히 밝혀지지 않았지만, 일단 엔비디아 홈페이지에서는 신형 쿼드로로 소개하고 있다. 다만 제품 명칭에서는 확실하게 사라졌다. 테슬라야 그렇다 쳐도 쿼드로는 지포스와 같이 20년을 이어져 온 브랜드인데 왜 갑자기 사라졌는지가 의문점이다.

2.1. Quadro 데스크톱용 제품군



2.1.1. NV10(Celsius) 마이크로아키텍처



2.1.1.1. Quadro

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PP:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
'''Quadro'''
NV10
(220㎚)
(111㎟)
4:4:4
135
128
SDR
166
32
?
?
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

===== Quadro 2 =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PP:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro 2 Pro'''
NV15
(180㎚)
(90㎟)
4:4:4
200
128
DDR
250
(500)
64
?
?
'''Quadro 2 MXR'''
NV11
(180㎚)
(65㎟)
2:4:4
SDR
183
32
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.1.2. Quadro 4 XGL

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PP:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro 4 550 XGL'''
NV17
(150㎚)
(65㎟)
2:4:4
270
128
DDR
200
(400)
64
?
?
'''Quadro 4 500 XGL'''
250
SDR
166
128
?
?
'''Quadro 4 580 XGL'''
NV18
(150㎚)
(65㎟)
300
DDR
200
(400)
64
?
?
'''Quadro 4 380 XGL'''
275
256
(512)
128
?
?
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== NV20(Kelvin) 마이크로아키텍처 ========= Quadro DCC =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
'''Quadro DCC'''
NV20
(150㎚)
(128㎟)
4:1:4:4
200
128
SDR
230
64
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.1.3. Quadro 4 XGL

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro 4 900 XGL'''
NV25
(150㎚)
(142㎟)
4:2:8:8
300
128
DDR
325
(650)
128
?
?
'''Quadro 4 750 XGL'''
275
225
(450)
?
?
'''Quadro 4 700 XGL'''
64
?
?
'''Quadro 4 980 XGL'''
NV28
(150㎚)
(101㎟)
300
325
(650)
128
?
?
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== NV30(Rankine) 마이크로아키텍처 ========= Quadro FX (x000) =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 1000'''
NV30
(130㎚)
(200㎟)
4:2:8:4
300
128
GDDR2
300
(600)
128
?
?
'''Quadro FX 2000'''
400
400
(800)
?
?
'''Quadro FX 3000'''
NV35
(130㎚)
(207㎟)
4:3:8:8
256
DDR
425
(850)
256
?
?
'''Quadro FX 700'''
4:1:4:4
275
128
275
(550)
128
?
?
'''Quadro FX 600'''
[1]
NV34
(150㎚)
(91㎟)
4:2:4:4
270
240
(480)
?
?
'''Quadro FX 500'''
4:1:4:4
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.1.4. Quadro FX (x100)

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
'''Quadro FX 1100'''
NV36
(130㎚)
(125㎟)
4:3:4:4
425
128
GDDR2
325
(650)
256
?
?
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

[1] PCI 슬롯형 모델.
===== Quadro FX (x300) =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 1300'''
NV38
(130㎚)
(207㎟)
8:3:8:8
350
128
DDR
275
(550)
128
?
?
'''Quadro FX 330'''
NV35
(130㎚)
(207㎟)
4:2:4:2
250
64
GDDR2
200
(400)
64
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.2. NV40(Curie) 마이크로아키텍처



2.1.2.1. Quadro FX (x000)

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 4000'''
NV40
(130㎚)
(287㎟)
12:5:12:8
375
256
GDDR3
500
(1000)
256
?
?
'''Quadro FX 4000 SDI'''
NV41
(130㎚)
(225㎟)
12:5:12:12
425
?
?
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

===== Quadro FX (x400) =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 4400'''
NV40
(AGP)
(130㎚)
(287㎟)
12:5:12:12
375
256
GDDR3
525
(1050)
256
?
?
'''Quadro FX 3450'''
NV41
(PCIe)
(130㎚)
(225㎟)
425
500
(1000)
?
?
'''Quadro FX 3400'''
NV45
(PCIe)
(130㎚)
(287㎟)
350
450
(900)
?
?
'''Quadro FX 1400'''
NV41
(PCIe)
(130㎚)
(225㎟)
12:5:12:8
128
DDR
300
(600)
128
?
?
'''Quadro FX 540'''
NV43
(PCIe)
(110㎚)
(150㎟)
8:4:8:8
300
GDDR3
250
(500)
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.2.2. Quadro FX (x500)

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 4500'''
G70

(110㎚)
(333㎟)
24:8:24:16
430
256
GDDR3
525
(1050)
512
?
?
'''Quadro FX 5500'''
G71

(90㎚)
(196㎟)
650
505
(1010)
1024
?
?
'''Quadro FX 4500 X2'''
24:8:24:16
x2
375
256
x2
605
(1210)
512
x2
?
?
'''Quadro FX 3500'''
20:7:20:16
450
256
660
(1320)
256
?
?
'''Quadro FX 1500'''
325
625
(1250)
?
?
'''Quadro FX 560'''
G73

(90㎚)
(125㎟)
12:5:12:8
350
128
600
(1200)
128
?
?
'''Quadro FX 550'''
NV43
(110㎚)
(150㎟)
8:4:8:8
360
400
(800)
?
?
'''Quadro FX 350'''
G72

(90㎚)
(81㎟)
4:3:4:2
550
64
DDR2
405
(810)
?
?
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== G80(Tesla) 마이크로아키텍처 ========= Quadro FX (x600) =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''FX 5600'''
G80
(90㎚)
(484㎟)
128:32:24
(8, 16)
600
(코어)
1350
(셰이더)
384
GDDR3
800
(1600)
1536
171
2999
'''FX 4600'''
96:24:24
(6, 12)
500
(코어)
1200
(셰이더)
700
(1400)
768
134
1999
<rowcolor=white>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.2.3. Quadro FX (x700)

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''FX 3700'''
G92
(65㎚)
(324㎟)
112:56:16
(7, 14)
500
(코어)
1250
(셰이더)
256
GDDR3
800
(1600)
512
78
1599
'''FX 4700 X2'''
128:64:16
(8 x2, 16 x2)
x2
600
(코어)
1500
(셰이더)
256
x2
1024
x2
226
2999
'''FX 1700'''
G84
(80㎚)
(169㎟)
32:16:8
(2, 4)
460
(코어)
920
(셰이더)
256
DDR2
400
(800)
512
42
699
'''FX 570'''
16:8:8
(1, 2)
128
256
38
199
'''FX 370'''
16:8:4
(1, 2)
360
(코어)
720
(셰이더)
64
500
(1000)
35
129
'''FX 370 LP'''
G98
(65㎚)
(86㎟)
8:8:4
(1, 1)
540
(코어)
1080
(셰이더)
25
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

===== Quadro FX (x800) =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''FX 5800'''
G200B
(55㎚)
(470㎟)
240:80:32
(10, 30)
500
(코어)
1250
(셰이더)
256
GDDR3
800
(1600)
512
78
1599
'''FX 4800'''
192:64:24
(8, 24)
602
(코어)
1204
(셰이더)
384
1536
150
1799
'''FX 3800'''
192:64:16
(8, 24)
256
1024
108
799
'''FX 1800'''
G94
(65㎚)
(240㎟)
64:32:12
(4, 8)
550
(코어)
1375
(셰이더)
192
768
59
489
'''FX 580'''
G96C
(55㎚)
(121㎟)
32:16:8
(2, 4)
450
(코어)
1125
(셰이더)
128
512
40
199
'''FX 380'''
G96
(65㎚)
(144㎟)
16:8:8
(1, 2)
450
(코어)
1100
(셰이더)
700
(1400)
256
34
129
'''FX 380 LP'''
GT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
650
(코어)
1375
(셰이더)
64
800
(1600)
512
28
169
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.2.4. Quadro CX

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
'''CX'''
G200B
(55㎚)
(470㎟)
192:64:24
(8, 24)
602
(코어)
1204
(셰이더)
384
GDDR3
800
(1600)
1536
150
1999
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

===== Quadro VX =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
'''VX 200'''
G92
(65㎚)
(324㎟)
112:56:16
(7, 14)
450
(코어)
1125
(셰이더)
256
GDDR3
800
(1600)
512
75
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.3. Fermi 마이크로아키텍처



2.1.3.1. Quadro (x000)

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''7000'''
GF110
(40㎚)
(520㎟)
512:64:48
(4, 16)
651
(코어)
1301
(셰이더)
768
384
GDDR5
924
(3696)
6
204
14499
'''6000'''
GF100
(40㎚)
(529㎟)
448:56:48
(4, 14)
574
(코어)
1147
(셰이더)
747
(2988)
4399
'''5000'''
352:44:40
(3, 11)
513
(코어)
1026
(셰이더)
640
320
750
(3000)
2.5
152
2499
'''4000'''
256:32:32
(2, 8)
475
(코어)
950
(셰이더)
512
256
702
(2808)
2
142
1199
'''2000'''
GF106
(40㎚)
(238㎟)
192:32:16
(1, 4)
625
(코어)
1250
(셰이더)
256
128
650
(2600)
1
62
599
'''600'''
GF108
(40㎚)
(116㎟)
96:16:8
(1, 2)
640
(코어)
1280
(셰이더)
DDR3
800
(1600)
40
179
'''400'''
GT216
(40㎚)
(100㎟)
48:16:8
(2, 6)
450
(코어)
1125
(셰이더)
-
64
770
(1540)
0.5
32
169
<-11><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GF100, GF110 칩셋 한정 → (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
GF106, GF108 칩셋 한정 → (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== Kepler 마이크로아키텍처 ========= Quadro K =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX/SMM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900>'''K6000'''
GK110
(28㎚)
(561㎟)
2880:240:48
(5, 15)
797
(기본)
902
(부스트)
1536
384
GDDR5
1502
(6008)
12
225
5265
'''K5200'''
2304:192:48
(4, 12)
667
(기본)
771
(부스트)
1024
256
8
150
?
'''K5000'''
GK104
(28㎚)
(294㎟)
1536:128:32
(4, 8)
706
(기본)
512
1350
(5400)
4
122
2499
'''K4200'''
1344:112:32
(4, 7)
771
(기본)
784
(부스트)
108
?
'''K4000'''
GK106
(28㎚)
(221㎟)
768:64:24
(2, 4)
810
(기본)
384
192
1404
(5616)
3
80
1269
'''K2200'''
GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1046
(기본)
1124
(부스트)
2048
128
1253
(5012)
4
68
?
'''K2000'''
GK107
(28㎚)
(118㎟)
384:32:16
(1, 2)
954
(기본)
256
1000
(4000)
2
51
599
'''K1200'''
GM107
(28㎚)
(148㎟)
512:32:16
(1, 4)
1058
(기본)
1124
(부스트)
2048
1250
(5000)
4
45
?
'''K620'''
384:16:16
(1, 3)
1058
(기본)
1124
(부스트)
DDR3
900
(1800)
2
41
?
'''K600'''
GK107
(28㎚)
(118㎟)
192:16:16
(1, 1)
876
(기본)
256
891
(1792)
1
41
199
'''K420'''
?
'''K410'''
192:16:8
(1, 1)
706
(기본)
128
64
0.5
38
149
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GK110 칩셋 한정 → (단정밀도 연산 속도) ÷ 3 = (배정밀도 연산 속도) [GFLOPS]
GK104, GK106, GK107 칩셋 한정 → (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
GM107 칩셋 한정 → (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.4. Maxwell 마이크로아키텍처



2.1.4.1. Quadro M

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX/SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''M6000'''
GM200
(28㎚)
(601㎟)
3072:192:96
(6, 24)
988
(기본)
1114
(부스트)
3
384
GDDR5
1653
(6612)
12
24
250
4999
'''M5000'''
GM204
(28㎚)
(398㎟)
2048:128:64
(4, 16)
861
(기본)
1038
(부스트)
2
256
8
150
?
'''M4000'''
1664:104:64
(4, 13)
773
120
?
'''M3000 SE'''
1024:64:32
(2, 8)
540
1253
(5012)
4
75
?
'''M2000'''
GM206
(28㎚)
(228㎟)
768:48:32
(2, 6)
872
(기본)
1180
(부스트)
1
128
1653
(6612)
?
<-11><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== Pascal 마이크로아키텍처 ========= Quadro P =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''GP100'''
GP100
(16㎚)
(610㎟)
3584:224:96
(6, 56)
1380
(기본)
1441
(부스트)
4
4096
HBM2
900
(1800)
16
235
6999
'''P6000'''
GP102
(16㎚)
(471㎟)
3840:240:96
(6, 30)
1417
(기본)
1531
(부스트)
3
384
GDDR5X
1127
(9016)
24
250
4999
'''P5000'''
GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1607
(기본)
1733
(부스트)
2
256
16
180
2499
'''P4000'''
1792:112:64
(4, 14)
1202
(기본)
1480
(부스트)
GDDR5
1901
(7604)
8
105
815
'''P2000'''
GP106
(16㎚)
(200㎟)
1024:64:40
(2, 8)
1076
(기본)
1480
(부스트)
1.25
160
1752
(7008)
5
75
?
'''P1000'''
GP107
(16㎚)
(132㎟)
640:40:32
(1, 5)
1266
(기본)
1480
(부스트)
1
128
1253
(5012)
4
47
?
'''P620'''
384:24:16
(1, 3)
1354
(기본)
1455
(부스트)
1003
(4012)
2
40
?
'''P600'''
1329
(기본)
1557
(부스트)
0.5
64
?
'''P400'''
256:16:16
(1, 2)
1228
(기본)
1328
(부스트)
30
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.5. Volta 마이크로아키텍처



2.1.5.1. Quadro V

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TS:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
'''GV100'''
GV100
(12㎚)
(815㎟)
5120:640:320:128
(6, 80)
1132
(기본)
1628
(부스트)
8
4096
HBM2
850
(1700)
32
250
8999
<-11><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== Turing 마이크로아키텍처 ========= Quadro RTX =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TS:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''RTX 8000'''
TU102
(12㎚)
(754㎟)
4608:576:288:72:96
(6, 72)
1005
(기본)
1200
(부스트)
6
384
GDDR6
1750
(14000)
48
250
9999
'''RTX 6000'''
1440
(기본)
1770
(부스트)
24
6299
'''RTX 5000'''
TU104
(12㎚)
(545㎟)
3072:384:192:48:64
(6, 48)
1620
(기본)
1815
(부스트)
4
256
16
200
2299
'''RTX 4000'''
2304:288:144:36:64
(5, 36)
1215
(기본)
1710
(부스트)
1625
(13000)
8
160
899
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.1.6. Ampere 마이크로아키텍쳐



2.1.6.1. Quadro RTX A6000


2.2. Quadro 모바일용 제품군



2.2.1. NV10(Celsius) 마이크로아키텍처



2.2.1.1. Quadro 4 Go

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
PP:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
'''Quadro 4 500 Go GL'''
NV17
(150㎚)
(65㎟)
2:4:2
220
128
SDR
220
64
?
<-9><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== NV20(Kelvin) 마이크로아키텍처 ========= Quadro 4 Go =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
'''Quadro 4 700 Go GL'''
NV28
(150㎚)
(101㎟)
4:2:4:4
176
128
SDR
200
64
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.2.2. NV30(Rankine) 마이크로아키텍처



2.2.2.1. Quadro FX Go

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
'''Quadro FX Go 1000'''
NV36
(130㎚)
(125㎟)
4:3:4:4
295
128
DDR
285
(570)
128
?
<-9><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== NV40(Curie) 마이크로아키텍처 ========= Quadro FX Go =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX Go 1400'''
NV41
(130㎚)
(225㎟)
8:5:8:8
275
256
DDR
295
(590)
256
?
'''Quadro FX Go 540'''
NV43
(110㎚)
(150㎟)
8:4:8:8
300
128
225
(450)
128
25
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.2.2.2. Quadro FX (x500M)

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 3500M'''
G71

(90㎚)
(196㎟)
24:8:24:16
575
256
GDDR3
600
(1200)
512
45
'''Quadro FX 2500M'''
500
'''Quadro FX 1500M'''
20:7:24:16
375
500
(1000)
'''Quadro FX 550M'''
G73

(90㎚)
(125㎟)
12:5:12:8
480
128
35
'''Quadro FX 350M'''
G72

(90㎚)
(81㎟)
4:3:4:2
450
450
(900)
256
15
<-9><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== G80(Tesla) 마이크로아키텍처 ========= Quadro FX (x600M) =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''FX 3600M'''
G92
(65㎚)
(324㎟)
96:48:16
(6, 12)
500
(코어)
1250
(셰이더)
256
GDDR3
800
(1600)
512
70
'''FX 2600M'''
64:32:16
(4, 8)
799
(1598)
'''FX 1600M'''
G84
(80㎚)
(169㎟)
32:16:8
(2, 4)
625
(코어)
1250
(셰이더)
128
800
(1600)
50
'''FX 360M'''
G86
(80㎚)
(127㎟)
16:8:4
(1, 2)
400
(코어)
800
(셰이더)
64
DDR2
600
(1200)
256
17
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.2.2.3. Quadro FX (x700M)

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''FX 3700M'''
G92
(65㎚)
(324㎟)
128:64:16
(8, 16)
550
(코어)
1375
(셰이더)
256
GDDR3
800
(1600)
1024
75
'''FX 2700M'''
G94
(65㎚)
(240㎟)
48:24:16
(3, 6)
530
(코어)
1325
(셰이더)
799
(1598)
512
65
'''FX 1700M'''
G96
(65㎚)
(144㎟)
32:16:8
(2, 4)
625
(코어)
1550
(셰이더)
128
800
(1600)
50
'''FX 770M'''
500
(코어)
1250
(셰이더)
35
'''FX 570M'''
G84
(80㎚)
(169㎟)
475
(코어)
950
(셰이더)
700
(1400)
45
'''FX 370M'''
G98
(65㎚)
(86㎟)
8:4:4
(1, 1)
550
(코어)
1400
(셰이더)
64
600
(1200)
256
20
<-9><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

===== Quadro FX (x800M) =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''FX 3800M'''
G92
(65㎚)
(324㎟)
128:64:16
(8, 16)
675
(코어)
1650
(셰이더)
256
GDDR3
1000
(2000)
1024
100
'''FX 2800M'''
96:48:16
(6, 12)
600
(코어)
1500
(셰이더)
75
'''FX 1800M'''
GT215
(40㎚)
(144㎟)
72:24:8
(3, 9)
561
(코어)
1125
(셰이더)
128
GDDR5
550
(2200)
45
'''FX 880M'''
GT216
(40㎚)
(100㎟)
48:16:8
(2, 6)
500
(코어)
1250
(셰이더)
GDDR3
790
(1580)
35
'''FX 380M'''
GT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
550
(코어)
1400
(셰이더)
64
512
25
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.2.3. Fermi 마이크로아키텍처



2.2.3.1. Quadro (x000M)

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''5010M'''
GF110
(40㎚)
(520㎟)
384:48:32
(3, 12)
450
(코어)
900
(셰이더)
512
256
GDDR5
650
(2600)
4
100
'''5000M'''
GF100
(40㎚)
(529㎟)
320:40:32
(3, 10)
405
(코어)
810
(셰이더)
600
(2400)
1.75
'''4000M'''
GF104
(40㎚)
(332㎟)
336:56:32
(2, 7)
475
(코어)
950
(셰이더)
625
(2500)
2
'''3000M'''
240:40:32
(2, 5)
450
(코어)
900
(셰이더)
75
'''2000M'''
GF106
(40㎚)
(238㎟)
192:32:16
(1, 4)
550
(코어)
1100
(셰이더)
256
128
DDR3
900
(1800)
55
'''1000M'''
GF108
(40㎚)
(116㎟)
96:16:4
(1, 2)
700
(코어)
1400
(셰이더)
45
'''500M'''
1
35
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GF100, GF110 칩셋 한정 → (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
GF104, GF106, GF108 칩셋 한정 → (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== Kepler 마이크로아키텍처 ========= Quadro Kx000M =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''K5000M'''
GK104
(28㎚)
(294㎟)
1344:112:32
(4, 7)
601
(기본)
512
256
GDDR5
750
(3000)
4
100
'''K4000M'''
960:80:32
(3, 5)
700
(2800)
'''K3000M'''
576:48:32
(2, 3)
654
(기본)
2
75
'''K2000M'''
GK107
(28㎚)
(118㎟)
384:32:16
(1, 2)
745
(기본)
256
128
DDR3
900
(1800)
55
'''K1000M'''
192:16:16
(1, 1)
850
(기본)
45
'''K500M'''
192:16:8
(1, 1)
128
64
800
(1600)
1
35
'''K200M'''
'''K100M'''
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.2.3.2. Quadro Kx100M

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''K5100M'''
GK104
(28㎚)
(294㎟)
1536:128:32
(4, 8)
771
(기본)
512
256
GDDR5
900
(3600)
8
100
'''K4100M'''
1152:96:32
(3, 6)
706
(기본)
800
(3200)
4
'''K3100M'''
768:64:32
(2, 4)
75
'''K2100M'''
GK106
(28㎚)
(221㎟)
576:48:16
(2, 3)
667
(기본)
256
128
752
(3016)
2
55
'''K1100M'''
GK107
(28㎚)
(118㎟)
384:32:16
(1, 2)
706
(기본)
700
(2800)
45
'''K610M'''
GK208
(28㎚)
(87㎟)
192:16:8
(1, 1)
980
(기본)
128
64
650
(2600)
1
30
'''K510M'''
846
(기본)
600
(2400)
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== Maxwell 마이크로아키텍처 ========= Quadro Kx200M =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''K2200M'''
GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
667
(기본)
2
128
GDDR5
1253
(5012)
2
65
'''K620M'''
GM108
(28㎚)
(81㎟)
384:24:8
(1, 3)
1029
(기본)
1
64
DDR3
900
(1800)
30
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.2.3.3. Quadro Mx000M

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''M5000M'''
GM204
(28㎚)
(398㎟)
1536:96:64
(3, 12)
975
(기본)
2
256
GDDR5
1253
(5012)
8
100
'''M4000M'''
1280:80:64
(3, 10)
4
'''M3000M'''
1024:64:32
(2, 8)
1050
(기본)
1
128
75
'''M2000M'''
GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1029
(기본)
1098
(부스트)
2
55
'''M1000M'''
512:32:16
(1, 4)
993
(기본)
2
40
'''M600M'''
384:24:8
(1, 3)
1029
(기본)
1124
(부스트)
30
'''M500M'''
GM108
(28㎚)
(81㎟)
1
64
DDR3
900
(1800)
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

===== Quadro Mxx00 =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''M5500'''
GM204
(28㎚)
(398㎟)
2048:128:64
(4, 16)
861
(기본)
1038
(부스트)
2
256
GDDR5
1753
(7012)
8
150
'''M2200'''
GM206
(28㎚)
(228㎟)
1024:64:32
(2, 8)
1025
(기본)
1
128
1375
(5500)
4
55
'''M1200'''
GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1093
(기본)
2
128
1253
(5012)
45
'''M620'''
512:32:16
(1, 4)
756
(기본)
977
(부스트)
2
30
'''M520'''
GM108
(28㎚)
(81㎟)
384:24:8
(1, 3)
1041
(기본)
1
64
25
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.2.4. Pascal 마이크로아키텍처



2.2.4.1. Quadro Pxx00

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''P5200'''
GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1556
(기본)
1746
(부스트)
2
256
GDDR5
1800
(7200)
16
100
'''P5000'''
2048:128:64
(4, 16)
1278
(기본)
1582
(부스트)
1502
(6008)
'''P4200'''
2304:144:64
(4, 18)
1227
(기본)
1647
(부스트)
8
'''P4000'''
1792:112:64
(3, 14)
1227
(기본)
'''P3200'''
1328
(기본)
1476
(부스트)
1.5
192
1753
(7012)
6
75
'''P3000'''
1280:80:48
(2, 10)
1088
(기본)
1215
(부스트)
'''P2000'''
GP107
(16㎚)
(132㎟)
768:48:32
(1, 6)
1557
(기본)
1607
(부스트)
1
128
1502
(6008)
4
50
'''P1000'''
512:32:16
(1, 4)
1303
(기본)
1493
(부스트)
40
'''P600'''
384:24:16
(1, 3)
1430
(기본)
1557
(부스트)
1253
(5012)
25
'''P500'''
GP108
(16㎚)
(74㎟)
256:16:16
(1, 2)
1228
(기본)
1455
(부스트)
0.5
64
2
18
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

===== Quadro Pxx00 Max-Q =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''P5200 Max-Q'''
GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1316
(기본)
1569
(부스트)
2
256
GDDR5
1804
(7216)
16
100
'''P4000 Max-Q'''
1792:112:64
(4, 14)
1114
(기본)
1228
(부스트)
1502
(6008)
8
'''P3200 Max-Q'''
1139
(기본)
1404
(부스트)
1.5
192
1753
(7012)
6
75
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

2.2.5. Turing 마이크로아키텍처



2.2.5.1. Quadro RTX

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TS:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''RTX 5000'''
TU104
(12㎚)
(545㎟)
3072:384:192:48:64
(6, 48)

(기본)

(부스트)
4
256
GDDR6
1750
(14000)
16
110

'''RTX 4000'''
2560:320:160:40:64
(5, 40)
1110
(기본)
1560
(부스트)
8

'''RTX 3000'''
TU106
(12㎚)
(445㎟)
2304:288:144:36:48
(5, 36)
945
(기본)
1380
(부스트)
6
60~80

'''RTX T2000'''
TU117
(12㎚)
(200㎟)
1024:0:64:0:32
(2, 0)
1575
(기본)
1785
(부스트)
1
128
GDDR5
2000
(8000)
4
60

'''RTX T1000'''
896:0:56:0:32
(2, 0)
1395
(기본)
1455
(부스트)
40~50

<-11><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

===== Quadro RTX Max-Q =====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TS:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''RTX 5000 Max-Q'''
TU104
(12㎚)
(545㎟)
3072:384:192:48:64
(6, 48)
600
(기본)
1350
(부스트)
4
256
GDDR6
1750
(14000)
16
80

'''RTX 4000 Max-Q'''
2560:320:160:40:64
(5, 40)
1005
(기본)
1200
(부스트)
1625
(13000)
8

'''RTX 3000 Max-Q'''
TU106
(12㎚)
(445㎟)
2304:288:144:36:48
(5, 36)
600
(기본)
1215
(부스트)
6
60

'''RTX T2000 Max-Q'''
TU117
(12㎚)
(200㎟)
1024:0:64:0:32
(2, 0)

(기본)

(부스트)
1
128
GDDR5
2000
(8000)
4
40

【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

3. NVS 제품군


2003년부터 등장한 비즈니스 멀티 모니터 출력용 제품군으로, 본래 쿼드로에서 파생된 녀석이라 2009년까지는 제품명이 NVS 앞에 쿼드로가 붙여 있었다가 2010년 이후에 출시된 제품부터 쿼드로를 뺀 것이 현재의 모습이다. 멀티 모니터용으로써는 과거엔 매트록스가 꽉 잡고 있었기 때문에 지포스에서는 좀처럼 볼 수 없는 하위 GPU를 2개 붙인 형태의 제품을 통해 멀티 모니터 지원을 꽤 하기도 했지만 현재까지도 인지도는 낮은 편. 2015년 11월에 발매한 맥스웰 아키텍처 기반의 NVS 810이 최신 NVS 제품으로 이 제품이 나와서야 멀티 모니터 출력용 그래픽 카드에 걸맞는 스펙을 갖추었다. 최대 8개의 디스플레이 출력을 지원하는데 80만원을 호가할 만큼 만만한 제품이 아니다. 이보다 하위 제품은 최대 4개로 4개의 출력은 지포스 제품군에서도 흔하게 볼 수 있어서 4개 이하의 모니터 출력만큼은 효용성이 많이 줄어든 상태. 가격 대비 더 많은 모니터 출력 지원이라면 NVIDIA보단 차라리 AMD 라데온을 알아보는게 더 나을 정도.
쿼드로와 마찬가지로 NVS도 랩톱용 제품군이 존재한다. 그런데 저렴한 중고 워크스테이션 랩톱을 구한답시고 알아본 그래픽의 스펙이 NVS가 붙은 경우가 제법 많이 보이는데 광고 카탈로그에도 NVS 계열 모델에 대한 제원이 자세하지 않은 경우가 많아서 뭔가 좋아보이는 네이밍으로 착각해 낭패볼 수 있으니 주의할 것. NVS는 지금까지 NVS 510M(G71 칩셋 즉 지포스 Go 7900 GTX)을 제외하면 메인스트림 이상의 체급인 칩셋이 사용된 적이 별로 없고 로우엔드 칩셋이 주로 사용되는 멀티 모니터 출력용인 모델이다. 그래픽 정밀 렌더링용 중고 워크스테이션 랩톱을 알아보고 있는데 뭐가 뭔지 잘 모르겠다면 너무 저렴해 보이는 워크스테이션 랩톱은 일단 거르는 것이 좋은데 쿼드로가 아닌 NVS가 탑재된 제품일 확률이 높다.
NVS에 대한 정보는 해당 공식 홈페이지에서도 확인할 수 있다.[2][3]

3.1. NVS 데스크톱용 제품군



3.1.1. NV10(Celsius) 마이크로아키텍처


<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PP:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro 4 100 NVS'''
NV17
(150㎚)
(65㎟)
2:4:2
250
128
DDR
166
(332)
64
?
?
'''Quadro 4 200 NVS'''
250
(500)
?
?
'''Quadro 4 400 NVS PCI'''
220
166
(332)
?
?
'''Quadro NVS 280 PCI'''
NV18
(150㎚)
(65㎟)
275
250
(500)
?
?
'''Quadro NVS 280 SD'''
250
64
200
(400)
?
?
'''Quadro NVS 55 PCI'''
?
?
'''Quadro NVS 50 PCI'''
?
?
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

[2] 직접 4200M을 사용해본 결과, 게임은 마인크래프트 하옵이 일부 경우 40을 넘지 못하지만, 경우에 따라 1440P 유튜브 영상은 네트워크가 좋다는 전제 하에 '''재생 가능.''' avi 같은 파일로 1440P 영상은 당연하게 재생이 가능하다. 전체적 시스템은 i5-2520M+8GB 랩톱용 DDR3 메모리 싱글채널+HM65 칩셋+Windows 7+SanDisk 256G SSD이며 유튜브는 버전 54 베타 채널이다.[3] 모바일용으로는 페르미 기반(GF108, GF117) 칩셋 모델까지만 나왔다.
==== NV30(Rankine) 마이크로아키텍처 ====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 280 AGP'''
NV34
(150㎚)
(91㎟)
4:1:4:4
275
128
DDR
250
(500)
64
?
?
'''Quadro NVS 280 PCIe'''
NV37
(150㎚)
(91㎟)
13
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

3.1.2. NV40(Curie) 마이크로아키텍처


<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 440'''
NV43
(110㎚)
(150㎟)
8:4:8:8
x2
275
128
x2
DDR
250
(500)
128
x2
31
?
'''Quadro NVS 285'''
NV44
(150㎚)
(91㎟)
4:3:4:2
128
128
18
?
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== G80(Tesla) 마이크로아키텍처 ====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 290'''
G86
(80㎚)
(127㎟)
16:8:4
(1, 2)
459
(코어)
918
(셰이더)
64
DDR2
400
(800)
256
21
149
'''Quadro NVS 295'''
G98
(65㎚)
(86㎟)
8:8:4
(1, 1)
540
(코어)
1300
(셰이더)
GDDR3
695
(1390)
23
?
'''Quadro NVS 420'''
8:8:4
x2
(1 x2, 1 x2)
550
(코어)
1400
(셰이더)
64
x2
700
(1400)
256
x2
40
?
'''Quadro NVS 450'''
480
(코어)
1200
(셰이더)
35
?
'''NVS 300'''
GT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
520
(코어)
1230
(셰이더)
64
790
(1380)
512
18
109
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

3.1.3. Fermi 마이크로아키텍처


<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''NVS 310'''
GF119
(40㎚)
(79㎟)
48:8:4
(1, 1)
523
(코어)
1046
(셰이더)
128
64
DDR3
875
(1750)
0.5
20
159
'''NVS 315'''
1
19
<-11><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== Kepler 마이크로아키텍처 ====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
'''NVS 510'''
GK107
(28㎚)
(118㎟)
192:16:16
(1, 1)
797
(기본)
256
128
DDR3
891
(1782)
2
35
449
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

3.1.4. Maxwell 마이크로아키텍처


<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
'''NVS 810'''
GM107
(28㎚)
(148㎟)
512:32:16
x2
(1 x2, 4 x2)
902
(기본)
1033
(부스트)
0.5
x2
64
x2
DDR3
900
(1800)
2
x2
68
?
<-11><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

=== NVS 모바일용 제품군 ======= NV40(Curie) 마이크로아키텍처 ====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 510M'''
G71

(90㎚)
(196㎟)
24:8:24:16
450
128
GDDR3
600
(1200)
256
35
'''Quadro NVS 300M'''
G73

(90㎚)
(125㎟)
4:3:4:2
500
700
(1400)
16
'''Quadro NVS 120M'''
G72

(90㎚)
(81㎟)
450
64
DDR2
512
10
'''Quadro NVS 110M'''
300
DDR
300
(600)
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

3.1.5. G80(Tesla) 마이크로아키텍처


<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 320M'''
G84
(80㎚)
(169㎟)
32:16:8
(1, 2)
575
(코어)
1150
(셰이더)
128
GDDR3
700
(1400)
512
20
'''Quadro NVS 160M'''
G98
(65㎚)
(86㎟)
8:8:4
(1, 1)
580
(코어)
1450
(셰이더)
64
256
12
'''Quadro NVS 150M'''
530
(코어)
1300
(셰이더)
10
'''Quadro NVS 140M'''
G86
(80㎚)
(127㎟)
16:8:4
(1, 2)
400
(코어)
800
(셰이더)
64
DDR2
600
(1200)
512
12
'''Quadro NVS 135M'''
594
(1188)
256
10
'''Quadro NVS 130M'''
8:4:4
(1, 1)
DDR
700
(1400)
'''NVS 5100M'''
GT216
(40㎚)
(100㎟)
48:16:8
(2, 6)
550
(코어)
1210
(셰이더)
128
GDDR3
800
(1600)
1024
35
'''NVS 3100M'''
GT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
606
(코어)
1468
(셰이더)
64
790
(1580)
512
14
'''NVS 2100M'''
535
(코어)
1230
(셰이더)
11
<-9><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== Fermi 마이크로아키텍처 ====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''NVS 5400M'''
GF108
(40㎚)
(116㎟)
96:16:4
(1, 2)
660
(코어)
1320
(셰이더)
256
128
DDR3
900
(1800)
2 [4]
35
'''NVS 5200M'''
672
(코어)
1344
(셰이더)
128
64
GDDR5
785
(3140)
1
25
GF117
(28㎚)
(116㎟)
DDR3
900
(1800)
'''NVS 4200M'''
GF119
(40㎚)
(79㎟)
48:8:4
(1, 1)
810
(코어)
1620
(셰이더)
800
(1600)
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

4. 데이터 센터 GPU 제품군 (구 Tesla)



2020년 5월까지 사용되던 상표는 '''Tesla'''
2007년 5월부터 내놓은 상표로, GPU가 게임용 연산에만 사용되는 것이 아닌 범용 연산(GPGPU)용으로 확대되면서 고성능 연산 작업을 목적으로 하는 곳을 공략하기 위한 제품군이다. Tesla도 알맹이는 지포스와 같지만 대체로 디스플레이 출력 단자가 없는데다 연산에 주로 사용되기 때문에 GPU 내부에 있는 텍스처 유닛과 ROP이 쓸 일은 없다. 게임 그래픽과는 거리가 먼 분야에 사용되기 때문. 물론 페르미 아키텍처 기반의 일부 제품 한정으로 DVI 단자 1개가 탑재되기도 했지만 케플러 아키텍처부터는 디스플레이 단자가 다시 빠지면서 지금까지 이어져오고 있다. 명색이 전문가를 넘어선 데이터 센터를 주로 공략하는 시장인만큼 가격도 매우 비싼 편인데 지포스와 같은 GPU라 훨씬 저렴한 지포스로 연산 작업을 하면 되지 않겠냐고 반문할 수도 있지만, 쿼드로와 마찬가지로 Tesla용 드라이버가 따로 있고 단일 GPU인 제품은 주로 하위 라인에나 해당되는 제품이지 최상위로 올라가면 GPU가 2개는 물론이고 4개를 한 기판에 탑재된 쿼드 GPU 타입 제품도 있다. GPU를 복수로 붙이면서 전력 소모량, 발열, 부피를 감안해서라도 당대 최고의 고성능 연산을 구현하는 것을 추구하는 방향이기 때문이다. 테슬라는 탑재 대상 컴퓨터들이 최소 워크스테이션에서 최대로는 슈퍼 컴퓨터와 데이터 센터급이며 소비 전력이 엄청 나기 때문에 모바일 제품군이 없다.
2020년 5월에 브랜드가 폐지되었는데. 모 자동차 회사와의 혼동 때문이라는게 공식적인 설명이다. 엔비디아 역시 자율주행 자동차 사업에 진출해 있고 여기에 사용되는 연산용 GPGPU의 명칭이 가장 큰 경쟁사의 명칭과 겹친다는게 좀 아니라고 생각했는듯. 이후 출시된 RTX A100부터는 '''데이터 센터 GPU'''라는 명칭으로 불리고 있다.( )

4.1. G80(Tesla) 마이크로아키텍처


<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
<colbgcolor=black><colcolor=#76b900> '''S870'''
G80
(90㎚)
(484㎟)
128:32:24
x4
(8 x4, 16 x4)
600
(코어)
1350
(셰이더)
384
x4
GDDR3
800
(1600)
1536
x4
800
11999
'''D870'''
128:32:24
x2
(8 x2, 16 x2)
384
x2
1536
x2
520
7499
'''C870'''
128:32:24
(8, 16)
384
1536
171
1499
'''S1075'''
G200B
(55㎚)
(470㎟)
240:80:32
x4
(10 x4, 30 x4)
610
(코어)
1296
(셰이더)
512
x4
4096
x4
800
?
'''S1070'''
7999
'''C1060'''
240:80:32
(10, 30)
512
4096
188
?
'''M1060'''
2048
1699
'''T10'''
4096
?
<-10><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
G200B 칩셋 한정 → (단정밀도 연산 속도) ÷ 8 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

[4] 다만 제조사에 따라 1기가만 장착하는 경우도 있다.
=== Fermi 마이크로아키텍처 ===

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''S2050'''
GF100
(40㎚)
(529㎟)
448:56:48
x4
(4 x4, 14 x4)
574
(코어)
1147
(셰이더)
768
x4
384
x4
GDDR5
773
(3092)
3
x4
900
11999
'''M2050'''
448:56:48
(4, 14)
575
(코어)
1150
(셰이더)
768
384
3
225
2699
'''M2070'''
574
(코어)
1150
(셰이더)
783
(3132)
6
225
3099
'''M2070-Q'''
5489
'''C2050'''
575
(코어)
1150
(셰이더)
750
(3000)
3
238
?
'''C2070'''
6
?
'''X2090'''
GF110
(40㎚)
(520㎟)
512:64:48
(4, 16)
650
(코어)
1300
(셰이더)
925
(3700)
225
?
'''X2070'''
?
'''M2090'''
250
?
'''C2090'''
?
'''M2075'''
448:56:48
(4, 14)
574
(코어)
1147
(셰이더)
783
(3132)
225
2399
'''C2075'''
575
(코어)
1150
(셰이더)
750
(3000)
247
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

4.2. Kepler 마이크로아키텍처


<rowcolor=white> 모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
<rowcolor=white> 칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
단정밀도
(FP32)
(GFLOPS)
배정밀도
(FP64)
(GFLOPS)
<colbgcolor=black><colcolor=#76b900>'''K10'''
2×GK104
2×1536
745MHz
2×256bit
GDDR5
2500MHz
(5000MT/s)
2×4GB
4577
190.7
225W
CUDA 3.0
'''K20'''
GK110
2496
706MHz
320bit
2600MHz
(5200MT/s)
5GB
3524
1175
CUDA 3.5
'''K20X'''
GK110
2688
732MHz
384bit
2600MHz
(5200MT/s)
6GB
3935
1312
235W
'''K40'''
GK110B
2880
745MHz
(기본)
875MHz
(부스트)
384bit
2500MHz
(5000MT/s)
12GB
5040
1680
'''K80'''
2×GK210
2×2496
560MHz
(기본)
875MHz
(부스트)
2×384bit
2750MHz
(5500MT/s)
2×12GB
8736
2912
300W
CUDA 3.7

4.3. Maxwell 마이크로아키텍처


<rowcolor=white> 모델명
GPU
그래픽 메모리
단정밀도(FP32)
최대 연산 성능
(GFLOPS)
TDP
지원
API
<rowcolor=white> 칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
<colbgcolor=black><colcolor=#76b900>'''M4'''
GM206
1024
872MHz
(기본)
1072MHz
(부스트)
128bit
GDDR5
2750MHz
(5500MT/s)
4GB
2195
50~75W
CUDA 5.2
'''M6'''
GM204
1536
722MHz
(기본)
1051MHz
(부스트)
256bit
2300MHz
(4600MT/s)
8GB
3229
75~100W
'''M10'''
4×GM107
4×512
1033MHz
4×128bit
2099MHz
(5188MT/s)
4×8GB
5289
225W
'''M40'''
GM200
3072
948MHz
(기본)
1114MHz
(부스트)
384bit
3000MHz
(6000MT/s)
12GB
6844
250W
'''M60'''
2×GM204
2×2048
899MHz
(기본)
1178MHz
(부스트)
2×256bit
2500MHz
(5000MT/s)
2×8GB
9650
225~300W

4.4. Pascal 마이크로아키텍처


P100은 GP100 컷칩이면서 HBM2 규격을 채택한 모델로 FP64 연산이 5.3 TFLOPS다. P40과 P4는 각각 GP102 풀칩과 GP104 풀칩을 기반으로 개발된 모델이다.
<rowcolor=white> 모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
<rowcolor=white> 칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(GFLOPS)
단정밀도
(FP32)
(GFLOPS)
배정밀도
(FP64)
(GFLOPS)
<colbgcolor=black><colcolor=#76b900>'''P4'''
GP104
2560
810MHz
(기본)
1063MHz
(부스트)
256bit
GDDR5
1500MHz
(6000MT/s)
8GB
22
42.5
5443
170.1
50~75W
CUDA 6.1
'''P40'''
GP102
3840
1303MHz
(기본)
1531MHz
(부스트)
384bit
1800MHz
(7200MT/s)
24GB
47
91.9
11758
367.4
250W
'''P100
(PCIe)'''
GP100
3584
1126MHz
(기본)
1303MHz
(부스트)
3072bit
HBM2
703MHz
(1406MT/s)
12GB
-
18680
9340
4670
250W
CUDA 6.0
4096bit
16GB
CUDA 6.0
'''P100
(NVLink)'''
1380MHz
(기본)
1480MHz
(부스트)
21218
10609
5340
300W
CUDA 6.0

4.5. Volta 마이크로아키텍처


일부 잘못된 내용이 있을 수 있으니 주의할 것.
<rowcolor=white> 모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
<rowcolor=white> 칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
단정밀도
(FP32)
(TFLOPS)
배정밀도
(FP64)
(TFLOPS)
<colbgcolor=black><colcolor=#76b900>'''V100
(PCIe)'''
GV100
5120
1245MHz
(기본)
1380MHz
(부스트)
4096bit
HBM2
877MHz
(1754MT/s)
16GB
14
7
250W
?
'''V100
(NVlink)'''
?MHz
(기본)
1533MHz
(부스트)
32GB
15.7
7.8
300W
?
'''V100S
(PCIe)'''
?MHz
(기본)
1600MHz
(부스트)
1107MHz
(2214MT/s)
32GB
16.4
8.2
300W
?

4.6. Turing 마이크로아키텍처


<rowcolor=white> 모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
<rowcolor=white> 칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
4비트
정수형
(INT4)
(TOPS)
바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(TFLOPS)
단정밀도
(FP32)
(TFLOPS)
'''T4'''
TU104
2560
585 MHz
(기본)
1590 MHz
(부스트)
256 bit
GDDR6
1250 MHz
(10000 MT/s)
16GB
260.504
130.252
65.126
8.141
70 W
?

5. GRID 제품군



5.1. Kepler 마이크로아키텍처



5.1.1. GRID K1


<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''K1'''
GK107
(28㎚)
(118㎟)
192:16:16
x4
(1 x4, 1 x4)
850
(기본)
256
x4
128
x4
DDR3
891
(1782)
4
x4
130
4140
'''K180Q'''
192:16:16
(1, 1)
256
128
1
125
'''K160Q'''
'''K140Q'''
'''K120Q'''
0.5
'''K100'''
0.25
63
<-11><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== GRID K2 ====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''K2'''
GK104
(28㎚)
(294㎟)
1536:128:32
x2
(4 x2, 8 x2)
745
(기본)
512
x2
256
x2
GDDR5
1250
(5000)
4
x2
225
5199
'''K280Q'''
1536:128:32
(4, 8)
512
256
4
1875
'''K260Q'''
2
937
'''K240Q'''
1
469
'''K220Q'''
0.5
'''K200'''
0.25
235
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

5.1.2. GRID K3


<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
'''K340'''
GK107
(28㎚)
(118㎟)
384:32:8
x4
(1 x4, 2 x4)
950
(기본)
128
x4
64
x4
GDDR5
900
(3600)
1
x4
225
3299
<-11><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

==== GRID K5 ====

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''K560Q'''
GK104
(28㎚)
(294㎟)
1536:128:32
x2
(4 x2, 8 x2)
745
(기본)
512
x2
256
x2
GDDR5
1250
(5000)
4
x2
225
3599
'''K540Q'''
'''K520Q'''
'''K520'''
'''K500'''
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

5.2. Maxwell 마이크로아키텍처



5.2.1. GRID M


<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''M60-8Q'''
GM204
(28㎚)
(398㎟)
2048:128:64
(4, 16)
930
(기본)
1180
(부스트)
2
256
GDDR5
1253
(5012)
8
225
3599
'''M60-4A'''
4
?
'''M60-2Q'''
2
?
'''M60-1Q'''
1
?
'''M6-8Q'''
1536:96:64
(3, 12)
722
(기본)
8
100
?
'''M10-8Q'''
GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1033
(기본)
1306
(부스트)
128
1300
(5200)
225
?
'''M3-3020'''
2
?
?
'''M40'''
384:32:16
(1, 3)
930
(기본)
1000
(부스트)
1350
(5400)
4
50
?
<-11><bgcolor=#76b900>
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

== Mining 제품군 ==이름에서 보듯 채굴기이다. 그래서 모니터 연결용 단자가 없다. === Pascal 마이크로아키텍처 ===

<rowcolor=white> 모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> '''P102-101'''
GP102
(16㎚)
(471㎟)
3200:200:80
(5, 25)
1557
(기본)
1670
(부스트)
2.5
320
GDDR5
2002
(8008)
10
250
?
'''P102-100'''
1481
(기본)
1582
(부스트)
GDDR5X
1251
(10008)
5
?
'''P104-101'''
GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1607
(기본)
1733
(부스트)
2
256
8
?
?
'''P104-100'''
1920:120:64
(3, 15)
4
?
?
'''P106-100'''
GP106
(16㎚)
(200㎟)
1280:80:48
(2, 10)
1506
(기본)
1709
(부스트)
1.5
192
GDDR5
2002
(8008)
6
120
?
'''P106-090'''
768:48:48
(2, 6)
1354
(기본)
1531
(부스트)
3
75
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}}}}||
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]
}}}
}}}

6. 관련 문서