NVIDIA/워크스테이션 GPU

1. 개요

2. Quadro 제품군

2.1. Quadro 데스크톱용 제품군

2.1.1. NV10(Celsius) 마이크로아키텍처

2.1.1.1. Quadro

2.1.1.2. Quadro 2

2.1.1.3. Quadro 4 XGL

2.1.2. NV20(Kelvin) 마이크로아키텍처

2.1.2.1. Quadro DCC

2.1.2.2. Quadro 4 XGL

2.1.3. NV30(Rankine) 마이크로아키텍처

2.1.3.1. Quadro FX (x000)

2.1.3.2. Quadro FX (x100)

2.1.3.3. Quadro FX (x300)

2.1.4. NV40(Curie) 마이크로아키텍처

2.1.4.1. Quadro FX (x000)

2.1.4.2. Quadro FX (x400)

2.1.4.3. Quadro FX (x500)

2.1.5. G80(Tesla) 마이크로아키텍처

2.1.5.1. Quadro FX (x600)

2.1.5.2. Quadro FX (x700)

2.1.5.3. Quadro FX (x800)

2.1.5.4. Quadro CX

2.1.5.5. Quadro VX

2.1.6. Fermi 마이크로아키텍처

2.1.6.1. Quadro (x000)

2.1.7. Kepler 마이크로아키텍처

2.1.7.1. Quadro K

2.1.8. Maxwell 마이크로아키텍처

2.1.8.1. Quadro M

2.1.9. Pascal 마이크로아키텍처

2.1.9.1. Quadro P

2.1.10. Volta 마이크로아키텍처

2.1.10.1. Quadro V

2.1.11. Turing 마이크로아키텍처

2.1.11.1. Quadro RTX

2.1.12. Ampere 마이크로아키텍쳐

2.1.12.1. Quadro RTX A6000

2.2. Quadro 모바일용 제품군

2.2.1. NV10(Celsius) 마이크로아키텍처

2.2.1.1. Quadro 4 Go

2.2.2. NV20(Kelvin) 마이크로아키텍처

2.2.2.1. Quadro 4 Go

2.2.3. NV30(Rankine) 마이크로아키텍처

2.2.3.1. Quadro FX Go

2.2.4. NV40(Curie) 마이크로아키텍처

2.2.4.1. Quadro FX Go

2.2.4.2. Quadro FX (x500M)

2.2.5. G80(Tesla) 마이크로아키텍처

2.2.5.1. Quadro FX (x600M)

2.2.5.2. Quadro FX (x700M)

2.2.5.3. Quadro FX (x800M)

2.2.6. Fermi 마이크로아키텍처

2.2.6.1. Quadro (x000M)

2.2.7. Kepler 마이크로아키텍처

2.2.7.1. Quadro Kx000M

2.2.7.2. Quadro Kx100M

2.2.8. Maxwell 마이크로아키텍처

2.2.8.1. Quadro Kx200M

2.2.8.2. Quadro Mx000M

2.2.8.3. Quadro Mxx00

2.2.9. Pascal 마이크로아키텍처

2.2.9.1. Quadro Pxx00

2.2.9.2. Quadro Pxx00 Max-Q

2.2.10. Turing 마이크로아키텍처

2.2.10.1. Quadro RTX

2.2.10.2. Quadro RTX Max-Q

3. NVS 제품군

3.1. NVS 데스크톱용 제품군

3.1.1. NV10(Celsius) 마이크로아키텍처

3.1.2. NV30(Rankine) 마이크로아키텍처

3.1.3. NV40(Curie) 마이크로아키텍처

3.1.4. G80(Tesla) 마이크로아키텍처

3.1.5. Fermi 마이크로아키텍처

3.1.6. Kepler 마이크로아키텍처

3.1.7. Maxwell 마이크로아키텍처

3.2. NVS 모바일용 제품군

3.2.1. NV40(Curie) 마이크로아키텍처

3.2.2. G80(Tesla) 마이크로아키텍처

3.2.3. Fermi 마이크로아키텍처

4. 데이터 센터 GPU 제품군 (구 Tesla)

4.1. G80(Tesla) 마이크로아키텍처

4.2. Fermi 마이크로아키텍처

4.3. Kepler 마이크로아키텍처

4.4. Maxwell 마이크로아키텍처

4.5. Pascal 마이크로아키텍처

4.6. Volta 마이크로아키텍처

4.7. Turing 마이크로아키텍처

5. GRID 제품군

5.1. Kepler 마이크로아키텍처

5.1.1. GRID K1

5.1.2. GRID K2

5.1.3. GRID K3

5.1.4. GRID K5

5.2. Maxwell 마이크로아키텍처

5.2.1. GRID M

6. Mining 제품군

6.1. Pascal 마이크로아키텍처

7. 관련 문서

1. 개요

NVIDIA의 워크스테이션용 GPU 목록. 용도별로 그래픽 정밀 렌더링용인 Quadro, 비즈니스 멀티 모니터 출력용인 NVS, 고성능 컴퓨팅용인 Tesla, 가상 작업 공간용인 GRID, 암호화폐 채굴용인 Mining 제품군이 있다.

2. Quadro 제품군

1999년 지포스와 비슷한 시기에 탄생했다. 지포스와 다르게 일반 사용자가 아닌 전문가를 대상으로 정밀 렌더링 작업용으로 내놓은 제품이다. 하지만, GPU 칩셋 자체는 지포스와 같다. 같은 칩셋을 쓰고 있음에도 불구하고 단일이 아닌 두 제품군으로 내놓는 것은 하드웨어 자원은 한정되어 있으므로 용도별 드라이버 소프트웨어로 자원 분배를 차등해야 하기 때문이다. 게이밍용인 지포스는 빠른 프레임율을 추구하는 방향으로, 쿼드로는 프레임율이 다소 느려도 정확한 렌더링을 추구하는 방향으로 차등해 놓았다. 전문가용 시장 공략에 대성공한데다가 근본적인 알맹이가 똑같은 게이밍용 지포스보다 전문가용이라는 이유로 훨씬 비싸게 판매해서 더 많은 이득을 보고 있다. 하지만 최근에는 지포스도 렌더링 성능이 세대를 거듭하면서 크게 향상되어 작업용으로 쓰는 사람들이 점점 많아졌다. 그래서 쿼드로의 존재감이 조금씩 퇴색하고 있지만 정밀 렌더링만큼은 쿼드로가 우위에 있기 때문에 그런 용도로써 효용성이 있다. 최근에는 ECC/REG 같은 오류 보정 기능이 있는 서버용 메모리를 탑재해 차등화하기도 한다. 지포스 시리즈는 오류 보정 기능이 없는 일반 메모리를 탑재했다. 이는 AMD의 Radeon Instinct 제품군도 마찬가지로 라데온 시리즈와의 차별화를 두고 있다.
2002년부터는 지포스와 마찬가지로 쿼드로에도 랩톱 제품군이 투입되었지만, 랩톱이라는 작고 얇은 제약된 공간 특성상 데스크톱용보다 사양을 낮췄고, 그런 점에서는 랩톱용 지포스와 비슷하다. 모바일 워크스테이션에 탑재하는 쿼드로는 외장 그래픽으로 내놓은 쿼드로 제품군 대부분을 탑재하고 있다. 하지만 전문가용이라 웬만한 게이밍 랩톱보다 훨씬 비싸다. 이에 관한 자세한 내용은 모바일 워크스테이션 문서 참조.
2020년 10월 암페어 아키텍쳐 기반의 RTX A6000과 A40이 출시되었는데 쿼드로 브랜드가 사라진 채 발표되었다. 이미 사라진 테슬라와 균형을 맞추기 위한 것인지는 확실히 밝혀지지 않았지만, 일단 엔비디아 홈페이지에서는 신형 쿼드로로 소개하고 있다. 다만 제품 명칭에서는 확실하게 사라졌다. 테슬라야 그렇다 쳐도 쿼드로는 지포스와 같이 20년을 이어져 온 브랜드인데 왜 갑자기 사라졌는지가 의문점이다.

2.1. Quadro 데스크톱용 제품군

2.1.1. NV10(Celsius) 마이크로아키텍처

2.1.1.1. Quadro

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PP:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)	TDP ^(W)	출고 가격 ^($)
'''Quadro'''	NV10 _(220㎚) ^(111㎟)	4:4:4	135	128	SDR	166	32	?	?

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

===== Quadro 2 =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	PP:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''Quadro 2 Pro'''	NV15 _(180㎚) ^(90㎟)	4:4:4	200	128	DDR	250 (500)	64	?	?
'''Quadro 2 MXR'''	NV11 _(180㎚) ^(65㎟)	2:4:4	200	128	SDR	183	32	?	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.1.2. Quadro 4 XGL

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PP:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)	TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''Quadro 4 550 XGL'''	NV17 _(150㎚) ^(65㎟)	2:4:4	270	128	DDR	200 (400)	64	?	?
'''Quadro 4 500 XGL'''	NV17 _(150㎚) ^(65㎟)		250		SDR	166	128	?	?
'''Quadro 4 580 XGL'''	NV18 _(150㎚) ^(65㎟)		300		DDR	200 (400)	64	?	?
'''Quadro 4 380 XGL'''	NV18 _(150㎚) ^(65㎟)		275		DDR	256 (512)	128	?	?

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== NV20(Kelvin) 마이크로아키텍처 ========= Quadro DCC =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)	출고 가격 ^($)
'''Quadro DCC'''	NV20 _(150㎚) ^(128㎟)	4:1:4:4	200	128	SDR	230	64	?	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.1.3. Quadro 4 XGL

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro 4 900 XGL'''	NV25 _(150㎚) ^(142㎟)	4:2:8:8	300	128	DDR	325 (650)	128	?	?
'''Quadro 4 750 XGL'''			275			225 (450)		?	?
'''Quadro 4 700 XGL'''							64	?	?
'''Quadro 4 980 XGL'''	NV28 _(150㎚) ^(101㎟)		300			325 (650)	128	?	?

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== NV30(Rankine) 마이크로아키텍처 ========= Quadro FX (x000) =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 1000'''	NV30 _(130㎚) ^(200㎟)	4:2:8:4	300	128	GDDR2	300 (600)	128	?	?
'''Quadro FX 2000'''			400			400 (800)		?	?
'''Quadro FX 3000'''	NV35 _(130㎚) ^(207㎟)	4:3:8:8		256	DDR	425 (850)	256	?	?
'''Quadro FX 700'''		4:1:4:4	275	128		275 (550)	128	?	?
'''Quadro FX 600''' [1] PCI 슬롯형 모델.	NV34 _(150㎚) ^(91㎟)	4:2:4:4	270			240 (480)		?	?
'''Quadro FX 500'''		4:1:4:4						?	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.1.4. Quadro FX (x100)

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)	TDP ^(W)	출고 가격 ^($)
'''Quadro FX 1100'''	NV36 _(130㎚) ^(125㎟)	4:3:4:4	425	128	GDDR2	325 (650)	256	?	?

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

[1] PCI 슬롯형 모델.

===== Quadro FX (x300) =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 1300'''	NV38 _(130㎚) ^(207㎟)	8:3:8:8	350	128	DDR	275 (550)	128	?	?
'''Quadro FX 330'''	NV35 _(130㎚) ^(207㎟)	4:2:4:2	250	64	GDDR2	200 (400)	64	?	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.2. NV40(Curie) 마이크로아키텍처

2.1.2.1. Quadro FX (x000)

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 4000'''	NV40 _(130㎚) ^(287㎟)	12:5:12:8	375	256	GDDR3	500 (1000)	256	?	?
'''Quadro FX 4000 SDI'''	NV41 _(130㎚) ^(225㎟)	12:5:12:12	425					?	?

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

===== Quadro FX (x400) =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 4400'''	NV40 (AGP) _(130㎚) ^(287㎟)	12:5:12:12	375	256	GDDR3	525 (1050)	256	?	?
'''Quadro FX 3450'''	NV41 (PCIe) _(130㎚) ^(225㎟)		425			500 (1000)		?	?
'''Quadro FX 3400'''	NV45 (PCIe) _(130㎚) ^(287㎟)		350			450 (900)		?	?
'''Quadro FX 1400'''	NV41 (PCIe) _(130㎚) ^(225㎟)	12:5:12:8	350	128	DDR	300 (600)	128	?	?
'''Quadro FX 540'''	NV43 (PCIe) _(110㎚) ^(150㎟)	8:4:8:8	300	128	GDDR3	250 (500)	128	?	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.2.2. Quadro FX (x500)

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)	TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 4500'''	G70 _(110㎚) ^(333㎟)	24:8:24:16	430	256	GDDR3	525 (1050)	512	?	?
'''Quadro FX 5500'''	G71 _(90㎚) ^(196㎟)	24:8:24:16	650	256		505 (1010)	1024	?	?
'''Quadro FX 4500 X2'''		24:8:24:16 x2	375	256 x2		605 (1210)	512 x2	?	?
'''Quadro FX 3500'''		20:7:20:16	450	256		660 (1320)	256	?	?
'''Quadro FX 1500'''		20:7:20:16	325	256		625 (1250)	256	?	?
'''Quadro FX 560'''	G73 _(90㎚) ^(125㎟)	12:5:12:8	350	128		600 (1200)	128	?	?
'''Quadro FX 550'''	NV43 _(110㎚) ^(150㎟)	8:4:8:8	360	128		400 (800)		?	?
'''Quadro FX 350'''	G72 _(90㎚) ^(81㎟)	4:3:4:2	550	64	DDR2	405 (810)		?	?

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== G80(Tesla) 마이크로아키텍처 ========= Quadro FX (x600) =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''FX 5600'''	G80 _(90㎚) ^(484㎟)	128:32:24 (8, 16)	600 ^(코어) 1350 ^(셰이더)	384	GDDR3	800 (1600)	1536	171	2999
'''FX 4600'''	G80 _(90㎚) ^(484㎟)	96:24:24 (6, 12)	500 ^(코어) 1200 ^(셰이더)	384	GDDR3	700 (1400)	768	134	1999
<rowcolor=white> 【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.2.3. Quadro FX (x700)

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)	TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''FX 3700'''	G92 _(65㎚) ^(324㎟)	112:56:16 (7, 14)	500 ^(코어) 1250 ^(셰이더)	256	GDDR3	800 (1600)	512	78	1599
'''FX 4700 X2'''	G92 _(65㎚) ^(324㎟)	128:64:16 (8 x2, 16 x2) x2	600 ^(코어) 1500 ^(셰이더)	256 x2	GDDR3	800 (1600)	1024 x2	226	2999
'''FX 1700'''	G84 _(80㎚) ^(169㎟)	32:16:8 (2, 4)	460 ^(코어) 920 ^(셰이더)	256	DDR2	400 (800)	512	42	699
'''FX 570'''		16:8:8 (1, 2)	460 ^(코어) 920 ^(셰이더)	128		400 (800)	256	38	199
'''FX 370'''		16:8:4 (1, 2)	360 ^(코어) 720 ^(셰이더)	64		500 (1000)		35	129
'''FX 370 LP'''	G98 _(65㎚) ^(86㎟)	8:8:4 (1, 1)	540 ^(코어) 1080 ^(셰이더)	64		500 (1000)		25	129

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

===== Quadro FX (x800) =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''FX 5800'''	G200B _(55㎚) ^(470㎟)	240:80:32 (10, 30)	500 ^(코어) 1250 ^(셰이더)	256	GDDR3	800 (1600)	512	78	1599
'''FX 4800'''		192:64:24 (8, 24)	602 ^(코어) 1204 ^(셰이더)	384			1536	150	1799
'''FX 3800'''		192:64:16 (8, 24)	602 ^(코어) 1204 ^(셰이더)	256			1024	108	799
'''FX 1800'''	G94 _(65㎚) ^(240㎟)	64:32:12 (4, 8)	550 ^(코어) 1375 ^(셰이더)	192			768	59	489
'''FX 580'''	G96C _(55㎚) ^(121㎟)	32:16:8 (2, 4)	450 ^(코어) 1125 ^(셰이더)	128			512	40	199
'''FX 380'''	G96 _(65㎚) ^(144㎟)	16:8:8 (1, 2)	450 ^(코어) 1100 ^(셰이더)	128		700 (1400)	256	34	129
'''FX 380 LP'''	GT218 _(40㎚) ^(57㎟)	16:8:4 (1, 2)	650 ^(코어) 1375 ^(셰이더)	64		800 (1600)	512	28	169
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.2.4. Quadro CX

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)	TDP ^(W)	출고 가격 ^($)
'''CX'''	G200B _(55㎚) ^(470㎟)	192:64:24 (8, 24)	602 ^(코어) 1204 ^(셰이더)	384	GDDR3	800 (1600)	1536	150	1999

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

===== Quadro VX =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)	출고 가격 ^($)
'''VX 200'''	G92 _(65㎚) ^(324㎟)	112:56:16 (7, 14)	450 ^(코어) 1125 ^(셰이더)	256	GDDR3	800 (1600)	512	75	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.3. Fermi 마이크로아키텍처

2.1.3.1. Quadro (x000)

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)	TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''7000'''	GF110 _(40㎚) ^(520㎟)	512:64:48 (4, 16)	651 ^(코어) 1301 ^(셰이더)	768	384	GDDR5	924 (3696)	6	204	14499
'''6000'''	GF100 _(40㎚) ^(529㎟)	448:56:48 (4, 14)	574 ^(코어) 1147 ^(셰이더)	768	384		747 (2988)	6	204	4399
'''5000'''		352:44:40 (3, 11)	513 ^(코어) 1026 ^(셰이더)	640	320		750 (3000)	2.5	152	2499
'''4000'''		256:32:32 (2, 8)	475 ^(코어) 950 ^(셰이더)	512	256		702 (2808)	2	142	1199
'''2000'''	GF106 _(40㎚) ^(238㎟)	192:32:16 (1, 4)	625 ^(코어) 1250 ^(셰이더)	256	128		650 (2600)	1	62	599
'''600'''	GF108 _(40㎚) ^(116㎟)	96:16:8 (1, 2)	640 ^(코어) 1280 ^(셰이더)	256	128	DDR3	800 (1600)	1	40	179
'''400'''	GT216 _(40㎚) ^(100㎟)	48:16:8 (2, 6)	450 ^(코어) 1125 ^(셰이더)	-	64	DDR3	770 (1540)	0.5	32	169

<-11><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GF100, GF110 칩셋 한정 → (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
GF106, GF108 칩셋 한정 → (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== Kepler 마이크로아키텍처 ========= Quadro K =====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(GPC, SMX/SMM)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)		TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900>'''K6000'''	GK110 _(28㎚) ^(561㎟)	2880:240:48 (5, 15)	797 ^(기본) 902 ^(부스트)	1536	384	GDDR5	1502 (6008)	12	225	5265
'''K5200'''	GK110 _(28㎚) ^(561㎟)	2304:192:48 (4, 12)	667 ^(기본) 771 ^(부스트)	1024	256		1502 (6008)	8	150	?
'''K5000'''	GK104 _(28㎚) ^(294㎟)	1536:128:32 (4, 8)	706 ^(기본)	512			1350 (5400)	4	122	2499
'''K4200'''	GK104 _(28㎚) ^(294㎟)	1344:112:32 (4, 7)	771 ^(기본) 784 ^(부스트)	512			1350 (5400)	4	108	?
'''K4000'''	GK106 _(28㎚) ^(221㎟)	768:64:24 (2, 4)	810 ^(기본)	384	192		1404 (5616)	3	80	1269
'''K2200'''	GM107 _(28㎚) ^(148㎟)	640:40:16 (1, 5)	1046 ^(기본) 1124 ^(부스트)	2048	128		1253 (5012)	4	68	?
'''K2000'''	GK107 _(28㎚) ^(118㎟)	384:32:16 (1, 2)	954 ^(기본)	256			1000 (4000)	2	51	599
'''K1200'''	GM107 _(28㎚) ^(148㎟)	512:32:16 (1, 4)	1058 ^(기본) 1124 ^(부스트)	2048			1250 (5000)	4	45	?
'''K620'''	GM107 _(28㎚) ^(148㎟)	384:16:16 (1, 3)	1058 ^(기본) 1124 ^(부스트)	2048		DDR3	900 (1800)	2	41	?
'''K600'''	GK107 _(28㎚) ^(118㎟)	192:16:16 (1, 1)	876 ^(기본)	256			891 (1792)	1	41	199
'''K420'''		192:16:16 (1, 1)	876 ^(기본)	256				1	41	?
'''K410'''		192:16:8 (1, 1)	706 ^(기본)	128	64			0.5	38	149
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] GK110 칩셋 한정 → (단정밀도 연산 속도) ÷ 3 = (배정밀도 연산 속도) [GFLOPS] GK104, GK106, GK107 칩셋 한정 → (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS] GM107 칩셋 한정 → (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.4. Maxwell 마이크로아키텍처

2.1.4.1. Quadro M

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SMX/SMM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)	TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''M6000'''	GM200 _(28㎚) ^(601㎟)	3072:192:96 (6, 24)	988 ^(기본) 1114 ^(부스트)	3	384	GDDR5	1653 (6612)	12 24	250	4999
'''M5000'''	GM204 _(28㎚) ^(398㎟)	2048:128:64 (4, 16)	861 ^(기본) 1038 ^(부스트)	2	256			8	150	?
'''M4000'''		1664:104:64 (4, 13)	773					8	120	?
'''M3000 SE'''		1024:64:32 (2, 8)	540				1253 (5012)	4	75	?
'''M2000'''	GM206 _(28㎚) ^(228㎟)	768:48:32 (2, 6)	872 ^(기본) 1180 ^(부스트)	1	128		1653 (6612)	4	75	?

<-11><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== Pascal 마이크로아키텍처 ========= Quadro P =====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)		TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''GP100'''	GP100 _(16㎚) ^(610㎟)	3584:224:96 (6, 56)	1380 ^(기본) 1441 ^(부스트)	4	4096	HBM2	900 (1800)	16	235	6999
'''P6000'''	GP102 _(16㎚) ^(471㎟)	3840:240:96 (6, 30)	1417 ^(기본) 1531 ^(부스트)	3	384	GDDR5X	1127 (9016)	24	250	4999
'''P5000'''	GP104 _(16㎚) ^(314㎟)	2560:160:64 (4, 20)	1607 ^(기본) 1733 ^(부스트)	2	256	GDDR5X	1127 (9016)	16	180	2499
'''P4000'''	GP104 _(16㎚) ^(314㎟)	1792:112:64 (4, 14)	1202 ^(기본) 1480 ^(부스트)	2	256	GDDR5	1901 (7604)	8	105	815
'''P2000'''	GP106 _(16㎚) ^(200㎟)	1024:64:40 (2, 8)	1076 ^(기본) 1480 ^(부스트)	1.25	160		1752 (7008)	5	75	?
'''P1000'''	GP107 _(16㎚) ^(132㎟)	640:40:32 (1, 5)	1266 ^(기본) 1480 ^(부스트)	1	128		1253 (5012)	4	47	?
'''P620'''		384:24:16 (1, 3)	1354 ^(기본) 1455 ^(부스트)	1	128		1003 (4012)	2	40	?
'''P600'''		384:24:16 (1, 3)	1329 ^(기본) 1557 ^(부스트)	0.5	64				40	?
'''P400'''		256:16:16 (1, 2)	1228 ^(기본) 1328 ^(부스트)	0.5	64				30	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.5. Volta 마이크로아키텍처

2.1.5.1. Quadro V

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TS:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)	TDP ^(W)	출고 가격 ^($)
'''GV100'''	GV100 _(12㎚) ^(815㎟)	5120:640:320:128 (6, 80)	1132 ^(기본) 1628 ^(부스트)	8	4096	HBM2	850 (1700)	32	250	8999

<-11><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== Turing 마이크로아키텍처 ========= Quadro RTX =====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		CUDA:TS:TMU:RT:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''RTX 8000'''	TU102 _(12㎚) ^(754㎟)	4608:576:288:72:96 (6, 72)	1005 ^(기본) 1200 ^(부스트)	6	384	GDDR6	1750 (14000)	48	250	9999
'''RTX 6000'''			1440 ^(기본) 1770 ^(부스트)					24		6299
'''RTX 5000'''	TU104 _(12㎚) ^(545㎟)	3072:384:192:48:64 (6, 48)	1620 ^(기본) 1815 ^(부스트)	4	256			16	200	2299
'''RTX 4000'''		2304:288:144:36:64 (5, 36)	1215 ^(기본) 1710 ^(부스트)				1625 (13000)	8	160	899
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.1.6. Ampere 마이크로아키텍쳐

2.1.6.1. Quadro RTX A6000

2.2. Quadro 모바일용 제품군

2.2.1. NV10(Celsius) 마이크로아키텍처

2.2.1.1. Quadro 4 Go

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PP:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)	TDP ^(W)
'''Quadro 4 500 Go GL'''	NV17 _(150㎚) ^(65㎟)	2:4:2	220	128	SDR	220	64	?

<-9><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== NV20(Kelvin) 마이크로아키텍처 ========= Quadro 4 Go =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)
'''Quadro 4 700 Go GL'''	NV28 _(150㎚) ^(101㎟)	4:2:4:4	176	128	SDR	200	64	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.2.2. NV30(Rankine) 마이크로아키텍처

2.2.2.1. Quadro FX Go

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)	TDP ^(W)
'''Quadro FX Go 1000'''	NV36 _(130㎚) ^(125㎟)	4:3:4:4	295	128	DDR	285 (570)	128	?

<-9><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== NV40(Curie) 마이크로아키텍처 ========= Quadro FX Go =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX Go 1400'''	NV41 _(130㎚) ^(225㎟)	8:5:8:8	275	256	DDR	295 (590)	256	?
'''Quadro FX Go 540'''	NV43 _(110㎚) ^(150㎟)	8:4:8:8	300	128	DDR	225 (450)	128	25
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.2.2.2. Quadro FX (x500M)

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro FX 3500M'''	G71 _(90㎚) ^(196㎟)	24:8:24:16	575	256	GDDR3	600 (1200)	512	45
'''Quadro FX 2500M'''			500
'''Quadro FX 1500M'''		20:7:24:16	375			500 (1000)
'''Quadro FX 550M'''	G73 _(90㎚) ^(125㎟)	12:5:12:8	480	128				35
'''Quadro FX 350M'''	G72 _(90㎚) ^(81㎟)	4:3:4:2	450			450 (900)	256	15

<-9><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== G80(Tesla) 마이크로아키텍처 ========= Quadro FX (x600M) =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)
<colbgcolor=black><colcolor=#76b900> '''FX 3600M'''	G92 _(65㎚) ^(324㎟)	96:48:16 (6, 12)	500 ^(코어) 1250 ^(셰이더)	256	GDDR3	800 (1600)	512	70
'''FX 2600M'''	G92 _(65㎚) ^(324㎟)	64:32:16 (4, 8)	500 ^(코어) 1250 ^(셰이더)	256		799 (1598)		70
'''FX 1600M'''	G84 _(80㎚) ^(169㎟)	32:16:8 (2, 4)	625 ^(코어) 1250 ^(셰이더)	128		800 (1600)		50
'''FX 360M'''	G86 _(80㎚) ^(127㎟)	16:8:4 (1, 2)	400 ^(코어) 800 ^(셰이더)	64	DDR2	600 (1200)	256	17
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.2.2.3. Quadro FX (x700M)

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)	TDP ^(W)
<colbgcolor=black><colcolor=#76b900> '''FX 3700M'''	G92 _(65㎚) ^(324㎟)	128:64:16 (8, 16)	550 ^(코어) 1375 ^(셰이더)	256	GDDR3	800 (1600)	1024	75
'''FX 2700M'''	G94 _(65㎚) ^(240㎟)	48:24:16 (3, 6)	530 ^(코어) 1325 ^(셰이더)	256		799 (1598)	512	65
'''FX 1700M'''	G96 _(65㎚) ^(144㎟)	32:16:8 (2, 4)	625 ^(코어) 1550 ^(셰이더)	128		800 (1600)		50
'''FX 770M'''	G96 _(65㎚) ^(144㎟)		500 ^(코어) 1250 ^(셰이더)			800 (1600)		35
'''FX 570M'''	G84 _(80㎚) ^(169㎟)		475 ^(코어) 950 ^(셰이더)			700 (1400)		45
'''FX 370M'''	G98 _(65㎚) ^(86㎟)	8:4:4 (1, 1)	550 ^(코어) 1400 ^(셰이더)	64		600 (1200)	256	20

<-9><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

===== Quadro FX (x800M) =====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)
<colbgcolor=black><colcolor=#76b900> '''FX 3800M'''	G92 _(65㎚) ^(324㎟)	128:64:16 (8, 16)	675 ^(코어) 1650 ^(셰이더)	256	GDDR3	1000 (2000)	1024	100
'''FX 2800M'''	G92 _(65㎚) ^(324㎟)	96:48:16 (6, 12)	600 ^(코어) 1500 ^(셰이더)	256	GDDR3	1000 (2000)		75
'''FX 1800M'''	GT215 _(40㎚) ^(144㎟)	72:24:8 (3, 9)	561 ^(코어) 1125 ^(셰이더)	128	GDDR5	550 (2200)		45
'''FX 880M'''	GT216 _(40㎚) ^(100㎟)	48:16:8 (2, 6)	500 ^(코어) 1250 ^(셰이더)	128	GDDR3	790 (1580)		35
'''FX 380M'''	GT218 _(40㎚) ^(57㎟)	16:8:4 (1, 2)	550 ^(코어) 1400 ^(셰이더)	64	GDDR3	790 (1580)	512	25
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.2.3. Fermi 마이크로아키텍처

2.2.3.1. Quadro (x000M)

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''5010M'''	GF110 _(40㎚) ^(520㎟)	384:48:32 (3, 12)	450 ^(코어) 900 ^(셰이더)	512	256	GDDR5	650 (2600)	4	100
'''5000M'''	GF100 _(40㎚) ^(529㎟)	320:40:32 (3, 10)	405 ^(코어) 810 ^(셰이더)				600 (2400)	1.75
'''4000M'''	GF104 _(40㎚) ^(332㎟)	336:56:32 (2, 7)	475 ^(코어) 950 ^(셰이더)				625 (2500)	2
'''3000M'''		240:40:32 (2, 5)	450 ^(코어) 900 ^(셰이더)						75
'''2000M'''	GF106 _(40㎚) ^(238㎟)	192:32:16 (1, 4)	550 ^(코어) 1100 ^(셰이더)	256	128	DDR3	900 (1800)		55
'''1000M'''	GF108 _(40㎚) ^(116㎟)	96:16:4 (1, 2)	700 ^(코어) 1400 ^(셰이더)						45
'''500M'''								1	35

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GF100, GF110 칩셋 한정 → (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
GF104, GF106, GF108 칩셋 한정 → (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== Kepler 마이크로아키텍처 ========= Quadro Kx000M =====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		CUDA:TMU:ROP ^{(GPC, SMX)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''K5000M'''	GK104 _(28㎚) ^(294㎟)	1344:112:32 (4, 7)	601 ^(기본)	512	256	GDDR5	750 (3000)	4	100
'''K4000M'''		960:80:32 (3, 5)					700 (2800)
'''K3000M'''		576:48:32 (2, 3)	654 ^(기본)					2	75
'''K2000M'''	GK107 _(28㎚) ^(118㎟)	384:32:16 (1, 2)	745 ^(기본)	256	128	DDR3	900 (1800)		55
'''K1000M'''		192:16:16 (1, 1)	850 ^(기본)						45
'''K500M'''		192:16:8 (1, 1)		128	64		800 (1600)	1	35
'''K200M'''
'''K100M'''
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.2.3.2. Quadro Kx100M

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SMX)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''K5100M'''	GK104 _(28㎚) ^(294㎟)	1536:128:32 (4, 8)	771 ^(기본)	512	256	GDDR5	900 (3600)	8	100
'''K4100M'''		1152:96:32 (3, 6)	706 ^(기본)				800 (3200)	4
'''K3100M'''		768:64:32 (2, 4)							75
'''K2100M'''	GK106 _(28㎚) ^(221㎟)	576:48:16 (2, 3)	667 ^(기본)	256	128		752 (3016)	2	55
'''K1100M'''	GK107 _(28㎚) ^(118㎟)	384:32:16 (1, 2)	706 ^(기본)				700 (2800)		45
'''K610M'''	GK208 _(28㎚) ^(87㎟)	192:16:8 (1, 1)	980 ^(기본)	128	64		650 (2600)	1	30
'''K510M'''			846 ^(기본)				600 (2400)

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== Maxwell 마이크로아키텍처 ========= Quadro Kx200M =====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(GPC, SMM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)		TDP ^(W)
<colbgcolor=black><colcolor=#76b900> '''K2200M'''	GM107 _(28㎚) ^(148㎟)	640:40:16 (1, 5)	667 ^(기본)	2	128	GDDR5	1253 (5012)	2	65
'''K620M'''	GM108 _(28㎚) ^(81㎟)	384:24:8 (1, 3)	1029 ^(기본)	1	64	DDR3	900 (1800)	2	30
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.2.3.3. Quadro Mx000M

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SMM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''M5000M'''	GM204 _(28㎚) ^(398㎟)	1536:96:64 (3, 12)	975 ^(기본)	2	256	GDDR5	1253 (5012)	8	100
'''M4000M'''		1280:80:64 (3, 10)						4
'''M3000M'''		1024:64:32 (2, 8)	1050 ^(기본)	1	128				75
'''M2000M'''	GM107 _(28㎚) ^(148㎟)	640:40:16 (1, 5)	1029 ^(기본) 1098 ^(부스트)	2					55
'''M1000M'''		512:32:16 (1, 4)	993 ^(기본)					2	40
'''M600M'''		384:24:8 (1, 3)	1029 ^(기본) 1124 ^(부스트)						30
'''M500M'''	GM108 _(28㎚) ^(81㎟)			1	64	DDR3	900 (1800)

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

===== Quadro Mxx00 =====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(GPC, SMM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)		TDP ^(W)
<colbgcolor=black><colcolor=#76b900> '''M5500'''	GM204 _(28㎚) ^(398㎟)	2048:128:64 (4, 16)	861 ^(기본) 1038 ^(부스트)	2	256	GDDR5	1753 (7012)	8	150
'''M2200'''	GM206 _(28㎚) ^(228㎟)	1024:64:32 (2, 8)	1025 ^(기본)	1	128		1375 (5500)	4	55
'''M1200'''	GM107 _(28㎚) ^(148㎟)	640:40:16 (1, 5)	1093 ^(기본)	2	128		1253 (5012)	4	45
'''M620'''	GM107 _(28㎚) ^(148㎟)	512:32:16 (1, 4)	756 ^(기본) 977 ^(부스트)	2	128			2	30
'''M520'''	GM108 _(28㎚) ^(81㎟)	384:24:8 (1, 3)	1041 ^(기본)	1	64			2	25
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.2.4. Pascal 마이크로아키텍처

2.2.4.1. Quadro Pxx00

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''P5200'''	GP104 _(16㎚) ^(314㎟)	2560:160:64 (4, 20)	1556 ^(기본) 1746 ^(부스트)	2	256	GDDR5	1800 (7200)	16	100
'''P5000'''		2048:128:64 (4, 16)	1278 ^(기본) 1582 ^(부스트)				1502 (6008)
'''P4200'''		2304:144:64 (4, 18)	1227 ^(기본) 1647 ^(부스트)					8
'''P4000'''		1792:112:64 (3, 14)	1227 ^(기본)
'''P3200'''			1328 ^(기본) 1476 ^(부스트)	1.5	192		1753 (7012)	6	75
'''P3000'''		1280:80:48 (2, 10)	1088 ^(기본) 1215 ^(부스트)
'''P2000'''	GP107 _(16㎚) ^(132㎟)	768:48:32 (1, 6)	1557 ^(기본) 1607 ^(부스트)	1	128		1502 (6008)	4	50
'''P1000'''		512:32:16 (1, 4)	1303 ^(기본) 1493 ^(부스트)						40
'''P600'''		384:24:16 (1, 3)	1430 ^(기본) 1557 ^(부스트)				1253 (5012)		25
'''P500'''	GP108 _(16㎚) ^(74㎟)	256:16:16 (1, 2)	1228 ^(기본) 1455 ^(부스트)	0.5	64			2	18

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

===== Quadro Pxx00 Max-Q =====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		CUDA:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''P5200 Max-Q'''	GP104 _(16㎚) ^(314㎟)	2560:160:64 (4, 20)	1316 ^(기본) 1569 ^(부스트)	2	256	GDDR5	1804 (7216)	16	100
'''P4000 Max-Q'''		1792:112:64 (4, 14)	1114 ^(기본) 1228 ^(부스트)				1502 (6008)	8
'''P3200 Max-Q'''			1139 ^(기본) 1404 ^(부스트)	1.5	192		1753 (7012)	6	75
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

2.2.5. Turing 마이크로아키텍처

2.2.5.1. Quadro RTX

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TS:TMU:RT:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''RTX 5000'''	TU104 _(12㎚) ^(545㎟)	3072:384:192:48:64 (6, 48)	^(기본) ^(부스트)	4	256	GDDR6	1750 (14000)	16	110
'''RTX 4000'''		2560:320:160:40:64 (5, 40)	1110 ^(기본) 1560 ^(부스트)					8
'''RTX 3000'''	TU106 _(12㎚) ^(445㎟)	2304:288:144:36:48 (5, 36)	945 ^(기본) 1380 ^(부스트)					6	60~80
'''RTX T2000'''	TU117 _(12㎚) ^(200㎟)	1024:0:64:0:32 (2, 0)	1575 ^(기본) 1785 ^(부스트)	1	128	GDDR5	2000 (8000)	4	60
'''RTX T1000'''		896:0:56:0:32 (2, 0)	1395 ^(기본) 1455 ^(부스트)						40~50

<-11><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

===== Quadro RTX Max-Q =====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TS:TMU:RT:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)		TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''RTX 5000 Max-Q'''	TU104 _(12㎚) ^(545㎟)	3072:384:192:48:64 (6, 48)	600 ^(기본) 1350 ^(부스트)	4	256	GDDR6	1750 (14000)	16	80
'''RTX 4000 Max-Q'''	TU104 _(12㎚) ^(545㎟)	2560:320:160:40:64 (5, 40)	1005 ^(기본) 1200 ^(부스트)				1625 (13000)	8	80
'''RTX 3000 Max-Q'''	TU106 _(12㎚) ^(445㎟)	2304:288:144:36:48 (5, 36)	600 ^(기본) 1215 ^(부스트)				1625 (13000)	6	60
'''RTX T2000 Max-Q'''	TU117 _(12㎚) ^(200㎟)	1024:0:64:0:32 (2, 0)	^(기본) ^(부스트)	1	128	GDDR5	2000 (8000)	4	40
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

3. NVS 제품군

2003년부터 등장한 비즈니스 멀티 모니터 출력용 제품군으로, 본래 쿼드로에서 파생된 녀석이라 2009년까지는 제품명이 NVS 앞에 쿼드로가 붙여 있었다가 2010년 이후에 출시된 제품부터 쿼드로를 뺀 것이 현재의 모습이다. 멀티 모니터용으로써는 과거엔 매트록스가 꽉 잡고 있었기 때문에 지포스에서는 좀처럼 볼 수 없는 하위 GPU를 2개 붙인 형태의 제품을 통해 멀티 모니터 지원을 꽤 하기도 했지만 현재까지도 인지도는 낮은 편. 2015년 11월에 발매한 맥스웰 아키텍처 기반의 NVS 810이 최신 NVS 제품으로 이 제품이 나와서야 멀티 모니터 출력용 그래픽 카드에 걸맞는 스펙을 갖추었다. 최대 8개의 디스플레이 출력을 지원하는데 80만원을 호가할 만큼 만만한 제품이 아니다. 이보다 하위 제품은 최대 4개로 4개의 출력은 지포스 제품군에서도 흔하게 볼 수 있어서 4개 이하의 모니터 출력만큼은 효용성이 많이 줄어든 상태. 가격 대비 더 많은 모니터 출력 지원이라면 NVIDIA보단 차라리 AMD 라데온을 알아보는게 더 나을 정도.
쿼드로와 마찬가지로 NVS도 랩톱용 제품군이 존재한다. 그런데 저렴한 중고 워크스테이션 랩톱을 구한답시고 알아본 그래픽의 스펙이 NVS가 붙은 경우가 제법 많이 보이는데 광고 카탈로그에도 NVS 계열 모델에 대한 제원이 자세하지 않은 경우가 많아서 뭔가 좋아보이는 네이밍으로 착각해 낭패볼 수 있으니 주의할 것. NVS는 지금까지 NVS 510M(G71 칩셋 즉 지포스 Go 7900 GTX)을 제외하면 메인스트림 이상의 체급인 칩셋이 사용된 적이 별로 없고 로우엔드 칩셋이 주로 사용되는 멀티 모니터 출력용인 모델이다. 그래픽 정밀 렌더링용 중고 워크스테이션 랩톱을 알아보고 있는데 뭐가 뭔지 잘 모르겠다면 너무 저렴해 보이는 워크스테이션 랩톱은 일단 거르는 것이 좋은데 쿼드로가 아닌 NVS가 탑재된 제품일 확률이 높다.
NVS에 대한 정보는 해당 공식 홈페이지에서도 확인할 수 있다.[2][3]

3.1. NVS 데스크톱용 제품군

3.1.1. NV10(Celsius) 마이크로아키텍처

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PP:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro 4 100 NVS'''	NV17 _(150㎚) ^(65㎟)	2:4:2	250	128	DDR	166 (332)	64	?	?
'''Quadro 4 200 NVS'''						250 (500)		?	?
'''Quadro 4 400 NVS PCI'''			220			166 (332)		?	?
'''Quadro NVS 280 PCI'''	NV18 _(150㎚) ^(65㎟)		275			250 (500)		?	?
'''Quadro NVS 280 SD'''			250	64		200 (400)		?	?
'''Quadro NVS 55 PCI'''								?	?
'''Quadro NVS 50 PCI'''								?	?

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

[2] 직접 4200M을 사용해본 결과, 게임은 마인크래프트 하옵이 일부 경우 40을 넘지 못하지만, 경우에 따라 1440P 유튜브 영상은 네트워크가 좋다는 전제 하에 '''재생 가능.''' avi 같은 파일로 1440P 영상은 당연하게 재생이 가능하다. 전체적 시스템은 i5-2520M+8GB 랩톱용 DDR3 메모리 싱글채널+HM65 칩셋+Windows 7+SanDisk 256G SSD이며 유튜브는 버전 54 베타 채널이다.[3] 모바일용으로는 페르미 기반(GF108, GF117) 칩셋 모델까지만 나왔다.

==== NV30(Rankine) 마이크로아키텍처 ====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 280 AGP'''	NV34 _(150㎚) ^(91㎟)	4:1:4:4	275	128	DDR	250 (500)	64	?	?
'''Quadro NVS 280 PCIe'''	NV37 _(150㎚) ^(91㎟)							13	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

3.1.2. NV40(Curie) 마이크로아키텍처

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)	TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 440'''	NV43 _(110㎚) ^(150㎟)	8:4:8:8 x2	275	128 x2	DDR	250 (500)	128 x2	31	?
'''Quadro NVS 285'''	NV44 _(150㎚) ^(91㎟)	4:3:4:2	275	128	DDR	250 (500)	128	18	?

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== G80(Tesla) 마이크로아키텍처 ====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)		TDP ^(W)	출고 가격 ^($)
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 290'''	G86 _(80㎚) ^(127㎟)	16:8:4 (1, 2)	459 ^(코어) 918 ^(셰이더)	64	DDR2	400 (800)	256	21	149
'''Quadro NVS 295'''	G98 _(65㎚) ^(86㎟)	8:8:4 (1, 1)	540 ^(코어) 1300 ^(셰이더)	64	GDDR3	695 (1390)	256	23	?
'''Quadro NVS 420'''		8:8:4 x2 (1 x2, 1 x2)	550 ^(코어) 1400 ^(셰이더)	64 x2		700 (1400)	256 x2	40	?
'''Quadro NVS 450'''		8:8:4 x2 (1 x2, 1 x2)	480 ^(코어) 1200 ^(셰이더)	64 x2		700 (1400)	256 x2	35	?
'''NVS 300'''	GT218 _(40㎚) ^(57㎟)	16:8:4 (1, 2)	520 ^(코어) 1230 ^(셰이더)	64		790 (1380)	512	18	109
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

3.1.3. Fermi 마이크로아키텍처

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''NVS 310'''	GF119 _(40㎚) ^(79㎟)	48:8:4 (1, 1)	523 ^(코어) 1046 ^(셰이더)	128	64	DDR3	875 (1750)	0.5	20	159
'''NVS 315'''								1	19

<-11><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== Kepler 마이크로아키텍처 ====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)	<rowcolor=white> 모델명	CUDA:TMU:ROP ^{(GPC, SMX)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)		TDP ^(W)	출고 가격 ^($)
'''NVS 510'''	GK107 _(28㎚) ^(118㎟)	192:16:16 (1, 1)	797 ^(기본)	256	128	DDR3	891 (1782)	2	35	449
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

3.1.4. Maxwell 마이크로아키텍처

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)	TDP ^(W)	출고 가격 ^($)
'''NVS 810'''	GM107 _(28㎚) ^(148㎟)	512:32:16 x2 (1 x2, 4 x2)	902 ^(기본) 1033 ^(부스트)	0.5 x2	64 x2	DDR3	900 (1800)	2 x2	68	?

<-11><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

=== NVS 모바일용 제품군 ======= NV40(Curie) 마이크로아키텍처 ====	<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		PS:VS:TMU:ROP	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 510M'''	G71 _(90㎚) ^(196㎟)	24:8:24:16	450	128	GDDR3	600 (1200)	256	35
'''Quadro NVS 300M'''	G73 _(90㎚) ^(125㎟)	4:3:4:2	500			700 (1400)		16
'''Quadro NVS 120M'''	G72 _(90㎚) ^(81㎟)		450	64	DDR2		512	10
'''Quadro NVS 110M'''			300		DDR	300 (600)
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s] (GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s] (GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

3.1.5. G80(Tesla) 마이크로아키텍처

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)
<colbgcolor=black><colcolor=#76b900> '''Quadro NVS 320M'''	G84 _(80㎚) ^(169㎟)	32:16:8 (1, 2)	575 ^(코어) 1150 ^(셰이더)	128	GDDR3	700 (1400)	512	20
'''Quadro NVS 160M'''	G98 _(65㎚) ^(86㎟)	8:8:4 (1, 1)	580 ^(코어) 1450 ^(셰이더)	64			256	12
'''Quadro NVS 150M'''			530 ^(코어) 1300 ^(셰이더)					10
'''Quadro NVS 140M'''	G86 _(80㎚) ^(127㎟)	16:8:4 (1, 2)	400 ^(코어) 800 ^(셰이더)	64	DDR2	600 (1200)	512	12
'''Quadro NVS 135M'''						594 (1188)	256	10
'''Quadro NVS 130M'''		8:4:4 (1, 1)			DDR	700 (1400)
'''NVS 5100M'''	GT216 _(40㎚) ^(100㎟)	48:16:8 (2, 6)	550 ^(코어) 1210 ^(셰이더)	128	GDDR3	800 (1600)	1024	35
'''NVS 3100M'''	GT218 _(40㎚) ^(57㎟)	16:8:4 (1, 2)	606 ^(코어) 1468 ^(셰이더)	64		790 (1580)	512	14
'''NVS 2100M'''			535 ^(코어) 1230 ^(셰이더)					11

<-9><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== Fermi 마이크로아키텍처 ====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		CUDA:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''NVS 5400M'''	GF108 _(40㎚) ^(116㎟)	96:16:4 (1, 2)	660 ^(코어) 1320 ^(셰이더)	256	128	DDR3	900 (1800)	2 [4] 다만 제조사에 따라 1기가만 장착하는 경우도 있다.	35
'''NVS 5200M'''			672 ^(코어) 1344 ^(셰이더)	128	64	GDDR5	785 (3140)	1	25
	GF117 _(28㎚) ^(116㎟)					DDR3	900 (1800)
'''NVS 4200M'''	GF119 _(40㎚) ^(79㎟)	48:8:4 (1, 1)	810 ^(코어) 1620 ^(셰이더)				800 (1600)
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

4. 데이터 센터 GPU 제품군 (구 Tesla)

2020년 5월까지 사용되던 상표는 '''Tesla'''
2007년 5월부터 내놓은 상표로, GPU가 게임용 연산에만 사용되는 것이 아닌 범용 연산(GPGPU)용으로 확대되면서 고성능 연산 작업을 목적으로 하는 곳을 공략하기 위한 제품군이다. Tesla도 알맹이는 지포스와 같지만 대체로 디스플레이 출력 단자가 없는데다 연산에 주로 사용되기 때문에 GPU 내부에 있는 텍스처 유닛과 ROP이 쓸 일은 없다. 게임 그래픽과는 거리가 먼 분야에 사용되기 때문. 물론 페르미 아키텍처 기반의 일부 제품 한정으로 DVI 단자 1개가 탑재되기도 했지만 케플러 아키텍처부터는 디스플레이 단자가 다시 빠지면서 지금까지 이어져오고 있다. 명색이 전문가를 넘어선 데이터 센터를 주로 공략하는 시장인만큼 가격도 매우 비싼 편인데 지포스와 같은 GPU라 훨씬 저렴한 지포스로 연산 작업을 하면 되지 않겠냐고 반문할 수도 있지만, 쿼드로와 마찬가지로 Tesla용 드라이버가 따로 있고 단일 GPU인 제품은 주로 하위 라인에나 해당되는 제품이지 최상위로 올라가면 GPU가 2개는 물론이고 4개를 한 기판에 탑재된 쿼드 GPU 타입 제품도 있다. GPU를 복수로 붙이면서 전력 소모량, 발열, 부피를 감안해서라도 당대 최고의 고성능 연산을 구현하는 것을 추구하는 방향이기 때문이다. 테슬라는 탑재 대상 컴퓨터들이 최소 워크스테이션에서 최대로는 슈퍼 컴퓨터와 데이터 센터급이며 소비 전력이 엄청 나기 때문에 모바일 제품군이 없다.
2020년 5월에 브랜드가 폐지되었는데. 모 자동차 회사와의 혼동 때문이라는게 공식적인 설명이다. 엔비디아 역시 자율주행 자동차 사업에 진출해 있고 여기에 사용되는 연산용 GPGPU의 명칭이 가장 큰 경쟁사의 명칭과 겹친다는게 좀 아니라고 생각했는듯. 이후 출시된 RTX A100부터는 '''데이터 센터 GPU'''라는 명칭으로 불리고 있다.( )

4.1. G80(Tesla) 마이크로아키텍처

<rowcolor=white> 모델명	GPU			그래픽 메모리				TDP ^(W)	출고 가격 ^($)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(TPC, SM)}	클럭 ^(MHz)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(MB)
<colbgcolor=black><colcolor=#76b900> '''S870'''	G80 _(90㎚) ^(484㎟)	128:32:24 x4 (8 x4, 16 x4)	600 ^(코어) 1350 ^(셰이더)	384 x4	GDDR3	800 (1600)	1536 x4	800	11999
'''D870'''		128:32:24 x2 (8 x2, 16 x2)		384 x2			1536 x2	520	7499
'''C870'''		128:32:24 (8, 16)		384			1536	171	1499
'''S1075'''	G200B _(55㎚) ^(470㎟)	240:80:32 x4 (10 x4, 30 x4)	610 ^(코어) 1296 ^(셰이더)	512 x4			4096 x4	800	?
'''S1070'''									7999
'''C1060'''		240:80:32 (10, 30)		512			4096	188	?
'''M1060'''							2048		1699
'''T10'''							4096		?

<-10><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
G200B 칩셋 한정 → (단정밀도 연산 속도) ÷ 8 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

[4] 다만 제조사에 따라 1기가만 장착하는 경우도 있다.

=== Fermi 마이크로아키텍처 ===	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		CUDA:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''S2050'''	GF100 _(40㎚) ^(529㎟)	448:56:48 x4 (4 x4, 14 x4)	574 ^(코어) 1147 ^(셰이더)	768 x4	384 x4	GDDR5	773 (3092)	3 x4	900	11999
'''M2050'''		448:56:48 (4, 14)	575 ^(코어) 1150 ^(셰이더)	768	384			3	225	2699
'''M2070'''			574 ^(코어) 1150 ^(셰이더)				783 (3132)	6	225	3099
'''M2070-Q'''										5489
'''C2050'''			575 ^(코어) 1150 ^(셰이더)				750 (3000)	3	238	?
'''C2070'''								6		?
'''X2090'''	GF110 _(40㎚) ^(520㎟)	512:64:48 (4, 16)	650 ^(코어) 1300 ^(셰이더)				925 (3700)		225	?
'''X2070'''										?
'''M2090'''									250	?
'''C2090'''										?
'''M2075'''		448:56:48 (4, 14)	574 ^(코어) 1147 ^(셰이더)				783 (3132)		225	2399
'''C2075'''			575 ^(코어) 1150 ^(셰이더)				750 (3000)		247	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS] (GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

4.2. Kepler 마이크로아키텍처

<rowcolor=white> 모델명	GPU			그래픽 메모리				최대 연산 성능		TDP	지원 API
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명	CUDA 코어	클럭	버스	규격	클럭	용량	단정밀도 (FP32) (GFLOPS)	배정밀도 (FP64) (GFLOPS)	TDP	지원 API
<colbgcolor=black><colcolor=#76b900>'''K10'''	2×GK104	2×1536	745MHz	2×256bit	GDDR5	2500MHz (5000MT/s)	2×4GB	4577	190.7	225W	CUDA 3.0
'''K20'''	GK110	2496	706MHz	320bit		2600MHz (5200MT/s)	5GB	3524	1175	225W	CUDA 3.5
'''K20X'''	GK110	2688	732MHz	384bit		2600MHz (5200MT/s)	6GB	3935	1312	235W
'''K40'''	GK110B	2880	745MHz (기본) 875MHz (부스트)	384bit		2500MHz (5000MT/s)	12GB	5040	1680	235W
'''K80'''	2×GK210	2×2496	560MHz (기본) 875MHz (부스트)	2×384bit		2750MHz (5500MT/s)	2×12GB	8736	2912	300W	CUDA 3.7

4.3. Maxwell 마이크로아키텍처

<rowcolor=white> 모델명	GPU			그래픽 메모리				단정밀도(FP32) 최대 연산 성능 (GFLOPS)	TDP	지원 API
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명	CUDA 코어	클럭	버스	규격	클럭	용량	단정밀도(FP32) 최대 연산 성능 (GFLOPS)	TDP	지원 API
<colbgcolor=black><colcolor=#76b900>'''M4'''	GM206	1024	872MHz (기본) 1072MHz (부스트)	128bit	GDDR5	2750MHz (5500MT/s)	4GB	2195	50~75W	CUDA 5.2
'''M6'''	GM204	1536	722MHz (기본) 1051MHz (부스트)	256bit		2300MHz (4600MT/s)	8GB	3229	75~100W
'''M10'''	4×GM107	4×512	1033MHz	4×128bit		2099MHz (5188MT/s)	4×8GB	5289	225W
'''M40'''	GM200	3072	948MHz (기본) 1114MHz (부스트)	384bit		3000MHz (6000MT/s)	12GB	6844	250W
'''M60'''	2×GM204	2×2048	899MHz (기본) 1178MHz (부스트)	2×256bit		2500MHz (5000MT/s)	2×8GB	9650	225~300W

4.4. Pascal 마이크로아키텍처

P100은 GP100 컷칩이면서 HBM2 규격을 채택한 모델로 FP64 연산이 5.3 TFLOPS다. P40과 P4는 각각 GP102 풀칩과 GP104 풀칩을 기반으로 개발된 모델이다.

<rowcolor=white> 모델명

GPU

그래픽 메모리

최대 연산 성능

TDP

지원
API

<rowcolor=white> 칩셋명

CUDA 코어

클럭

버스

규격

클럭

용량

바이트
정수형
(INT8)
(TOPS)

반정밀도
(FP16)
(GFLOPS)

단정밀도
(FP32)
(GFLOPS)

배정밀도
(FP64)
(GFLOPS)

<colbgcolor=black><colcolor=#76b900>'''P4'''

GP104

2560

810MHz
(기본)
1063MHz
(부스트)

256bit

GDDR5

1500MHz
(6000MT/s)

8GB

22

42.5

5443

170.1

50~75W

CUDA 6.1

'''P40'''

GP102

3840

1303MHz
(기본)
1531MHz
(부스트)

384bit

1800MHz
(7200MT/s)

24GB

47

91.9

11758

367.4

250W

'''P100
(PCIe)'''

GP100

3584

1126MHz
(기본)
1303MHz
(부스트)

3072bit

HBM2

703MHz
(1406MT/s)

12GB

-

18680

9340

4670

250W

CUDA 6.0

4096bit

16GB

CUDA 6.0

'''P100
(NVLink)'''

1380MHz
(기본)
1480MHz
(부스트)

21218

10609

5340

300W

CUDA 6.0

4.5. Volta 마이크로아키텍처

일부 잘못된 내용이 있을 수 있으니 주의할 것.

<rowcolor=white> 모델명	GPU			그래픽 메모리				최대 연산 성능		TDP	지원 API
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명	CUDA 코어	클럭	버스	규격	클럭	용량	단정밀도 (FP32) (TFLOPS)	배정밀도 (FP64) (TFLOPS)	TDP	지원 API
<colbgcolor=black><colcolor=#76b900>'''V100 (PCIe)'''	GV100	5120	1245MHz (기본) 1380MHz (부스트)	4096bit	HBM2	877MHz (1754MT/s)	16GB	14	7	250W	?
'''V100 (NVlink)'''			?MHz (기본) 1533MHz (부스트)			877MHz (1754MT/s)	32GB	15.7	7.8	300W	?
'''V100S (PCIe)'''			?MHz (기본) 1600MHz (부스트)			1107MHz (2214MT/s)	32GB	16.4	8.2	300W	?

4.6. Turing 마이크로아키텍처

<rowcolor=white> 모델명

GPU

그래픽 메모리

최대 연산 성능

TDP

지원
API

<rowcolor=white> 칩셋명

CUDA 코어

클럭

버스

규격

클럭

용량

4비트
정수형
(INT4)
(TOPS)

바이트
정수형
(INT8)
(TOPS)

반정밀도
(FP16)
(TFLOPS)

단정밀도
(FP32)
(TFLOPS)

'''T4'''

TU104

2560

585 MHz
(기본)
1590 MHz
(부스트)

256 bit

GDDR6

1250 MHz
(10000 MT/s)

16GB

260.504

130.252

65.126

8.141

70 W

?

5. GRID 제품군

5.1. Kepler 마이크로아키텍처

5.1.1. GRID K1

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SMX)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''K1'''	GK107 _(28㎚) ^(118㎟)	192:16:16 x4 (1 x4, 1 x4)	850 ^(기본)	256 x4	128 x4	DDR3	891 (1782)	4 x4	130	4140
'''K180Q'''		192:16:16 (1, 1)		256	128			1		125
'''K160Q'''
'''K140Q'''
'''K120Q'''								0.5
'''K100'''								0.25		63

<-11><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== GRID K2 ====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		CUDA:TMU:ROP ^{(GPC, SMX)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''K2'''	GK104 _(28㎚) ^(294㎟)	1536:128:32 x2 (4 x2, 8 x2)	745 ^(기본)	512 x2	256 x2	GDDR5	1250 (5000)	4 x2	225	5199
'''K280Q'''		1536:128:32 (4, 8)		512	256			4		1875
'''K260Q'''								2		937
'''K240Q'''								1		469
'''K220Q'''								0.5
'''K200'''								0.25		235
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

5.1.2. GRID K3

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 모델명	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SMX)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)	TDP ^(W)	출고 가격 ^($)
'''K340'''	GK107 _(28㎚) ^(118㎟)	384:32:8 x4 (1 x4, 2 x4)	950 ^(기본)	128 x4	64 x4	GDDR5	900 (3600)	1 x4	225	3299

<-11><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

==== GRID K5 ====	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		CUDA:TMU:ROP ^{(GPC, SMX)}	클럭 ^(MHz)	L2 캐시 ^(KB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''K560Q'''	GK104 _(28㎚) ^(294㎟)	1536:128:32 x2 (4 x2, 8 x2)	745 ^(기본)	512 x2	256 x2	GDDR5	1250 (5000)	4 x2	225	3599
'''K540Q'''
'''K520Q'''
'''K520'''
'''K500'''
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

5.2. Maxwell 마이크로아키텍처

5.2.1. GRID M

<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
	<rowcolor=white> 칩셋명 _(공정) ^(면적)	CUDA:TMU:ROP ^{(GPC, SMM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''M60-8Q'''	GM204 _(28㎚) ^(398㎟)	2048:128:64 (4, 16)	930 ^(기본) 1180 ^(부스트)	2	256	GDDR5	1253 (5012)	8	225	3599
'''M60-4A'''								4		?
'''M60-2Q'''								2		?
'''M60-1Q'''								1		?
'''M6-8Q'''		1536:96:64 (3, 12)	722 ^(기본)					8	100	?
'''M10-8Q'''	GM107 _(28㎚) ^(148㎟)	640:40:16 (1, 5)	1033 ^(기본) 1306 ^(부스트)		128		1300 (5200)		225	?
'''M3-3020'''								2	?	?
'''M40'''		384:32:16 (1, 3)	930 ^(기본) 1000 ^(부스트)				1350 (5400)	4	50	?

<-11><bgcolor=#76b900>

【이론적인 성능 계산식 펼치기 · 접기】: _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}||

_{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}

== Mining 제품군 ==이름에서 보듯 채굴기이다. 그래서 모니터 연결용 단자가 없다. === Pascal 마이크로아키텍처 ===	<rowcolor=white> 모델명	GPU				그래픽 메모리				TDP ^(W)	출고 가격 ^($)
<rowcolor=white> 칩셋명 _(공정) ^(면적)		CUDA:TMU:ROP ^{(GPC, SM)}	클럭 ^(MHz)	L2 캐시 ^(MB)	버스 ^(bit)	규격	클럭 ^(전송률) _(MHz) ^(Mbps)	용량 ^(GB)
<colbgcolor=black><colcolor=#76b900> '''P102-101'''	GP102 _(16㎚) ^(471㎟)	3200:200:80 (5, 25)	1557 ^(기본) 1670 ^(부스트)	2.5	320	GDDR5	2002 (8008)	10	250	?
'''P102-100'''			1481 ^(기본) 1582 ^(부스트)			GDDR5X	1251 (10008)	5		?
'''P104-101'''	GP104 _(16㎚) ^(314㎟)	2560:160:64 (4, 20)	1607 ^(기본) 1733 ^(부스트)	2	256			8	?	?
'''P104-100'''		1920:120:64 (3, 15)						4	?	?
'''P106-100'''	GP106 _(16㎚) ^(200㎟)	1280:80:48 (2, 10)	1506 ^(기본) 1709 ^(부스트)	1.5	192	GDDR5	2002 (8008)	6	120	?
'''P106-090'''		768:48:48 (2, 6)	1354 ^(기본) 1531 ^(부스트)					3	75	?
【이론적인 성능 계산식 펼치기 · 접기】 _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}}}}\|\| _{(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS] (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] (메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]}}}}

}}}

NVIDIA/워크스테이션 GPU

1. 개요

2. Quadro 제품군

2.1. Quadro 데스크톱용 제품군

2.1.1. NV10(Celsius) 마이크로아키텍처

2.1.1.1. Quadro

2.1.1.2. Quadro 4 XGL

2.1.1.3. Quadro 4 XGL

2.1.1.4. Quadro FX (x100)

2.1.2. NV40(Curie) 마이크로아키텍처

2.1.2.1. Quadro FX (x000)

2.1.2.2. Quadro FX (x500)

2.1.2.3. Quadro FX (x700)

2.1.2.4. Quadro CX

2.1.3. Fermi 마이크로아키텍처

2.1.3.1. Quadro (x000)

2.1.4. Maxwell 마이크로아키텍처

2.1.4.1. Quadro M

2.1.5. Volta 마이크로아키텍처

2.1.5.1. Quadro V

2.1.6. Ampere 마이크로아키텍쳐

2.1.6.1. Quadro RTX A6000

2.2. Quadro 모바일용 제품군

2.2.1. NV10(Celsius) 마이크로아키텍처

2.2.1.1. Quadro 4 Go

2.2.2. NV30(Rankine) 마이크로아키텍처

2.2.2.1. Quadro FX Go

2.2.2.2. Quadro FX (x500M)

2.2.2.3. Quadro FX (x700M)

2.2.3. Fermi 마이크로아키텍처

2.2.3.1. Quadro (x000M)

2.2.3.2. Quadro Kx100M

2.2.3.3. Quadro Mx000M

2.2.4. Pascal 마이크로아키텍처

2.2.4.1. Quadro Pxx00

2.2.5. Turing 마이크로아키텍처

2.2.5.1. Quadro RTX

3. NVS 제품군

3.1. NVS 데스크톱용 제품군

3.1.1. NV10(Celsius) 마이크로아키텍처

3.1.2. NV40(Curie) 마이크로아키텍처

3.1.3. Fermi 마이크로아키텍처

3.1.4. Maxwell 마이크로아키텍처

3.1.5. G80(Tesla) 마이크로아키텍처

4. 데이터 센터 GPU 제품군 (구 Tesla)

4.1. G80(Tesla) 마이크로아키텍처

4.2. Kepler 마이크로아키텍처

4.3. Maxwell 마이크로아키텍처

4.4. Pascal 마이크로아키텍처

4.5. Volta 마이크로아키텍처

4.6. Turing 마이크로아키텍처

5. GRID 제품군

5.1. Kepler 마이크로아키텍처

5.1.1. GRID K1

5.1.2. GRID K3

5.2. Maxwell 마이크로아키텍처

5.2.1. GRID M

6. 관련 문서