1. 개요
2018년 12월에 출시된 튜링 아키텍처 기반의 TITAN.
2. 제원
<rowcolor=white> 그래픽 카드 모델명
| GPU
| 그래픽 메모리
| TDP (W)
| 출고 가격 ($)
|
<rowcolor=white> 이름 (공정) (면적)
| FP32:INT32:TC:TMU:ROP (RE, PME, RTC)
| 클럭 (부스트) (MHz)
| L2 캐시 메모리 (MB)
| 버스 (bit)
| 규격
| 클럭 (비트레이트) (MHz) (Mbps)
| 용량 (GB)
|
<color=white> '''데스크탑용 제품군'''
|
<colbgcolor=black><colcolor=#B2A384> '''TITAN RTX'''
| TU102 (12 ㎚) (754 ㎟)
| 4608:4608:576:288:96 (6, 36, 72)
| 1350 (1770)
| 6
| 384
| GDDR6
| 1750 (14000)
| 24
| 280
| 2499
|
<color=white> - 【이론적인 성능 계산식 펼치기 · 접기】
'''< 범용 연산 성능 >''' (GPU 클럭) × (FP32 유닛의 개수) × 2 ÷ 1000 = (FP32 연산 속도) [GFLOPS] (FP32 연산 속도) ÷ 32 = (FP64 연산 속도) [GFLOPS] (GPU 클럭) × (TC의 개수) × 2 × 64 ÷ 1000 = (FP16 연산 속도) [GFLOPS] (GPU 클럭) × (INT32 유닛의 개수) ÷ 1000 = (INT32 연산 속도) [GIPS] (FP16 연산 속도) × 2 = (INT8 연산 속도) [GOPS] (FP16 연산 속도) × 4 = (INT4 연산 속도) [GOPS] '''< 특수 연산 성능 >''' (GPU 클럭) × (PME의 개수) ÷ 2 ÷ 1000 = (삼각형 생성 개수) [GTriangles/s] (GPU 클럭) × (RE의 개수) × 16 ÷ 1000 = (래스터라이제이션) [GPixels/s] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] TITAN RTX의 레이 트레이싱 연산 속도 → 11 [GigaRays/s] = 110 × 1000 [GFLOPS] {(FP32 연산) × 0.8 ÷ 1000} + {(INT32 연산) × 0.28 ÷ 1000} + {(FP16 연산) × 0.2 ÷ 1000} + {(레이 트레이싱 연산) × 0.4 ÷ 1000} = RTX-OPS [TeraOPS] TITAN RTX의 RTX-OPS → 84 [TeraOPS] (GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s] (GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s] '''< 그래픽 메모리 성능 >''' (메모리 버스) ÷ 8 × (메모리 비트레이트) ÷ 1000 = (메모리 대역폭) [GB/s]
|
<color=white>- 【용어 전체 이름 펼치기 · 접기】
Single-Precision Floating-Point = FP32 Double-Precision Floating-Point = FP64 Half-Precision Floating-Point = FP16 32-bit Integer = INT32 8-bit Integer = INT8 4-bit Integer = INT4 CUDA Core = CC Compute Unified Device Architecture = CUDA Tensor Core = TC Texture Mapping Unit = TMU Render Output Pipeline = ROP Raster Engine = RE PolyMorph Engine = PME RT Core = RTC Thermal Design Power = TDP Total Graphics Power = TGP Graphics Card Power = GCP Max Power Consumption = MPC
|
3. 상세
보통 최상위 빅칩으로 사용된 모델은 수율, 전력 소모, 발열량과 타협하느라 차상위 빅칩에 사용된 모델보다 낮은 GPU 클럭으로 나오는 경향이 있는데 이례적으로 부스트 클럭이 RTX 2080 Ti FE의 1635MHz는 물론이고, 가장 높았던 RTX 2080 FE의 1800MHz보다는 살짝 떨어지는 수준으로 상당히 높은 편이다. 하지만, 그 정도 클럭 차이라고 해서 게임 실성능 차이가 큰 것이 아닌데다 격차가 있어도 가격 대비 유의미하다고 보기 어렵다. 그래도 2세대 맥스웰 아키텍처 기반의 GTX TITAN X와 GTX 980 Ti의 관계처럼 RTX 2080 Ti와의 그래픽 메모리 용량 차이가 2배 이상으로 차등된 덕분에 대용량 그래픽 메모리를 필요로 하는
워크스테이션 소비자들에겐 가성비가 매우 높은 그래픽 카드라 각광 받고 있는 중이다.
국내 하드웨어 사이트 중에서는
퀘이사존에서 최초로 TITAN RTX 벤치마크를 공개하였다.
벤치마크 결과를 보면, 게임 성능은 RTX 2080 Ti보다 고작 5~6% 높은 것에 그친다. 이정도면 이전 세대인 TITAN Xp와 GTX 1080 Ti의 성능 격차와 비슷한 비율인데다 RTX 2080 Ti의 부스트 클럭을 FE 이상으로 오버클럭할 경우 TITAN RTX 성능을 가볍게 맛볼 수 있다. 하지만 쿼드로 계열 엔비디아 그래픽카드가 힘을 잘 쓰는 전문 그래픽 작업 영역에서 TITAN RTX는 RTX 2080 Ti를 완전히 압도하는 성능을 내어준다. TITAN Xp의 전례와 같이 작업 성능을 봉인 해제한 개념으로 봐도 좋을 듯.
다만 불량률이 높은
GeForce 20과 같은 세대라서
TITAN RTX 역시 불량이 보고되고 있다.
4. 출처