퀄컴 Adreno GPU
1. 개요
퀄컴에서 설계하는 GPU 브랜드. 퀄컴의 모바일 AP 브랜드인 퀄컴 스냅드래곤 시리즈 전용으로 사용된다.
2. 상세
전신은 ATI의 모바일 그래픽 사업부다. 퀄컴이 Imageon으로 대표되는 해당 사업부를 인수하여 개발한 것이다. 따라서, 명칭 역시 Radeon의 스펠링 배열을 바꿔서 Adreno로 정했다고 한다.
전통적으로 버텍스#s-2 성능은 꽤 괜찮은 편에 비해 픽셀 처리능력은 떨어진다. 때문에 버텍스 위주의 벤치마크가 있다면 역시 점수는 잘 나오겠지만 모바일 게임들을 보면 폴리곤#s-2은 적당히 적게 사용하고 그 위에 텍스처를 좀 발라주는 형식인데 이런 게임들은 당연히 픽셀 필레이트가 버텍스보다 비교적 딸리는 Adreno GPU에 별로 맞지 않는 형태. 당연히 버텍스에 중점을 두는 벤치마크는 ARM Mali 그래픽보다 잘 나온다. ARM Mali-400 쿼드코어 기준, 버텍스 프로세서 하나에 픽셀 담당 프로세서가 네 개나 박혀있다. 반면 실 성능이라 볼 수 있는 게임 성능이 딸린다는 것이다.
이는 플레이스테이션 3의 CELL-Broadband Engine과 거의 판박이인 특징으로, 모바일 기기의 고성능화에 따라 이러한 하드웨어 사양을 활용할 수 있는 애플리케이션들이 차차 나오겠지만 지금으로써는 비교적 효용성이 낮은 하드웨어 사양을 갖췄는데 거의 비슷한 특성을 지닌 플레이스테이션 3의 CELL-Broadband Engine도 언젠가는 플레이스테이션 3용 부동소수점 프로그램 나올거다라는 말이 '''차기작이 나올 때까지''' 반복되었던 것을 떠올리면 희망이 보이지 않는다.
다만, 2012년 말부터 FP32 연산능력이나 텍스처 필레이트 등이 ARM Mali 그래픽보다 더 높은 모습을 보여주고 있다. 최근 AP로 예를 들면, 엑시노스 7 Octa (5433)의 ARM Mali-T760 헥사코어와 스냅드래곤 805 APQ8084의 Adreno 420의 GFX벤치 맨하탄 오프스크린 수치는 각각 17fps, 19fps로 측정되고, 엑시노스 7420의 ARM Mali-T760 옥타코어와 스냅드래곤 810 MSM8994의 Adreno 430은 거의 동급의 성능을 보여준다. 또한 GFX벤치 맨하탄 3.1에서도 ARM Mali-T760 옥타코어보다 약간의 우위를 보여 준다. 하지만 스냅드래곤 810 MSM8994의 경우 제조사들이 알아서 GPU 클럭을 500 MHz 대로 낮추고 있기에 실질적으로는 차이가 나 보인다고 한다. 훨씬 심각한 문제가 있었기 때문에... 삼성 엑시노스 7420이 아닌 7410의 Mali-T760과 경쟁해야 하는 성능이 나온다.
GPU 벤치마크 중 로우레벨쪽 GPU 내부 연산 ALU 모듈의 결과만을 보면 거의 항상 타 업체보다 다소 높은 성능을 보여 주는데, 실질적인 하이레벨 결과는 큰 차이가 없다는 점에서 내부적으로 많은 병목 현상이 있는 것이 아니냐는 추측이 있다.
ARM Mali 그래픽과 비교하면 최신 API 지원을 잘 안 해주는 편이다. ARM Mali가 최신 API 지원이 가장 빠르고, 최신 API에서 아드레노보다 약간 낮은 GPU 성능을 후속 드라이버 업데이트로 서서히 올려 주는 타입이라면, 아드레노는 그냥 API 지원을 거의 안 해 준다(...)
3. 제품 목록
3.1. 1XX
- Adreno 130
3.2. 2XX
퀄컴 스냅드래곤의 초창기 시절부터 S4까지 함께한 시리즈이다.
전체적인 Adreno 2xx 시리즈의 특징을 살펴보자면 픽셀 성능이 낮은 대신에 통합 셰이더 아키텍처의 특성 상 높은 부동소수점 연산 성능이 버텍스 성능의 향상으로 이어져서 그 당시에는 좋은 소리를 못 들었으나, GL 벤치마크가 GFX 벤치마크로 업데이트 되고 버전이 올라갈수록 점점 버텍스, 높은 연산 성능의 반영비중이 상승하여 타사의 GPU 대비 상대적인 위치가 많이 상승하였다.
- Adreno 200
- Adreno 203
- Adreno 205
사실 이 시기까지는 GPU 성능 비교 자체가 생소한 개념이고 그 당시 사용하던 벤치마크인 쿼드런트나 안투투도 CPU나 다른 요소의 비중이 높아서 별 다른 평가가 존재하지 않는다(...)
- Adreno 220
네이밍에서 두자릿수가 바뀐 만큼 전작 205 대비 성능이 2배 상승했지만 GL 벤치마크 2.1, 2.5 모두 삼성 엑시노스 4210의 Mali-400보다는 물론이고, Apple A5의 SGX543 MP2보다 낮은 실성능을 보여주었다.
- Adreno 225
GL 벤치마크 2.1상에서는 갤럭시 S2의 ARM Mali-400 MP4 266MHz와 비슷한 성능을 보여 준다. 위에서 말했듯이 그 당시의 사용환경을 감안하면 2.1이 실제로 체감되'''던''' 성능이다. 2.5 결과를 보면 동시기에 나와서 경쟁하던 엑시노스 4412의 Mali-400 MP4 440MHz[1] 보다 낮은 성능을 보여 준다. GFX 벤치마크 2.7의 결과를 봐도 결국 엑시노스 4412의 Mali-400을 잡지 못한 걸로 보인다. 사실 이 비교는 5fps 이하의 비교라서 오차범위에 따른 편차때문에 의미가 없긴 하다. 이 시기에 Krait 코어를 쿼드코어로 탑재하고 아드레노 320 같은 고성능, 고전력소모 GPU를 모바일 AP에 탑재하면서 본격적인 성능 경쟁이 일어났고 전력소모의 과도한 상승으로 인해 쓰로틀링이 이시기부터 급격히 심해졌다. 당장 예전 Mali-400의 전력소모를 보면 수백 mW 수준이고 엑시노스 5250은 CPU, GPU 전력 소모가 각각 4W에 달해서 휴대폰 탑재는 꿈도 못 꿨지만 지금 통상적으로 사용되는 스마트폰용 모바일 AP는 CPU, GPU 모두 각각 보통 5~6W, Cortex-A53만을 사용하는 저전력 AP부터 화룡까지 범위를 넓게 잡으면 3W에서 10W이상까지 소모하여서 3~4W대로 쓰로틀링이 걸리는 게 일반적이다.
3.3. 3XX
- Adreno 302
- Adreno 304
- Adreno 305
보급형 AP에 들어가는 GPU라서 아드레노 320보다는 부족한 모습을 보여 준다. 페이퍼스펙 상으로는 상술한 아드레노 225보다 딸리지만 실제로 GL 벤치마크 2.5나 GFX 벤치 2.7 결과를 보면 아드레노 225보다 더 높게 나온다. 아드레노 225가 각각 14.5fps, 4.5fps가 나온다면, 305는 무려 17fps, 6.5fps 까지 올라갔다. 이런 류의 효율 상승은 아드레노 510에서도 볼 수 있다. 이쪽은 낮은 FP 성능, 필레이트로 높은 벤치마크 결과를 달성한 케이스. 아마 Adreno 시리즈의 앞자리가 2→3, 4→5로 변하면서 아키텍처 상으로 효율이 상승한 게 아니냐는 의견이 있다.
- Adreno 306
- Adreno 308
- Adreno 320
- Adreno 320 Gen 2(가칭 Adreno 320 (96ALU)라고도 부른다)
2012년 말부터 사용된 스냅드래곤 S4 Pro로 인해 스냅드래곤이 쓰레기라는 오명을 벗기 시작했고 그 평가에 걸맞게 GPU 성능도 수준급이다. 물론 윗 각주에서 언급한 것처럼 전력소모 상한선이 높아지면서 과도한 쓰로틀링이 걸리기 시작했다. GL벤치마크 2.5의 결과를 보면 2012년 초에 상용화된 엑시노스 4412의 Mali-400을 가볍게 뛰어넘은 모습을 보여주었다.
이후 2013년 초에 동일한 시기에 경쟁한 스냅드래곤 600의 Adreno 320은 엑시노스 5410의 SGX544 MP3보다 높은 성능을 보여 주었고 이 시기부터 동일한 시기[4] 에 상용화된 엑시노스는 퀄컴 스냅드래곤 대비 높거나[5] 비슷한[6] CPU 성능에 소폭 낮은(보통 1~2fps 정도 차이) GPU 성능을 가지게 되었다.
- Adreno 330
경쟁사인 삼성 엑시노스 5420의 Mali-T628 MP6과 비교하면 Mali-T628은 GFX벤치 3.0 기준 10.6fps, GFX벤치 2.7 기준 25fps의 성능을 보여 주는 데에 비해서 Adreno 330(스냅드래곤 801 MS8974AC에 탑재된 버전)은 450MHz에서 GFX벤치 2.7 기준 23fps, 578MHz에서는 각각 12fps, 27fps의 성능을 보여 준다. 사실상 동급 성능이라고 볼 수 있다.
엑시노스가 아닌 다른 AP들과 GPU 성능을 비교해 보면, 동일한 시기에 상용화가 되고 GFX벤치에서 각각 13fps, 28fps가 나오는 Apple A7의 PowerVR G6430과 비교해도 전혀 부족한 수준이 아니고, Apple A6X의 GPU 성능은 가볍게 누르고 심지어 2017년에 나왔던 중보급형 AP들이 이 GPU를 뛰어넘지 못했었다.
3.4. 4XX
- Adreno 405
- Adreno 418
- Adreno 420
우수한 GPU 성능 덕에 WQHD에 LTE Cat.6 통신규격을 지원하는 2014년 하반기 플래그십급 스마트폰에 많이 사용되었는데 해상도가 WQHD임에도 불구, FHD + Adreno 330보다 높은 온스크린 성능을 보여주었다.
- Adreno 430
출시 전년에 나온 Apple A8의 GPU보다는 40% 높은 성능을 보여 주었고, 연말에 상용화된 Apple A9의 PowerVR GT7600과 비교하면 25% 낮은 성능을 보여주었다. 성능 자체로만 보면 그 시기에 나올수 있는 적절한 성능인 셈.
각종 웹진에서 까이는 스냅드래곤 810에서 그나마 안까이는 요소가 Adreno 430의 GPU 성능인데, 무리하게 성능을 끌어올린 모습이 보여서 그닥 장점으로 보이지는 않는다. 삼성전자 엑시노스와 퀄컴 스냅드래곤은 서로 상대방 AP의 GPU 성능에 맞추려고 무리하게 전력소모를 올리는 경향이 있다. 805 vs 5433 때는 엑시노스 5433이 805 수준의 GPU 성능을 얻기 위해 무리하게 GPU 소비전력을 6W 까지 올렸고, 810 vs 7420 때는 7420의 GPU 소비전력이 4W 후반대인데 퀄컴 진영에서 GPU 성능을 잡기위해 소비전력을 7.3W까지 올린 전적이 있다(...) 밑 항목의 모바일 GPU 전력소모 자료 참고. 물론 삼성 엑시노스 5433(7410)은 발열 등의 면에서 크게 문제가 되지는 않았다. 그러나 스냅드래곤 810 MSM8994가 어떤 꼴이 났는지는 다들 알 것이다... 스냅드래곤 805의 그래픽 성능이 CPU 성능에 비해서 워낙 좋았기 때문이기도 하지만.
3.5. 5XX
- Adreno 504
- Adreno 505
- Adreno 506
- Adreno 508
- Adreno 509
- Adreno 510
ARM Cortex-A72와 Cortex-A53의 조합으로 구성된 퀄컴 스냅드래곤 650, 652, 653에 탑재되는 GPU이다. 스냅드래곤 600번대에 들어가는 GPU 답지 않게 어마어마한 성능을 보여주고 있다. 다만 기존의 600번대와 성능이 큰 차이가 나서 618, 620에서 650번대로 리네이밍된 물건들이다. 초기 벤치마크 결과로는 Adreno 330과 418 사이의 성능을 가질것이라고 추측되었으나, 실제 벤치마크 측정치 상에서는 Adreno 418과 근접하거나 능가하는 성능을 가진다는게 드러났다. 기존의 스냅드래곤 600번대에 탑재되던 Adreno 405가 Adreno 320과 거의 동급의 성능을 가졌었다는 걸 고려하면 성능이 거의 두 단계 차이나는 셈(...)
ALU 수나 내부 구성 등의 자세한 제원은 아직 확실하게 드러난 사항은 없지만, GFX 벤치마크의 로우레벨 테스트로 추측한 제원을 보면 상대적으로 낮은 텍스처 필레이트랑 부동소숫점 연산성능으로 높은 성능을 거둔 것으로 알려져서 성능쪽에서 상당히 효율이 상승한 것으로 보인다.
ALU 수나 내부 구성 등의 자세한 제원은 아직 확실하게 드러난 사항은 없지만, GFX 벤치마크의 로우레벨 테스트로 추측한 제원을 보면 상대적으로 낮은 텍스처 필레이트랑 부동소숫점 연산성능으로 높은 성능을 거둔 것으로 알려져서 성능쪽에서 상당히 효율이 상승한 것으로 보인다.
- Adreno 512
- Adreno 530
퀄컴의 2016년 플래그십급 AP인 퀄컴 스냅드래곤 820, 821에 탑재된 GPU이다. 2016년에 주력으로 쓰일 제품이라서 GPU 성능이 상당히 높게 측정되었다. 탐스하드웨어에 공개된 GFX벤치 결과를 보면 GFX벤치 3.0 상에서 48fps, GFX벤치 3.1 상에서는 30fps를 넘기는 성능을 보여주었고 이 정체불명의 기기 결과를 봐도 각각 48fps, 31fps의 결과를 보여 주는 걸 알 수 있다. Apple A9의 PowerVR GT7600대비 맨해튼 3.0 기준 20% 높고 3.1 기준으로도 약 10% 또는 그 이상으로 매우 높은 성능이다.
갤럭시 S7으로 비교한 결과:
Mali-T880 MP12 650MHz 와 Adreno 530 624MHz의 GFX 4.0 맨하탄 3.1.1 오프기준으로 T880 16.6fps, Adreno 530 16.6fps로 격차가 나지 않는다. Car Chase Offscreen으로는 T880 17.7fps, Adreno 530 19.0fps로 격차가 벌어진다.
문제는 퀄컴 스냅드래곤 820의 CPU 성능은 삼성 엑시노스 8890에 비해 밀리고, 그래픽 성능은 Apple A10 Fusion과 모바일 끝판왕인 NVIDIA Tegra X1 에 비해 밀린다... 영원한 콩라인
갤럭시 S7으로 비교한 결과:
Mali-T880 MP12 650MHz 와 Adreno 530 624MHz의 GFX 4.0 맨하탄 3.1.1 오프기준으로 T880 16.6fps, Adreno 530 16.6fps로 격차가 나지 않는다. Car Chase Offscreen으로는 T880 17.7fps, Adreno 530 19.0fps로 격차가 벌어진다.
문제는 퀄컴 스냅드래곤 820의 CPU 성능은 삼성 엑시노스 8890에 비해 밀리고, 그래픽 성능은 Apple A10 Fusion과 모바일 끝판왕인 NVIDIA Tegra X1 에 비해 밀린다... 영원한 콩라인
- Adreno 540
퀄컴의 2017년 플래그십급 AP인 퀄컴 스냅드래곤 835에 탑재된 GPU이다. 아난드텍에서 공개한 GFX벤치 결과를 보면 1080p 해상도에서 작동하는 MDP/S 스냅드래곤 835 기준 GFX 4.0 카체이스 온스크린에서 iPhone 7 Plus 및 화웨이 메이트 9보다 성능이 뛰어나며, 최고 성능의 스냅드래곤 820 스마트폰인 픽셀 XL보다 25 % 더 높게 측정되고 오프 스크린 테스트로 이동하면 Adreno 540 GPU가 S820의 Adreno 530보다 25 % 우세한 성능을 보여주는데, 이는 퀄컴의 성능 향상 주장과 정확히 일치한다.
3.6. 6XX
A615 이후로 보통 MP2 구성으로 이루어진다.
- Adreno 605
- Adreno 610
- Adreno 612
- Adreno 615
- Adreno 616
- Adreno 618
- Adreno 619 or Adreno 619L
- Adreno 620
- Adreno 630
그리고 커널상 SDM845 GPU 클럭은 v1 기준 최대 600MHz, v2 or v2.1 기준 최대 710MHz로 실제 출시된 v2의 10LPP와 비교하면 v1의 10LPE보다 클럭이 18% 향상되었는데[13] 사양이 증가한 덕인지, 공정 대비 클럭을 더 올린덕인지 모르겠지만 쓰로틀링 특성이 기존보다 악화된 모습을 보인다. 835는 최대 3%의 성능하락을 보여주는데 845는 최대 17%의 성능하락을 보여준다.[14] 835 -> SDM845 v1 이면 같은 10LPE 공정이고 GPU 클럭은 653MHz -> 600MHz로 -8% 하락하였는데 사양 증가때문에 클럭이 8% 낮아져야 전력이 비슷해진다고 가정하고, 여기에 10LPP 공정의 성능향상기준을 반영하면 660MHz인데 710MHz는 여러모로 많이 올린 클럭으로 보인다. 아난드텍 자료에서는 835 대비 전성비가 맨해튼 3.1 기준으로 +17%, 티렉스 기준 +9% 향상된 모습을 보이는데 10LPE -> 10LPP에서 전력효율이 +15% 향상되었으니 아키텍처에 의한 전력효율 개선은 거의 없다고 볼수있다. 다만 엑시노스 9810에 탑제된 Mali-G72 MP18 572MHz와 비교하면 전력소모량은 비슷하지만 성능은 훨씬 앞선 모습을 보여준다.[15]
- Adreno 640
- Adreno 650
- Adreno 660
- Adreno 675
- Adreno 680
- Adreno 685
- Adreno 690
4. 참고 링크
모바일 GPU 전력소모 데이터(Anandtech)
5. 관련 문서
- ARM의 ARM Mali GPU 시리즈
- 이매지네이션 테크놀로지의 PowerVR GPU 시리즈
- NVIDIA의 Geforce GPU 시리즈
[1] 이후에 업데이트를 통해 533MHz로 클럭이 상승함.[2] 자료에 따라 다름. 전자는 ROP가 4개인 상황, 후자는 ROP가 8개인 상황을 상정한듯 하다.[3] 자료에 따라 다름. 각각 ROP가 6개인 상황과 8개인 상황을 상정.[4] 2013년 상반기 → 5410 vs 600, 2013년 하반기 → 542x vs 80x, 2014년 하반기 → 5433 vs 805, 2015년 → 7420 vs 810[5] 5410(1600MHz 결과 참고) vs 600(1728MHz 결과 참고), 5433(1300MHz 결과 참고) vs 805(2649MHz 결과 참고), 7420 vs 810[6] 5420(1900MHz 결과 참고, 싱글 950에 멀티 2900~3000점대) vs 800(2265MHz 결과 참고, 싱글 970에 멀티 2900~3000점대), 5422(1300MHz 결과 참고, 그래프 상의 1900MHz는 갤럭시 탭 S 10.5의 점수이다. 싱글 970~980점에 멀티 2900~3300점대) vs 801(2457MHz 결과 참고, 싱글 최대 1023점에 멀티 최대 3176점)[7] 원래 192 ALU라면 230 GFLOPS가 나와야 한다. 이쪽 바닥은 확실히 믿을 만한 정보가 없으니 388 기가플롭스는 걸러듣자. iPad Air 2에 탑재된 애플 A8X가 345.6 기가플롭스로 알려져 있다(...). NVIDIA Tegra K1은 CUDA코어를 192개나 때려박았는데도 400 GFLOPS를 약간 넘는 수준이다.[8] SM6115 기준 665, 460 정보 불확실[9] XDA SDM670 커널소스 정보 출처[10] A619 기준 출처[11] A619L 기준 출처[12] GPU 성능 자체로 비교하면 768G의 A620은 835의 A540과 동등하거나 더 좋은 성능을 보여주지만 메모리 대역폭 부분에서 16-bit 쿼드채널을 지원하는 835가 더 큰 이점을 가지고 있기 때문에 칩의 성능으로 비교하면 835가 더 좋은 성능을 보여준다.[13] 10LPE -> 10LPP에서의 공정 성능 향상치라면 10% 정도였어야한다.[14] 이는 클럭으로치면 596MHz 정도로 수렴한다.[15] 심지어 A630의 클럭을 9810의 G72와 동일하게 낮춰도 더 낮은 전력소모와 성능마저 더 나은 모습을 보여준다.[16] 855+ 칩에 장착[17] 부수적인 SP부분의 연산성능까지 합친 결과값이다. 출처[18] 865+, 870 칩에 장착[19] 신뢰성이 낮은 정보 출처