삼성 엑시노스/10 시리즈

 


1. 개요
2. 상세
3. 모바일 AP 목록
3.1. 엑시노스 1080 / S5E9815
3.1.1. 성능 분석
3.2. 엑시노스 2100 / S5E9840
3.2.1. 성능 분석


1. 개요


삼성전자 시스템 LSI 사업부의 모바일 AP 브랜드인 삼성 엑시노스 시리즈에 추가된 AP 라인업이다. 첫 제품은 11월 12일에 공개된 엑시노스 1080이다.

2. 상세


2020년에 출시된 엑시노스 990을 마지막으로 네이밍 자체가 10 시리즈로 넘어가게 되었고, Exynos M계열 CPU의 실패로 인해 엑시노스 980을 필두로 삼성 S.LSI 내의 SARC Team이 아닌 ARM Cortex CPU 기반으로 선회하게 된 시리즈이다.[1]
[1] 그래서 ARM 측의 공식 홈페이지에서도 삼성이 2100을 기점으로 Cortex-X 의 주요 고객이 되었다고 공개되었다.

-

3. 모바일 AP 목록



3.1. 엑시노스 1080 / S5E9815



공식 유튜브 영상
파트넘버
S5E9815
CPU
ARM Cortex-A78 MP1 2.8 GHz + ARM Cortex-A78 MP3 2.6 GHz + ARM Cortex-A55 MP4 2.0 GHz
GPU
ARM Mali-G78 MP10 - MHz
메모리
LPDDR5 / LPDDR4X 지원. 세부 규격 제원은 탑재기기마다 상이
생산 공정
삼성 파운드리 5nm FinFET LPE
내장 모뎀
5G NR sub-6GHz/mmWave (최대 5.1Gbps) & LTE Cat.18 (Down 6CA 1.2Gbps)
주요
사용 기기
Vivo X60, X60 Pro
2020년 11월 12일에 중국 상하이에 공개 정식 공개된 모바일 AP로, 네이밍 상으로 엑시노스 980 (S5E9630)의 후속작이다.
CPU는 ARM Cortex-A78을 싱글코어 구성으로 빅 클러스터를 이루고, ARM Cortex-A78를 트리플 코어 구성으로 미들 클러스터를 이루고, ARM Cortex-A55를 쿼드코어 구성으로 리틀 클러스터로 이뤄서 ARM big.LITTLE 솔루션을 적용한 DynamIQ 방식 HMP 모드 지원 옥타코어 CPU를 탑재했다. 이를 통하여 싱글코어 성능은 전작 대비 1.5배, 멀티코어 성능은 전작 대비 약 2배 가량의 성능 향상을 달성하였다.
GPU는 ARM Mali-G78을 10 클러스터 구조로 탑재한다. 전작인 엑시노스 980의 5 클러스터 GPU와 비교시 2.3배의 성능을 내준다고 한다.
자체적인 인공신경망 프로세서(NPU)와 DSP를 종합하여 초당 5.7TOPS의 AI 연산을 지원한다.
메모리 컨트롤러도 탑재해서 LPDDR5 SDRAM, UFS 3.1을 지원한다. 또한 칩 내에 통합되어 있는 통신 모뎀은 sub-6GHz/mmWave를 지원하며 초당 5,1Gbps의 다운로드 규격을 지원한다. 그 외에도 블루투스 5.2 및 Wi-Fi 6 규격을 지원한다.
생산 공정은 삼성전자 파운드리 사업부의 5nm FinFET LPE(EUV) 공정이다. 해당 공정의 자세한 제원은 이 문서에서 찾아볼 수 있다. 대략적으로 요약하면, 2020년 11월 기준 삼성전자의 5nm LPE 공정(7nm 공정 대비 밀도 1.33x)은 TSMC의 CLN5FF(7nm 공정 대비 밀도 1.7x)에 뒤이어 현존하는 로직 공정중에 2번째로 미세하다.
====# 출시 전 루머 #====
  • 삼성의 분기별 실적 발표 보고서 내부에는 아래와 같은 내용이 존재하는데, 이는 곧 세미-프리미엄 라인업에 5nm / 5G 원칩 구조의 SoC가 공개될 것을 암시하는 내용이다.
> S.LSI : Supply of 5-nano flagship and semi-premium 5G one-chip SoCs to begin in earnest
  • Antutu 테스트 결과 스냅드래곤 865+보다 더 높은 성능을 가진다고 한다. 물론 Cortex-A78/5LPE 덕분에 CPU 면에서 865를 넘었다고 해도 GPU 차원에서는 865를 넘기기 힘들 것이라는 게 중론.

3.1.1. 성능 분석


1. GB5, SPEC 기준 CPU 성능 서술
2. SPEC 기준 코어당 전력 소모 & 전력 대비 성능 추이
3. PCMark 기준 실사용(UX) 성능 서술
4. GFXBench, 3DMark 기준 그래픽 성능 서술
5. 각 API 별 GPU 전력 소모 및 Sustained Performance 기준 실사용 성능 서술
[각주]
-

3.2. 엑시노스 2100 / S5E9840



파트넘버
S5E9840
CPU
ARM Cortex-X1 MP1 2.91 GHz + ARM Cortex-A78 MP3 2.81 GHz + ARM Cortex-A55 MP4 2.21 GHz
GPU
ARM Mali-G78 MP14 858 MHz
메모리
64-bit xx채널 LPDDR5 xxxx MHz
생산 공정
삼성 파운드리 5nm FinFET LPE
내장 모뎀
삼성 엑시노스/통신 모뎀 솔루션
주요
사용 기기
갤럭시 S21, 갤럭시 S21+, 갤럭시 S21 Ultra
2021년 1월 12일에 공개된 모바일 AP로, 엑시노스 990 (S5E9830)의 후속작으로 보인다. 코드네임은 Olympus로 전작과 달리 다시 산이름으로 돌아왔다. 공개년도인 2021년에 맞춰 '엑시노스 2100'로 명명되었다.
CPU는 ARM Cortex-X1을 싱글코어 구성으로 빅 클러스터를 이루고, ARM Cortex-A78를 트리플 코어 구성으로 미들 클러스터를 이루고, ARM Cortex-A55를 쿼드코어 구성으로 리틀 클러스터로 이뤄서 ARM big.LITTLE 솔루션을 적용한 DynamIQ 방식 HMP 모드 지원 옥타코어 CPU를 탑재했다.
GPU는 ARM Mali-G78을 14코어 구성으로 탑재했다.
인공신경망 프로세서인 NPU를 탑재하여 26TOPS의 연산력을 보여준다.
메모리 컨트롤러도 탑재해서 LPDDR5 SDRAM, UFS 3.1, eMMC x.x을 지원한다. 또한, 통신 모뎀 솔루션을 내장해서 다운로드 최대 속도 규격으로 xx를 지원해 최대 x Gbps의 속도를 보장한다.
삼성전자 파운드리 사업부의 5nm FinFET LPE 공정이다.
====# 출시 전 루머 #====
  • 오랫동안 연구한 만큼, 스펙이 좋아서 퀄컴 스냅드래곤 888과 경쟁할 수 있다고 한다. 퀄컴칩보다 가격이 더 쌀 수도 있다는 주장이 제기되었다.
  • 갤럭시 S21에 탑재될 가능성이 높다.
  • AMD GPU는 들어가지 않을 확률이 높다고 한다.
  • 5나노 공정으로 기반으로 생산되며, ARM Cortex-A78이 적용될 것이라고 한다.
  • Cortex-X1에 심각한 버그가 있어서 삼성과 퀄컴 양사 모두 Cortex-A78을 사용할 것이라는 루머가 있다.[2]
  • 9월 23일에 유출된 Geekbench 5의 시스템 정보를 뜯어보면, X1 혹은 A78로 추정되는 기존 ARM CPU와는 다른 파트넘버로 보이는 코어가 2.9GHz 클럭으로 1개 들어가고, 2.8GHz로 돌아가는 미들코어가 3개, 그리고 2.2GHz로 돌아가는 Cortex-A55가 4개 들어간다고 한다. 유출 벤치마크의 점수가 상당히 낮은데 이는 유출벤치이거나, 아니면 X1이 아닌 A78이 들어갔을 것이라는 가능성을 생각해 볼 수 있다.
  • 퀄컴 스냅드래곤 888보다 성능이 훨씬 높다는 유출이 다수다. 긱벤치에서 멀티 4천점을 찍는다고. 내부 테스트에선 A14칩과 동일한 4100점대를 찍는단 소리까지 나오고 있다. 최신 벤치마크[3]

3.2.1. 성능 분석


[ SPEC2006 기준 CPU 성능 및 전력효율 데이터 ]
[image]
SPEC2006 기준 CPU 성능 및 전력효율 데이터

SPEC 2006 기준으로 엑시노스 2100의 Cortex-X1은 스냅드래곤의 동일 코어와 비교시 0.1GHz 더 높은 클럭으로 세팅되어 있으면서도 오히려 IPC는 소폭 낮고, 전력소모는 더 높다. 그러나 990이 스냅드래곤 865과 비교당하던 때, 혹은 역으로 스냅드래곤 810이 5433과 비교당할 때처럼 전력효율 격차가 2배 가까이 벌어지던 상황까지는 아니다. 미들코어인 Cortex-A78은 클럭 자체가 더 높게 세팅되어 있기 때문에 성능 또한 더 높지만, 전력효율 면에서 X1 이상의 트레이드-오프가 존재하였던 것으로 보인다. Geekbench 5 기준으로는 싱글코어 성능 1100점대, 그리고 멀티코어 성능은 최대치로는 4000점대의 점수까지 포착이 되지만, 냉동실 벤치나 혹은 상위 5% 내외의 수율의 칩이 아니라면 일반적인 사용 환경 내에서는 약 3400~3600점 내외로 측정이 되고 있다.
[ PCMark 2.0 기준 실제 UX 성능 및 전력효율 데이터 ]
[image]
[image]
[image]

PCMark 2.0 기준 실제 UX 성능 및 전력효율 데이터

PCMark 2.0 기준으로는 엑시노스 2100의 더 높은 미들코어 성능과 빠릿해진 스케쥴러 덕분에 그동안 열세였던 UX 성능 측면에서 스냅드래곤 시리즈와 역전을 하는데 성공한다. 물론 첫번째 사진의 표와 위의 SPEC 전력 효율 데이터에서 볼 수 있듯이, 이는 전력 효율 면에서의 트레이드-오프가 이뤄진 결과이며 당연히 배터리 사용 시간 측면에서는 열세 구도를 가지게 되었다.
[ GFXBench 기준 API별 그래픽 성능 및 전력효율 데이터 ]
[image]
[image]
[image]
[image]

GFXBench 기준 API별 그래픽 성능 및 전력효율 데이터(클릭시 확대)

GFXBench 기준으로는 엑시노스 2100의 Mali-G78이 기린 9000의 G78 대비 훨씬 고클럭으로 구동되기 때문에 전력효율 면에서 상당히 손해를 보는 상황이다. 추후 RDNA2 기반 GPU가 나오기 전까지는 이러한 상황이 계속 반복될 것이다. 그러나 한가지 긍정적인 점이라면 GFXBench가 아닌 3DMark 상에서는 Sustained Performance 비율 및 성능이 약 70% 대를 유지하면서 스냅드래곤 888보다 훨씬 더 나은 지속 성능을 보여준다는 점이다.
Mali-G78이 G77과 비교시 큰 폭의 개선이 없이 근본적으로 같은 수의 FPU, 텍스쳐 유닛, ROP를 공유하는 동일한 Valhalla 아키텍쳐임을 감안하면 전력효율 문제의 해소를 위해서는 결국 다이 사이즈의 증가를 감수하여 하이실리콘 처럼 클러스터 수를 늘리는 방향밖에 없을 것이라는 결론이 나온다.
[ SPEC 2006 기준 Cortex-A55 @ 1.8GHz 구동시 전력소모(클릭시 확대) ]
[image]
SPEC 2006 기준 Cortex-A55 @ 1.8GHz 구동시 전력소모
AP 명칭 / CPU 아키텍쳐
생산 공정
전력(mW)
전력 대비 성능(%)
퀄컴 스냅드래곤 888
/ Cortex-A55 (1.8 GHz)
Samsung 5LPE
'''304'''
+1.6%
퀄컴 스냅드래곤 865
/ Cortex-A55 (1.8 GHz)
CLN7FFP
'''309'''
-

삼성 5nm LPE 공정 분석을 위하여 Anandtech에서 측정한 모바일 CPU의 SPEC 2006 전력 측정 자료를 참고하였다. 최대한 수평적인 비교를 위하여 동일한 Cortex-A55가 동일한 클럭(1.8GHz)으로 작동할 때의 전력(Power)을 비교해 봐야 한다. 보통 Cortex-A53이나 Cortex-A55는 공정 자체의 PPA를 검증하는데 자주 사용되기 때문에 본 테스트를 통하여 공정 자체의 전력 대비 성능을 유추할 수 있다.
TSMC N7P와 삼성 5LPE는 동일 성능, 동일 아키텍쳐, 동일 클럭 하에서 비교시 5LPE가 Power 측면에서 1~2% 앞서는 수준으로 사실상 오차범위 내에서 동급이었던 것으로 판단이 된다. '''7LPP = N7 < 5LPE = N7P < N5''' 라는 공식이 성립하는 것이다. TSMC의 N5 공정이 N7P와 비교시 약 12% 개선되었다는 점을 고려하면, 삼성의 5nm 공정이 TSMC의 그것보다 기술적으로 10% 더 낮은 수준으로 판단이 된다.[4]
일부 중화권 미디어에서는 자체적인 측정치를 가지고 Cortex-A55 @ 1.8GHz 전력 소모를 측정하여 삼성의 5LPE가 TSMC의 N7P보다도 훨씬 낮은 수준의 효율을 가진다고 호도하는 경우가 있었다. 그러나 이 또한 그대로 수용해서는 안되는게, 중화권 사이트의 측정 자료는 대부분 실측 자료가 아니라 어플리케이션으로 예측한 자료이기 때문에 전력소모 측정 면에서 정확하다고 할 수 없기 때문이다. Anandtech 사이트의 측정 자료만 올리는 것도 그 때문이다.
  • 결론
결론적으로 엑시노스 2100은 비록 엑시노스 M 시리즈 CPU 코어를 사용했을 때 처럼 타사 AP와의 격차가 심각하게 벌어지지는 않았다. 이 때문에 엑시노스 2100이라는 AP 자체가 하나의 변곡점이 될 수 있다는 평이 있지만, 그럼에도 불구하고 AP 자체로만 놓고 봤을때는 그동안의 홍보에 비해서 상당히 실망스럽다는 평이 대다수인 상황이다. 일단 설계 측면에서는 ARM Cortex-A78과 Cortex-X1 자체가 공언했던 것만큼의 성능을 내주지 못하였던 점도 있었으나,[5] 삼성이 ARM 레퍼런스 아키텍쳐를 활용하는 능력도 예전 Cortex-A57을 세미 커스텀 하던 때 처럼의 폼을 보여주지 못하는 상황이다. 이 때문에 SARC 내의 CPU 커스텀 팀을 해체한 것이 성급한 판단이었다는 지적도 존재한다. 그리고 공정 면에서도 PPA중에 Performance, Power 측면에서 5LPE는 아무리 긍정적으로 가정하여도 결국 N5에는 못미치는 N7P과 동일한 수준이며, Area 측면에서도 1.3배 가량 부족한 밀도 때문에 TSMC제 AP처럼 트랜지스터 수를 획기적으로 늘릴 수 없고, 이 또한 설계 상의 제약으로 존재하는 상황이다. 격차를 줄이는 데는 성공하였으나, 22년에 예정된 RDNA GPU와 23년으로 예정된 GAAFET 공정같은 획기적인 게임 체인저가 아니라면 결국 판을 뒤집을 수 없는 상황이라는 것이 중론.
[2] 그러나 먼저 공개된 스냅드래곤 888은 Cortex-X1을 사용하는걸로 밝혀졌다.[3] 하지만 실기에서 싱글 1000점 중반~1100점 초반, 멀티 3000점 중반의 점수를 보여주고 있다. 발열 때문에 제한을 걸어둔걸로 추정된다. [4] 고클럭 환경에서 차이가 벌어질 수 있다는 예측도 존재한다. 아난드텍의 웹진은 삼성전자 Cortex-A78 vs 퀄컴 Cortex-A77 간의 비교에서 효율 격차가 35% 벌어진다는 자료를 통하여 5LPE가 고클럭 상에서는 N7P보다 효율이 낮을 수 있다고 하였다. 그러나 동일 아키텍쳐가 아니기 때문에 수직적인 비교는 어렵다. 게다가 같은 A78/X1 + 5LPE 조합을 채택한 퀄컴 스냅드래곤이 삼성의 A78/X1에 비해 더 높은 효율을 내어 주고, 퀄컴 Cortex-A78 vs 퀄컴 Cortex-A77로 비교하면 효율 격차가 15~20% 내외로 좁혀지는데 이 비교 대신 위와 같은 비교를 택하여 격차가 크게 나는 것처럼 서술하는 것은 석연찮은 부분이다. 이 때문에 차후 TSMC 공정을 활용한 A78, X1 제품의 전력 대비 성능 자료가 나오면 확실하게 비교할 수 있을 것으로 보여진다.[5] ARM 사의 홍보 자료에서 공통적으로 IPC 1.3배를 언급하였으나, 이는 결국 지켜지지 않았다.

-