Apple Silicon
1. 개요
Apple에서 설계한 SoC(System on Chip) 및 SiP(System in Package)를 통합 서술하는 문서이다.
ARM Holdings에서 개발한 CPU 아키텍처의 라이센스를 취득해 ARM Cortex-A 시리즈 소속 CPU 아키텍처를 사용하거나, 명령어셋 라이센스를 취득해 자체적인 ARM 호환 CPU 아키텍처를 설계해 사용하고 있다. GPU 이매지네이션 테크놀러지 PowerVR 그래픽의 GPU IP 라이센스를 취득해 사용했지만 2017년, A11 Bionic APL1W72를 기점으로 자체 디자인한 GPU를 사용하고 있다.
2. 특징
기존의 모바일 AP와는 다르게, Apple A 시리즈의 경우에는 iPhone 또는 iPad를 발표하는 키노트에서 공개되는 정보 이외에는 어떤 정보도 주어지지 않는다, 이는 Apple이 AP를 제작하는 목적 자체가 타 업체들과는 매우 다르기 때문이다.
'''Apple의 AP는 오로지 자사의 제품에 사용할 목적으로 독자 아키텍처까지 개발하는 특별한 경우'''이다. 소수의 기종으로 많은 판매량을 올리는 Apple만이 가능한 재주로, 삼성전자와 같은 제품 다변화를 통해 수요 창출에 나서는 다른 기업과의 차이에서 생기는 특수성 때문이다. 다른 모바일 AP 제조사의 경우에는, 일단 모바일 시장을 주력으로 하는 것은 Apple과 같지만, ARM CPU 아키텍처의 장점인 저전력을 무기로 차량용 AP, 게임기용 AP, 스마트 워치용 AP, 심지어는 저전력 서버용 AP까지 수요를 확대하려는 노력을 하고 있다. 즉 다른 AP 제조사들이 성능과 세부정보를 공개하며 '''우리 AP 성능 좋으니 많이 써주세요'''라고 한다면 Apple은 자신들이 완벽한 공급이자 수요이고, 단순히 '''우리 AP 성능봐봐 대단하지?'''라는 목적으로 AP 정보를 공개하는 것이기에 타 제조사 대비 많은 정보를 제공할 필요가 전혀 없다는 것이다.
또한, GPU 다이 사이즈가 유독 타 AP 대비 크고 아름다운 사이즈를 자랑하고 있었다. 이는 Apple이 모바일 AP를 오로지 자사 기기에 탑재할 목적으로 개발하여 규격에 대한 부담이 상대적으로 적고, 동시에 소프트웨어 관리 능력도 관련 업체 중 상위급이기에 가능한 것으로, 모바일 AP에서 CPU 아키텍처가 차지하는 부분을 최소화하고 이를 GPU의 다이 사이즈에 할당하고 있다.[1] 큰 크기답게 성능도 덩치 값을 해주고 있다. 이를 증명하듯 벤치마크 프로그램상 그래픽 성능으로는 모바일 AP 중 최상급의 성능을 보여주고 있다. 이후 지속적인 생산 공정의 미세화와 자체 GPU IP 개발로 면적 당 성능비 역시 지속적으로 높아지고 있다.
다만, Apple이 자체적으로 보유한 통신 모뎀 솔루션이 아예 존재하지 않기 때문에 이동통신 네트워크를 모바일 AP에서 지원하는 원칩 AP는 존재하지 않는다.[2][3] iPhone이나 iPad 등 통신 모뎀 솔루션이 필요할 기기에는 인텔이나 Qualcomm에서 공급받아 사용한다. 최신 모뎀을 Snapdragon에 끼워팔기하는 상술로 악명높은 Qualcomm도 Snapdragon 810 사태 때 반강제로 엑시노스 7420을 써야 하는 기기[4] 만큼은 모뎀만이라도 삼성전자에 팔아주고 Apple 앞에서는 한수 접고 들어가긴 하지만, 그럼에도 만족스럽지 않은 부분이 있는지 Apple은 인텔이 성능에서 뒤쳐짐에도 불구하고 지속적으로 공급받는 모뎀의 물량을 꾸준히 늘리는 중이다.
2020년 기준으로 자사 노트북과 데스크탑 둘다 인텔을 버리고 Apple Silicon으로 이주하는 것이 결정됨에 따라 사실상 인텔, 엔비디아, 그리고 AMD 없이 완전히 독자적인 컴퓨터가 나올 예정이다. 성능 향상은 물론이고 전력 소모 등에서는 기존 노트북에서는 상상도 못했던 스펙이 가능해질 것으로 보여 엄청난 기대를 모으고 있다. 현재 Mac mini Devleoper Kit이 개발자 대상으로 렌탈되어 사용되고 있는데 유출된 벤치마크 점수에 따르면 이미 2020년 MacBook Air 엔트리라인보다도 성능이 높다. # 이 제품은 그냥 기존 iPad A12Z Bionic 칩을 이식한 프로토타입 제품에 지나지 않아, 실제 Apple이 개발중인 Mac용 Apple Silicon이 탑재될 경우 성능 향상은 더욱 가파를 것으로 보인다.
이는 업계 최초의 시도는 아니다. Microsoft 측에서도 2019년에 Surface Pro 라인업을 발표하면서 ARM 기반 Windows 태블릿을 시도하고 있지만 하드웨어 성능이 좋지 않아 에뮬레이터로 돌아가는 기존 Windows 앱들은 심각하게 성능이 나쁘고[5] , 그렇다고 네이티브로 개발된 소프트웨어를 구동하자니 2020년 현재 거의 없다고 봐도 좋을 정도로 그 수가 적다.
반면 Apple은 모든 Mac 컴퓨터 라인업이 완전히 ARM 기반으로 옮긴다는 점에서 좋든 싫든 어느 시점에서는 모든 개발자들이 ARM 기반에서 구동되도록 업데이트 해야하는 입장이다. Apple은 특유의 정책 탓에 개발자들을 강압해서라도 레거시 시스템의 지원을 과감히 끊어버리는 편이라 32bit 시스템 드랍[6] 과 PowerPC에서 인텔로의 이주를 단기간에 완료시킨 이력이 있다. 이미 어도비와 마이크로소프트 등의 경우 Apple이 개발진들과 협업하여 준비중에 있는 것으로 알려져 있다.
즉 일부 유저들이 호환성 문제 등을 걱정하고 있지만, Windows를 구동하기 위한 Boot Camp를 제외하고는[7] 최소한 macOS 내에서는 걱정하지 않아도 될 것으로 보인다. 거기다 Windows와는 다르게 Apple은 iOS 및 iPadOS 등 ARM 기반 운영체제를 보유했다는 점, 그리고 이 생태계를 macOS로 흡수하는게 가능하다는 점에서도 기대를 모으고 있다.[8] 컴퓨터 업계 최초의 시도는 아니지만 가장 성공적인 ARM 기반으로의 전환이 될 것으로 전망되고 있으며, 컴퓨터 업계에 엄청난 파장을 불러일으킬 대사건이 될 것으로 보인다.
3. 생산기업
Apple은 자체적인 반도체 생산 라인이 존재하지 않는 팹 리스 업체이기 때문에 자체 생산이 불가능하므로 파운더리 생산사에 위탁 생산을 맡긴다. 전통적으로 Apple A 시리즈가 iPhone 4에 탑재되기 이전에 모바일 AP를 공급해준 삼성전자 시스템 LSI 사업부가 생산을 해왔고 Apple A 시리즈의 설계에도 관여한 부분이 있는 것으로 알려졌다.[9]
문제는, 삼성전자 무선 사업부가 Apple만큼, Android 진영에서는 Apple 이상으로 시장에서 영향력이 큰 스마트폰 제조사가 되면서 마음 놓고 위탁할 수 없게 되어버린 Apple은 보안 등의 이유로 이른바 '탈 삼성 전략'을 추진하기 시작했다. 그러나 모바일 AP의 경우에는 가장 최신 공정에서 그것도 엄청난 물량을 요구하는 Apple의 주문을 받을 회사가 그리 마땅치 않았기에 '탈 삼성 전략'이 최고조에 올랐던 iPhone 5s도 모바일 AP인 Apple A7은 삼성전자 시스템 LSI 사업부에서 생산되었다.[10]
하지만, 모바일 AP 부분도 TSMC에 지속적으로 투자하는 등 '탈 삼성 전략'을 지속적으로 준비했고, 삼성전자 시스템 LSI 사업부의 내부 사정까지 겹쳐서 Apple A8은 TSMC의 20nm SoC 공정에서 생산되었다.[11] 이러한 이유로 앞으로도 Apple은 삼성전자 시스템 LSI 사업부와 TSMC의 최신 공정 상황에 따라 파운더리 생산사를 계속 변경할 것으로 보인다.[12] 그러나 동 시기에 Apple A 시리즈의 생산공정은 거의 항상 삼성전자 생산분이 더 미세하였으므로 Apple 모바일 제품 사용자들 사이에서 두 생산분 사이에 성능 격차가 존재하는지에 대한 의문을 품는 것은 물론이고, 결국에는 TSMC 생산분보다 삼성전자 생산분을 더 선호하게 되는 사태가 발생하기도 하였다. 그러나 이 둘의 성능은 오차범위 내로 서로 엎치락뒤치락 하였기에, 공정에 크게 좌우되지 않고 사실상 동급으로 판단되어 요즈음에는 이러한 것들이 크게 줄어든 상황이다.
4. 제품 목록
크게 iPhone과 iPad에 탑재되는 Apple A 시리즈, Mac에 탑재되는 SoC인 M 시리즈, Apple Watch에 탑재되는 웨어러블 타겟 SiP인 Apple S 시리즈등의 주 프로세서라 부를수있는 범위와 보안을 위해 탑재되는 T 시리즈, 무선통신에 쓰이는 W 시리즈 등 보조 프로세서라 부를수있는 범위로 나뉜다.
4.1. A 시리즈
파트넘버의 경우, S5L- 구성의 파트넘버는 삼성전자 시스템 LSI 사업부 측 파트넘버이며 APL- 구성의 파트넘버는 Apple 측 파트넘버이다. TSMC는 별도의 파트넘버는 존재하지 않는다.
4.1.1. A4
Apple A 시리즈의 첫 번째 모바일 AP이다. Apple은 이전까지 삼성전자 시스템 LSI 사업부의 모바일 AP를 그대로 납품 받았다.
삼성 엑시노스 3110의 전신인 삼성전자 허밍버드와 코어 구성이 거의 같다. 당시 삼성전자는 ARM Cortex-A8 CPU의 클럭을 1 GHz를 넘기기 위해서 여러 가지로 노력하고 있었는데, 애플이 데려온 인트린시티와 함께 코어 커스텀을 하고 삼성전자의 도미노 로직을 사용해 ARM 측의 반대에도 불구하고 세계 최초로 1 GHz의 클럭을 돌파했다.
다만, 전력 문제로 iPhone 4에는 800 MHz, 어느 정도 배터리의 여유가 있는 iPad(1세대)에는 1 GHz로 클럭이 조정되어 들어간다.
삼성 엑시노스 3110과 차이가 있다면 GPU가 이매지네이션 테크놀러지 PowerVR SGX540에서 PowerVR SGX535로 다운그레이드되어 있다는 점 정도가 있다.
4.1.2. A5
Apple A4를 삼성전자와 같이 협력한 인트린시티를 애플이 인수한 후, 본격적으로 Apple의 비중이 커진 AP다. Apple A4까지 오랜 기간 AP 설계 경험이 있는 삼성전자가 단독으로 설계하다시피 했다면, Apple A5부터는 Apple의 비중이 커지고, 삼성전자는 생산의 역할이 강해졌다. 다만, 삼성전자 역시 ARM Holdings의 라이센스를 취득해 삼성 엑시노스 시리즈를 만드는 만큼, 관련 기술자가 상주하고 있어 큰 차질없이 협력을 할 수 있었다고 한다.
ARM Cortex-A9 듀얼코어 구성으로 최대 클럭은 1GHz이다. iPhone 4s와 iPod touch 5세대는 800 MHz, iPad mini, iPad 2와 Apple TV에는 1GHz로 들어간다. GPU는 이매지네이션 테크놀러지 PoweVR SGX543 듀얼코어를 사용했다.
삼성 엑시노스 4210이 공정 미세화를 위해 32nm HKMG 공정을 사용하는 삼성 엑시노스 4212로 리버전 된 것처럼 Apple A5 역시 32nm HKMG 공정으로 다이쉬링크되어 iPad 2에 들어갔다. 성능 차이는 미미하지만, 공정 개선에 힘입어 30% 정도 전력 효율이 올라갔다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 iPhone 4s를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 280 점으로 측정되었고 멀티코어 점수가 약 490 점으로 측정되었다.
4.1.2.1. A5X
iPad 3세대 공개 당시 기습적으로 공개된 Apple A5의 파생 모델이다. '''2048 x 1536'''이나 되는, 당시 모바일은 물론이고 PC시장에서마저 드물었던 QXGA 해상도를 처리하기 위해서 Apple A5의 GPU를 강화시킨 AP다.
Apple A5에 들어갔던 이매지네이션 테크놀러지 PowerVR SGX543 듀얼코어 구성을 쿼드코어로 재구성하여 결과적으로 동시대 대부분의 AP를 능가하는 매우 뛰어난 그래픽 성능을 얻었다.
GPU 성능을 약 2배 강화했지만 iPad 3세대의 해상도는 4배 이상 높아졌고 CPU 성능은 동결되었기 때문에 레티나 디스플레이를 감당하기엔 여전히 만족스럽지 못했다. 특히 45nm 공정으로 생산되어 발열이 문제가 되어서 모바일 AP로써는 이례적으로 히트 스프레더를 요했다.[16] 또한 GPU의 다이 사이즈가 커지다 보니 양산 수율도 빡빡해졌다. 다만 생산업체가 오랜 노하우를 가진 삼성전자 LSI 사업부였기에 별다른 문제는 없었다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 3세대 iPad를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 330 점으로 측정되었고 멀티코어 점수가 약 580 점으로 측정되었다.
4.1.3. A6
iPhone 5에 탑재되는 모바일 AP이다. 기존까지 ARM Holdings에서 개발한 마이크로아키텍처의 라이센스를 취득해 모바일 AP를 설계했다면, 이번에는 Apple이 직접 명령어셋 라이센스를 취득하여 설계한 자체적인 ARM 호환 CPU 아키텍처, Apple Swift를 사용했다.
ARM Cortex-A15까지 사용된 ARMv7 명령어셋을 커스텀한 '''ARMv7s''' 명령어셋을 이용했다.
GPU는 이매지네이션 테크놀러지 PowerVR SGX543을 3개를 묶어 '''트리플코어'''로 사용한다. 보편적으로 보기 힘든 홀수개 코어 구성으로, 동일한 GPU로 쿼드코어를 구성한 Apple A5X보다 동일한 클럭일 경우에는 성능은 당연히 떨어지지만, 둘 다 클럭 조절을 했기 때문에 결과적으로는 Apple A5X와 동급의 성능을 보여준다.
이때부터 삼성전자는 삼성 엑시노스 라인업에 ARM Cortex-A 시리즈를 라이센스하여 지속적으로 사용하고 있었기 때문에 'Apple AP 삼성 설계설'은 근거가 빈약해졌다. 삼성전자 LSI 사업부의 Apple A 시리즈의 설계에 대한 관여도가 전에 비해 줄어든 것으로 보인다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 iPhone 5를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 760 점으로 측정되었고 멀티코어 점수가 약 1,200 점으로 측정되었다.
4.1.3.1. A6X
Apple A5X처럼 2K급 해상도인 QXGA를 버티기 위해 GPU를 강화한 Apple A6의 파생 모델이다. Apple A6이 Apple A5와 Apple A5X와 같은 GPU를 사용했기 때문에 이번에도 GPU 쉐이더 코어 갯수와 클럭을 조정하는 선에서 성능을 향상시킬 것으로 예측되었으나, 이매지네이션 테크놀러지 PowerVR SGX554 쿼드코어 GPU라는 크고 아름다운 GPU를 탑재하는 것이 확인되면서 관련 커뮤니티와 수많은 전문가들에게 충격을 안겨주었다. 이는 Apple A5X로도 QXGA 해상도를 제대로 처리하지 못하는 모습이 보였기 때문에 성능 개선을 위한 특단의 조치를 취한 것으로 보인다.
이 때문에, 모바일 AP를 32nm HKMG 공정에서 생산하긴 했지만 다이사이즈는 x86 기반의 저전력 CPU 다이사이즈와 버금갈 정도로 크다. 그래도 크기가 큰 값은 해 주기는 했었는데, 성능이 1년이 지난 2013년 3분기의 플래그쉽 모델인 퀄컴 스냅드래곤 800 MSM8x74의 Qualcomm Adreno 330 450Mhz GPU, NVIDIA Tegra 4 T114의 NVIDIA ULP GeForce MP72 GPU, 삼성 엑시노스 5420의 ARM Mali-T628 헥사코어 GPU 이후에야 Apple A6X의 그래픽 성능을 어떤 상황에서든 확실히 넘을 수 있었다.[17]
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 iPad(4세대)를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 800 점으로 측정되었고 멀티코어 점수가 약 1,300 점으로 측정되었다.
4.1.4. A7
iPhone 5s에 탑재되는 모바일 AP이다. '''모바일 AP로는 세계 최초'''로 64비트를 지원하는 CPU 아키텍처를 탑재했으며 해당 CPU 아키텍처 역시 Apple이 직접 라이센싱한 ARMv8 명령어셋을 이용해 자체적으로 설계한 ARM 호환 CPU 아키텍처인 Apple Cyclone CPU를 사용했다.
Apple Cyclone이 ARMv8 명령어셋 기반에다 체적도 거대한 편인지라 퍼포먼스가 아닌 벤치마크 결과로도 경쟁사의 모바일 AP와 비슷한 성능을 보여준다. OS의 차이가 있어 유리한 쪽이기는 하지만 당장, Qualcomm Snapdragon 800 MSM8x74와 비교할 때, Qualcomm Krait 쿼드코어 2.2 GHz CPU가 Apple Cyclone 듀얼코어 1.3 GHz CPU와 거의 동급 성능을 보여주고 있다.
GPU의 경우, 이매지네이션 테크놀러지 PowerVR G6430 GPU를 사용한다. GFX벤치의 오프스크린 성능 기준으로 Qualcomm Adreno 330/ARM Mali T-628 GPU보다 떨어지지만, 기기 해상도 자체가 Full-HD 해상도 이상이 주류인 Qualcomm Snapdragon 800 MSM8x74와는 달리, iPhone 5s의 해상도는 HD 720p보다도 낮은 해상도[18] 이기에 온스크린 점수는 스마트폰에서는 동급 혹은 상위의 성능을 자랑한다.[19][20]
또한, 모바일 AP 내부에 원래는 존재하지 않던 SRAM 부분이 생겼다. 해당 부분은 4 MB의 L3 cache라고 한다. 그리고 당시로서는 태블릿 컴퓨터 전용으로도 성능이 괜찮은 편이었기에 QXGA 해상도를 위한 Apple AX 시리즈로 파생되지 않고 그대로 iPad Air에 탑재되었다.
iPhone 5s는 iOS 12 지원목록에도 포함됐을 만큼 아직도 카카오톡을 실행하거나 간단한 음악을 듣는 등... 웬만한 작업은 무리없이 돌아간다. [21]
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 iPhone 5s를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 1,300 점으로 측정되었고 멀티코어 점수가 약 2,200 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Primate Labs의 Compute Bench 기준, 약 590 점으로 측정되었다.
4.1.5. A8
iPhone 6 | iPhone 6 Plus에 처음 탑재되었으며, Apple/AP 일람 중에서는 20nm로 생산된 최초의 모바일 AP다.[22] 또한, 주력 생산사가 삼성전자 LSI 사업부에서 TSMC로 교체되었다. 삼성전자 LSI 사업부에서는 생산공정 미세화가 진행되면서 생산능력이 다소 줄어 물량을 전보다 적게 받은 것으로 보인다.
기본적인 클럭은 1.4 GHz이나, iPod touch 6세대에는 1.1 GHz로 다운클럭되어 탑재되었다. 문제는 그럼에도 전작인 5세대 iPod touch에 비해 배터리 용량은 그대로면서 CPU의 전력 사용량이 급격히 올라 배터리 사용 시간이 줄었다고 한다.
전작에서 탑재된 Apple Cyclone CPU를 리비전되어 탑재되었고, 이매지네이션 테크놀러지 PowerVR GX6450 GPU를 탑재했다. Apple A7의 약 두 배가량인 20억 개에 달하는 트랜지스터가 박혀있으며 다이사이즈는 89 mm^2로 Apple A7와 비교해서 상당히 작아졌다.
한편, 애플은 Apple Cyclone CPU]를 그대로 사용하면서도 이번에는 스로틀링 관리 능력이 우수하여졌다고 소개했었다. 이에 대해 사실상 불가능하다는 의견이 많았고, 직접적으로 스로틀링 테스트를 진행하는 경우도 생겼다. 그리고 그 결과, Apple이 소개한 내용처럼 그래프가 나타나지는 않지만, 그래도 '''유의미한 변화가 있는 것'''이 확인되었다.
전작인 iPhone 5s의 Apple A7과 비교할 때 스로틀링 클럭이 0.1 GHz에서 0.2 GHz 정도 더 높다. 애초에 Apple Cyclone CPU는 불과 0.1 GHz의 클럭이라 하더라도 성능 차이가 나버리는 무시무시한 물건 임을 감안하면 이는 의미 있는 변화라 할 수 있다. 다만, 퍼포먼스를 끌어올린 상태로 장시간 지속 시 클럭이 1 GHz 미만으로 떨어진다고 한다.
하지만, iPhone 5s의 Apple A7는 스로틀링에 걸렸다 회복되는 기간이 상당히 길지만, Apple A8은 바로 클럭을 복귀시킨다. 즉, 스로틀링 관리 능력이 전작에 비해 높은 클럭을 유지하는 것과 장시간 스로틀링 시 일시적으로 낮춘 다음, 다시 복구시키는 두 가지의 방식을 사용한다 할 수 있다.
2019년 들어서는 Apple의 장수 AP로 자리매김하고 있다. 2014년에 롤아웃된 AP가 iPod touch 6세대, Apple TV, HomePod 등 여러 기기에 들어가기 때문. 아무래도 64비트 지원에 복잡한 인공신경망 연산이 필요없는 최소한의 AP만 요구되는 기기에 아직도 요긴하게 쓰이는 걸로 보인다. 장수 AP답게 OS 업그레이드도 상당히 오래 지원되는 편이며, iPad Air 2,iPad mini 4 한정이지만 iPad OS도 지원목록에 포함되었다. 한 술 더떠 iPadOS 14까지 올라가는 기염을 토했다. 단 다른 기기들은 전부 지원목록에서 제외되었다. iPhone 6랑 6세대 iPod touch는 RAM 부족으로 iOS 13 지원기기 명단에서 제외되었다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 iPhone 6를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 1,500 점으로 측정되었고 멀티코어 점수가 약 2,700 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Primate Labs의 Compute Bench 기준, 약 4,200 점으로 측정되었다.
4.1.5.1. A8X
iPad Air 2를 위해 만들어진 Apple A8의 파생 모델이다. 기존 Apple AX 시리즈는 GPU 강화에 중점을 둔 구성을 보여줬지만, 이번에는 CPU도 어느 정도 강화되었다. CPU 아키텍처는 동일하긴 하나, 듀얼코어에서 트리플코어로 늘리고 클럭도 1.5 GHz로 소폭 상승시켰다. Apple 측은 이로 인하여 Apple A8보다 싱글코어 점수는 약 13%, 멀티코어 점수는 약 55% 정도 더 높은 점수를 보여준다고 주장하였다. L2 Cache 역시 2 MB로 증가했으며 일부 연산 명령어의 소요 시간을 줄였다고 한다. 또한, 코어 수에 비례하듯 약 30억 개의 트랜지스터가 박혀있다고 한다.[23][24]
여기에 GPU는 이매지네이션 테크놀러지의 GPU 로드맵에는 존재하지 않는 PowerVR 6XT 시리즈를 옥타 클러스터 구성으로 조합한 커스텀 GPU를 사용한다. 이는 Apple A8의 GPU인 이매지네이션 테크놀러지 PowerVR GX6450의 딱 두 배 구성을 가지고 있다.
사실, 이매지네이션 테크놀러지가 PowerVR 6XT 시리즈는 옥타 클러스터까지 구성할 수 있다고 밝히긴 했었으나, 실제 로드맵은 헥사 클러스터 구성인 PowerVR GX6650까지만 공개했었다. 따라서, 해외 여러 IT 웹진이나 관련 커뮤니티들은 Apple A8X의 GPU는 임의적으로 이매지네이션 테크놀러지의 GPU 네이밍 법칙과 애플의 'A'를 넣어 PowerVR GX'''A'''6'''8'''50이라 표기하고있다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 iPad Air 2를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 1,800 점으로 측정되었고 멀티코어 점수가 약 4,200 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Primate Labs의 Compute Bench 기준, 약 7,800 점으로 측정되었다.
4.1.6. A9
iPhone 6s | iPhone 6s에 탑재되었고, 후에는 iPhone SE에도 탑재된 모바일 AP이다.
정확한 내부 정보는 2015년 9월 23일 기준으로 불명이나, 기기를 처음으로 수령한 예약 구매자가 측정한 Geekbench 3 결과에 의해 싱글코어 점수 약 2500 점, 멀티코어 점수 약 4300 점으로 측정되어 1.8 GHz 클럭의 듀얼코어 CPU가 탑재된 것이 확인되었다. 이러한 수치를 바꿔보면, 단순 연산량만 보면 싱글코어 점수 기준으로 MacBook Air에 근접한 수치라고 한다.[25]
2015년 9월 25일, 다이 이미지에 대한 정보가 공개되었다.일단, 직접 엑스레이를 이용해 다이 내부 사진을 촬영한 것이 아닌, Apple이 키노트 당시에 대략적으로 공개한 다이 이미지를 토대로 분석한 결과, 3 MB의 L2 캐시와 '''8 MB'''라는 대용량의 L3 캐시를 가지고 있으며 APL8098 기준으로 다이 사이즈는 94 mm²라고 한다. 그리고, 헥사코어 또는 헥사 클러스터 구성을 가진 GPU가 확인되었다. 이를 통해 이매지네이션 테크놀러지의 PowerVR GT7600을 사용한 것으로 추정되고 있다. 다만, Apple A8X GXA6850과 비슷한 구성으로 인해 일각에서는 PowerVR GX6650을 사용한 것이 아니냐는 주장도 존재한다.
2015년 9월 27일, iPhone 6s와 iPhone 6s Plus를 분해한 결과 삼성전자 시스템 LSI 사업부와 TSMC가 모두 생산에 참여했다는 주장이 제기되었다. 파트넘버가 iPhone 6s는 APL0898로 확인되고, iPhone 6s Plus는 APL1022로 확인되었기 때문이며 이는 기존 Apple A 시리즈의 각 회사 파트넘버의 넘버링과 일치한 것이 확인되면서 확인사살되었다. 즉, 기존 파트넘버 넘버링에 의해, Apple A9 APL0898은 삼성전자 시스템 LSI 사업부의 14nm FinFET LPE 공정에서 생산되었고, Apple A9 APL1022는 TSMC 16nm FinFET 공정에서 생산되었다는 것을 알 수 있게되었다.
일단, TSMC가 지속적으로 삼성전자 시스템 LSI 사업부의 14nm FinFET LPE 공정과 자사의 16nm FinFET 공정은 전력 소모 부분에서 별 차이 없다고 주장하는 중이고 설령, 미세한 차이라도 존재한다 하더라도 iPhone 6s Plus는 iPhone 6s보다 기기의 면적도 넓고 배터리 용량도 크기 때문에 소프트웨어에서 자잘한 것들을 조절할 경우 큰 문제가 없을 것으로 보인다. 하지만 같은 돈을 주고 다른 공정의 모바일 AP를 인지하지 못한 채 이른 바 '뽑기' 형태로 구매해야 하기 때문에 이에 대한 비판을 피하지는 못할 것으로 보인다.
2015년 9월 29일, iOS 트윅 개발자인 hirakujira는 자신의 iPhone 6s와 iPhone 6s Plus에 탑재된 AP가 어떤 제조사에서 제작된 것인지 확인하는 툴을 배포했고 이로 인해 64 GB 낸드 플래시로 MLC 방식과 TLC 방식을 혼용한 것처럼 동일한 기기에 서로다른 공정에서 생산된 모바일 AP가 혼용되는 것이 확인되었다.
2015년 10월 7일, 아직 전초전이긴 하나, 두 AP의 초기 벤치마크 비교 결과, 기존의 예상과는 달리, APL1022가 APL0898보다 극히 미세하기는 하지만 우위를 점하고 있는 것이 확인되었다. 발열 부분에서도 공정이 상대적으로 큰 TSMC 생산분이 소폭 우세한 것으로 보인다고 한다. 이에 대해 TSMC가 16nm 공정 로드맵에서 2단계인 16nm FinFET+ 공정을 조기에 상용화한 것이 아니냐는 주장이 제기되었다. 16nm FinFET+ 공정이면 삼성전자 시스템 LSI 사업부의 14nm FinFET LPE 공정보다 약간 우위이기 때문이다.[26] 다만, 16nm FinFET+ 공정으로 생산된 최초의 시스템 반도체는 하이실리콘 Kirin 950이라 TSMC와 하이실리콘이 공식적으로 밝힘에 따라 다른 변수 없이 16nm FinFET 공정에서 생산된 것으로 보인다.
2015년 10월 13일, 톰스하드웨어의 테스트 결과, APL0898와 APL1022 사이의 성능 차이는 사실상 존재하지 않고, 배터리 런타임은 APL0898가 APL1022보다 약 10.76% 정도 더 길다는 결론이 나왔다. 마찬가지로 10월 16일 컨슈머리포트에서도 테스트했었는데, 역시나 배터리 타임 차이는 2% 이하로 거의 존재하지 않았다.
L3 캐시는 기존과 동일한 4MB다.
2015년 12월 10일, IYD의 테스트 결과, APL0898와 APL1022 간 테스트에서 Geekbench 3를 이용한 테스트만이 유의미한 차이를 보여줬다. APL0898가 APL1022보다 스로틀링으로 성능이 약간 떨어지는데 전력 소모량은 살짝 더 높다는 결과가 나온 것이다. 이는 Geekbench 3 자체가 CPU 리소스 사용량이 높은 편에 속하기 때문에 다른 벤치마크 프로그램이 잡아내지 못하는 부분을 보여주고 있다는 의견도 있다.[27]
2016년 3월 21일(현지시간) 발표된 iPhone SE에 탑재되어 주목받았다. iPhone SE의 해상도가 비교적 낮은 만큼 해당 AP을 탑재한 기기 중 가장 빠른 속도를 보여줄 것으로 기대된다.
2016년 4월 18일, 예전에 Geekbench 3의 연속 구동을 통해 쓰로틀링의 차이를 측정한 IYD에서 iPhone SE를 리뷰하면서 표본수를 조금 더 늘리고 측정한 결과, 기존의 CPU 풀로드 시 TSMC가 유리하다는 결론이 아닌 의외의 결과가 도출되어[28] 팹 회사간의 편차보다 그냥 각각의 칩 간의 편차가 훨씬 더 크다는 것으로 드러났다.
여담으로 인텔은 자사의 14 nm 공정을 소개할 때 '''진짜 14nm 공정'''[29] 을 강조했는데 이는 경쟁업체들의 20nm 공정과 14/16nm 공정 간의 차이가 없는 것은 아니지만, 노드 명칭만큼의 밀도 상승을 보이지 않은 점을 그 근거로 들었다.[30] 이렇듯 양쪽 모두 이미 20nm의 파생공정이나 다름없던 상황에서 16nm보다 14nm이 무조건 좋네 마네 하는 이야기를 하는 것 자체가 피상적인 분석이 될 수밖에 없는 이유이며[31] 또한 TSMC A9는 상대적으로 삼성 A9보다 면적이 컸기 때문에 Apple이나 삼성, TSMC만이 알 수 있는 여러 요소를 포함해야 정확한 계산이 가능하다.
때문에 누가 좋네 마네 하는 이야기 자체가 의미가 없다고 볼 수 있다. 드러난 정황만으로 이를 판단할 수 있는 근거는 없고, 만약 공정간의 스피드 게인 차이가 있었다면[32] Apple이 같은 성능을 내게끔 디자인했을 것이고, 그럼에도 만약 성능 차이가 난다면 낮은 쪽 성능으로 높은 쪽 성능을 제한했을 게 뻔하기 때문이다. 이후 iPhone 7에서도 Apple은 Intel & Qualcomm 모뎀을 혼용할 때 성능이 낮은 Intel 모뎀에 맞춰 Qualcomm 모뎀에 출력 제한을 걸었다. 문제는 한국에서는 유독 삼성의 공정이 TSMC보다 앞선다는 주장이 많은데 이는 삼성이 한국의 기업임과 무관하지 않아 보인다. 심지어 이들은 이 앞선다는 개념조차 정확히 정의하지도 못하는데, 스피드 게인이 앞서는지 면적이 앞서는지 양산 능력이 앞서는지도 말하지 않고 그냥 '''앞선다'''고만 말하니... 이런 주장은 어느 정도 걸러들을 필요가 있다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제로 삼성전자 시스템 LSI 사업부 생산 모바일 AP를 탑재한 iPhone 6s를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 2,500 점으로 측정되었고 멀티코어 점수가 약 4,500 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Primate Labs의 Compute Bench 기준, 약 10,500 점으로 측정되었다.
Geekbench 5 기준으로는 싱글코어 약 550점, 멀티코어 약 1000점. Compute Bench 점수는 약 2500점으로 측정되었다.
4.1.6.1. A9X
iPad Pro를 위해 만들어진 Apple A9의 파생 모델이며, A8X APL1012의 후속작이다.
iPad Pro의 공개 시기와 출시 시기의 간격이 약 두 달이나 존재했고 12.9형 iPad Pro의 출시 시기 및 일정이 확정되면서 엠바고가 풀려 성능 테스트 결과 역시 빠르게 올라오고 있다. Geekbench 3는 싱글코어 점수가 약 '''3200'''점, 멀티코어 점수가 약 5500점으로 측정되며 2.3 GHz 클럭의 듀얼코어 CPU가 탑재된 것이 확인되었다. 멀티코어 점수는 삼성 엑시노스 7420의 점수와 크게 차이나지 않으나, 싱글코어 점수는 2015년 11월 12일 기준, 현존하는 모든 모바일 AP 중 최초로 싱글코어 3000점을 넘겼다. GFX벤치는 OpenGL ES 3.0 API 기준으로 80 Fps에 육박하고 있으며 이는 맥스웰 아키텍처의 엔비디아 Tegra X1 T210보다 우수한 수치이다.
A9과 달리, L3 캐시가 탑재되지 않았는데, 이는 A9X와 함께 탑재되는 LPDDR4 1600 MHz 메인 메모리의 속도(대역폭)이 기존 A9에 탑재된 L3 캐시의 속도에 근접하게 되었기 때문이라고 알려졌다. 캐시 메모리란 빠른 장비와 느린 장비에서 그 속도 차이를 극복하여 최대한의 성능을 발휘할 수 있게 하기 위해, 캐시 적중 실패 시 발생하는 딜레이를 감수하고 사용하는 하이 리스크 하이 리턴의 메모리이다[33] . A9X의 경우처럼 메인 메모리의 속도가 A9에서의 L3 캐시의 속도만큼 충분히 빠르다면, 오히려 L3 캐시 적중 실패 시의 패널티 때문에 성능 저하만 일으킬 뿐이다.
12.9, 9.7 모델 모두 CPU, GPU 클럭은 동일하다. 허나 둘 사이에 절대적인 성능차이가 존재하는 이유는 12.9 모델에 비해 9.7모델의 RAM 용량을 절반으로 줄이면서 메모리 모듈도 하나만 들어가게 되었는데, 덩달아 대역폭도 같이 반토막 나버린 것이 원인. 그래도 실 체감성능인 온스크린에서는 거의 동일한 퍼포먼스를 보여준다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 1세대 12.9형 iPad Pro를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 3,100 점으로 측정되었고 멀티코어 점수가 약 5,300 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Primate Labs의 Compute Bench 기준, 약 16,000 점으로 측정되었다.
4.1.7. A10 Fusion
A9 APL0898 & APL1022의 후속작으로 iPhone 7 | iPhone 7 Plus와 함께 공개되었다.
CPU는 Apple Hurricane을 듀얼코어 구성으로 빅 클러스터를 이루고, Apple Zephyr를 듀얼코어 구성으로 리틀 클러스터로 이뤄서 ARM big.LITTLE 솔루션을 적용한 쿼드코어 CPU를 탑재했다. 단, HMP 모드는 지원하지 않는다.
GPU는 이매지네이션 테크놀러지 PowerVR GT7600을 탑재했다.
센서 허브의 역할을 수행하는 Apple M10 모션 인식 프로세서를 탑재했다.
메모리 컨트롤러도 탑재해서 LPDDR4 SDRAM, NVMe 규격을 지원한다. 이외에도 위상차 검출 AF를 지원하는 ISP를 탑재했다.
여기에 촬영 및 재생 등을 위한 여러 가지 코덱 및 컨트롤러 등을 탑재한 것으로 보인다.
생산 공정은 TSMC의 16nm FinFET+ 공정이다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 iPhone 7을 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 3,500 점으로 측정되었고 멀티코어 점수가 약 6,000 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Primate Labs의 Compute Bench 기준, 약 13,000 점으로 측정되었다.
빅 클러스터와 리틀 클러스터를 전부 사용하는 HMP 모드가 적용되어 있지 않고 삼성전자의 엑시노스 5 Octa (5410)와 유사하게 클러스터 마이그레이션으로 스위칭해서 사용한다. 실제 탑재 기기인 iPhone 7 | iPhone 7 Plus 기준으로 초창기 펌웨어에서는 리틀 클러스터를 많이 사용하게 하는 보수적인 스케줄러를 사용해서 전작인 A9 APL0898 & APL1022를 탑재한 iPhone 6s와 비교할 때 대기 상태에서 복귀한 직후의 애플리케이션 실행 속도 등이 떨어지는 문제 등이 있었다. 이후 펌웨어 업데이트를 통해 빅 클러스터를 제때 사용하도록 하여 딜레이를 해결했는데 리틀 클러스터가 사용되던 상황에서 빅 클러스터를 구동시켜 버리니 배터리 타임이 떨어지는 문제가 발생하게 되었다. 이후 배터리 타임 개선 역시 여러 차례에 걸친 펌웨어 업데이트를 통해 개선되었다.
CPU의 멀티코어 성능은 삼성전자의 엑시노스 8 Octa (8890)의 이론적인 조건에서 내는 수치와 비슷하지만 싱글코어 점수는 단연 최강이다. 특히, 엑시노스 8 Octa (8890)는 ARM big.LITTLE 솔루션을 적용한 HMP 모드 지원 옥타코어 CPU를 탑재했다는 점에서 멀티코어 점수가 비슷하다면 이쪽이 더 낫다고 할 수 있다. GPU의 경우 전작인 A9 APL0898 & APL1022와 동일한 구성이지만 공정 개선과 GPU 클럭 향상만으로 최대 50% 수준의 성능 향상을 달성한 것으로 보인다. 이에 대해 big.LITTLE 솔루션 도입으로 인해 전력 면에서 여유가 생긴 것을 GPU 클럭을 높이는 데 사용한 것으로 추정되고 있다. 즉, 전체적으로 A9 APL0898 & APL1022보다 높은 수준의 점수를 내주고 있으며 Qualcomm의 Snapdragon 820 MSM8996과 Snapdragon 821 MSM8996 Pro보다 높은 점수를 내면서 격차를 벌려놓아서 2016년 말 기준으로 플래그십 스마트 디바이스 시장에서 앞서가는 형세를 더욱 굳히게 됐다. 특히, 2017년으로 넘어가서 10nm FinFET LPE 공정에서 생산된 삼성전자의 엑시노스 9 Series (8895)가 공개되었으나, 멀티코어 성능 기준으로 공정 차이와 CPU 코어 수 차이가 있음에도 불구하고 약 15% 정도밖에 떨어지지 않아서 여전히 높은 성능을 보여주고 있다.
4.1.7.1. A10X Fusion
A10 Fusion APL1W24의 성능 강화형 파생 모바일 AP로, A9X APL1021의 후속작이다. iPad Pro(12.9형)(2세대) | iPad Pro(10.5형)와 함께 공개되었다.
CPU는 Apple Hurricane을 트리플코어 구성으로 빅 클러스터를 이루고, Apple Zephyr를 트리플코어 구성으로 리틀 클러스터로 이뤄서 ARM big.LITTLE 솔루션을 적용한 헥사코어 CPU를 탑재했다. 단, HMP 모드는 지원하지 않는다. A10 Fusion APL1W24와 비교할 때 CPU는 빅 클러스터와 리틀 클러스터 모두 CPU 코어가 1개씩 증가했다.
GPU는 이매지네이션 테크놀러지 PowerVR GT7800+를 도데카 클러스터 구성으로 탑재했다. 전작인 A10 Fusion APL1W24와 비교할 때 약 30%의 성능 향상과 함께 약 2배 수준의 전력 효율을 가진다고 한다. 전작인 A9X APL1021와 구성은 동일하지만 공정 미세화로 인해 클럭이 높아지면서 성능이 향상되었다.
센서 허브의 역할을 수행하는 Apple M10 모션 인식 프로세서를 탑재했다.
메모리 컨트롤러도 탑재해서 LPDDR4 SDRAM, NVMe 규격을 지원한다. 이외에도 위상차 검출 AF를 지원하는 ISP를 탑재했다.
여기에 촬영 및 재생 등을 위한 여러 가지 코덱 및 컨트롤러 등을 탑재한 것으로 보인다.
생산 공정은 TSMC의 10nm FinFET 공정이다. 여담으로, 해당 공정에서 생산된 최초의 모바일 AP이다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 iPad Pro(12.9형)(2세대)를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 3,900 점으로 측정되었고 멀티코어 점수가 약 9,400 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Primate Labs의 Compute Bench 기준, 약 30,000 점으로 측정되었다.
결과만 놓고 본다면 CPU 성능은 전작인 A9X APL1021와 비교할 때 약 두 배가량 증가한 수치로 ARM 계열 CPU와 x86-64 계열 CPU를 단순하게 직접적으로 비교하기에는 무리가 있음을 감안해도 2013년 후반기 MacBook Pro보다 싱글코어 점수가 약 200 점가량 높다고 한다.
4.1.8. A11 Bionic
A10 Fusion APL1W24의 후속작으로 iPhone 8 | iPhone 8 Plus 그리고 iPhone X와 함께 공개되었다.
CPU는 Apple Monsoon을 듀얼코어 구성으로 빅 클러스터를 이루고, Apple Mistral를 쿼드코어 구성으로 리틀 클러스터로 이뤄서 ARM big.LITTLE 솔루션을 적용한 HMP 모드 지원 헥사코어 CPU를 탑재했다. 전작인 A10 Fusion APL1W24와 비교할 때 빅 클러스터 기준 약 25 %의 성능 향상이 있으며 리틀 클러스터 기준 약 70%의 성능 향상이 있다고 한다.
Anandtech에 따르면 리틀코어인 Mistral 마이크로아키텍처는 A6에 탑재되었던 Swift 마이크로아키텍처와 동일한 구조를 갖고 있다고 한다. 이는 A12까지 이어지며 리틀코어의 마이크로아키텍처 개선이 이뤄진 A13부터는 구조가 달라진 것으로 보인다.
GPU는 애플이 최초로 개발한 1세대 디자인 GPU 아키텍처를 트리플코어 구성으로 탑재했다. 전작인 A10 Fusion APL1W24와 비교할 때 약 30%의 성능 향상과 함께 약 2배 수준의 전력 효율을 가진다고 한다. 다만 Snapdragon 845보다는 GPU 성능이 떨어진다.
인공신경망 프로세서인 NPU는 Apple이 최초로 개발한 Neural Engine을 듀얼코어 구성으로 탑재했다. 이는 Apple의 모바일 AP로는 최초로 탑재한 것이다. 이로 인해 생체인식 솔루션과 연계해 사용하거나 AI 성능을 별도로 처리한다. 또한, 센서 허브의 역할을 수행하는 Apple M11 모션 인식 프로세서를 탑재했다.
메모리 컨트롤러도 탑재해서 LPDDR4X SDRAM, NVMe 규격을 지원한다. 이외에도 위상차 검출 AF를 지원하는 ISP를 탑재했다.
여기에 촬영 및 재생 등을 위한 여러 가지 코덱 및 컨트롤러 등을 탑재한 것으로 보인다.
생산 공정은 TSMC의 10nm FinFET 공정이다.
실제 기기의 CPU 동작 과정을 분석한 결과, 삼성전자의 Turbo Mode와 유사한 조치가 취해진 것이 확인되었다. 리틀 클러스터가 전부 작동할 때의 CPU 클럭은 1.6 GHz이고 싱글코어 구성으로 작동할 때의 CPU 클럭은 1.7 GHz이다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 iPhone X을 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 4,200 점으로 측정되었고 멀티코어 점수가 약 10,400 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Primate Labs의 Compute Bench 기준, 약 15,000 점으로 측정되었다.
연산 성능은 600 GOPS이며 기계학습에 특화되었다고 한다. 기본적으로 iPhone X에 탑재된 생체인식 솔루션인 Face ID를 위해 사용되지만 iOS의 머신러닝 API인 Core ML을 이용해서 개발자들이 별도의 서버를 이용하지 않고도 기기 내부적으로 머신러닝을 할 수 있도록 해준다고 한다. 기존 Apple의 모바일 AP를 포함해서 다른 ARM 계열 CPU 기반 모바일 AP와 비교할 때 큰 차별점을 가지게 된 이유 중 하나로 지목되고 있다.[34]
4.1.9. A12 Bionic
[image]
A11 Bionic APL1W72의 후속작으로 iPhone XS | iPhone XS Max 그리고 iPhone XR과 함께 공개되었다.
CPU는 Apple Vortex을 듀얼코어 구성으로 빅 클러스터를 이루고, Apple Tempest를 쿼드코어 구성으로 리틀 클러스터로 이뤄서 ARM big.LITTLE 솔루션을 적용한 HMP 모드 지원 헥사코어 CPU를 탑재했다. 전작인 A11 Bionic APL1W72와 비교할 때 빅 클러스터 기준 약 15%의 성능 향상과 약 40%의 전력 소모율 향상이 있으며 리틀 클러스터 기준 약 50%의 전력 소모율 향상이 있다고 한다.
GPU는 Apple G11P[35] 를 쿼드코어 구성으로 탑재했다. 전작인 A11 Bionic APL1W72와 비교할 때 약 50%의 성능 향상이 있다고 한다.
인공신경망 프로세서인 NPU를 탑재했다. 이로 인해 생체인식 솔루션과 연계해 사용하거나 AI 성능을 별도로 처리한다. 그런데, 파트넘버는 동일하지만 탑재된 기기에 따라 구성이 다르다. 우선 iPhone XS | iPhone XS Max 그리고 iPhone XR에는 Apple Next-Generation Neural engine을 옥타코어 구성으로 탑재했으며 최대 5 TOPS의 성능을 가진다.[36] 다만, A9 APL0898 & APL1022부터 모바일 AP에 내장[37] 되었던 모션 인식 프로세서는 탑재되지 않았다. 3세대 iPad Air와 5세대 iPad mini에는 Apple Neural engine을 탑재한 것으로 보이며[38] 센서 허브의 역할을 수행하는 Apple M12 모션 인식 프로세서를 탑재했다.
메모리 컨트롤러도 탑재해서 LPDDR4X SDRAM, NVMe 규격을 지원한다. 이외에도 위상차 검출 AF를 지원하는 ISP를 탑재했다.
여기에 촬영 및 재생 등을 위한 여러 가지 코덱 및 컨트롤러 등을 탑재한 것으로 보인다.
생산 공정은 TSMC의 7nm FinFET (ArFi) 공정으로 세계 최초로 7nm 공정에서 생산된 모바일 AP[39] 이다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 iPhone XS를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 4,800 점으로 측정되었고 멀티코어 점수가 약 11,000 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Primate Labs의 Compute Bench 기준, 약 21,000 점으로 측정되었다.
실제 기기의 CPU 동작 과정을 분석한 결과, 삼성전자의 Turbo Mode와 유사한 조치가 취해진 것이 확인되었다. 리틀 클러스터가 전부 작동할 때의 CPU 클럭은 1.53 GHz이고 싱글코어 구성으로 작동할 때의 CPU 클럭은 1.59 GHz이다.
전체적으로 A9 APL0898 & APL1022부터 A11 Bionic APL1W72까지 가파르게 올라가던 성능 향상보다는 전력 소모율의 개선과 머신러닝의 강화로 방향성을 치중한 것 같다는 평가가 나오고 있다.
CPU 성능은 전작인 A11 Bionic APL1W72과 비교해서 점수는 미미하게 상승하였다. 다만, 모바일 AP의 성능뿐만이 아니라 기기의 전체적인 요소들을 고려해 측정하는 Antutu의 경우, iPhone XS 기준으로 약 36만 점을 기록했다고 한다. 일단 L1 Cache의 용량이 늘어나고 NPU가 iPhone XS | iPhone XS Max 그리고 iPhone XR 기준으로 전작인 A11 Bionic APL1W72는 600 GOPS의 성능을 가졌지만 이번에는 8배 가량 높아진 5 TOPS의 성능을 가진 것을 보면 성능 향상은 이루어진 것이 맞지만 전통적인 벤치마크에서는 그동안 새로운 시리즈마다 보여주던 성능향상폭과는 다르게 점수의 상승치가 크지 않은 편이다.
그간 삼성전자의 엑시노스 시리즈 및 퀄컴의 Snapdragon 시리즈 소속 모바일 AP들이 해왔던 것처럼 배터리 타임을 개선하기 위해 모바일 AP의 전력 소모율을 개선하는 것이 사용자 입장에서 더욱 좋은 현상이라는 해석도 있다. 여기에 2017년 들어서 AI를 기반으로한 여러 소프트웨어들이 주요 콘텐츠로 사용되고 있는 스마트폰 시장의 특성을 고려하면 NPU는 Apple이 가지고 있는 중요하고도 좋은 요소 중 하나[40] 이기 때문에 전통적인 성능을 측정하는 부분에서 정체되었다고 해서 크게 문제되지 않을 것이라는 의견도 있다.
4.1.9.1. A12X Bionic
[image]
A10X Fusion APL1071의 후속작으로 3세대 12.9형 iPad Pro | 11형 iPad Pro와 함께 공개되었다.
CPU는 Apple Vortex을 쿼드코어 구성으로 빅 클러스터를 이루고, Apple Tempest를 쿼드코어 구성으로 리틀 클러스터로 이뤄서 ARM big.LITTLE 솔루션을 적용한 HMP 모드 지원 옥타코어 CPU를 탑재했다.
GPU는 Apple G11P를 헵타코어 구성으로 탑재했다.
인공신경망 프로세서인 NPU는 Apple Neural engine을 탑재했다.[42] 이로 인해 생체인식 솔루션과 연계해 사용하거나 AI 성능을 별도로 처리한다. 또한, 센서 허브의 역할을 수행하는 Apple M12 모션 인식 프로세서를 탑재했다.
메모리 컨트롤러도 탑재해서 LPDDR4X SDRAM, NVMe 규격을 지원한다. 이외에도 위상차 검출 AF를 지원하는 ISP를 탑재했다.
여기에 촬영 및 재생 등을 위한 여러 가지 코덱 및 컨트롤러 등을 탑재한 것으로 보인다.
생산 공정은 TSMC의 7nm FinFET (ArFi) 공정이다.
벤치마크 결과의 경우, 해당 모바일 AP를 기반으로 한 개발 보드는 존재하지 않은 상황이다. 실제 탑재된 기기인 3세대 12.9형 iPad Pro를 기준으로 할 때 CPU 성능은 Primate Labs의 Geekbench 4 기준, 싱글코어 점수가 약 5,000 점으로 측정되었고 멀티코어 점수가 약 18,000 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Primate Labs의 Compute Bench 기준, 약 44,000 점으로 측정되었다.
CPU 성능에 대해서는 동일한 Primate Labs의 Geekbench 4 기준으로 인텔의 8세대 i5-8400와 동급 내지 하위 호환 수준의 점수를 뽑아주고 있다. 특히, 해당 프로세서가 일반 데스크톱 타겟 프로세서 임을 감안한다면 모바일 AP에서 이 정도 뽑아내는 것은 연산력이 매우 높다고 할 수 있다는 의견이 있다.[43]
GPU 성능에 대해서 Apple은 Microsoft의 Xbox One S에 탑재된 GPU보다 높다고 밝히고 있다. 또한 Primate Labs의 Compute Bench 기준으로 44,000점을 기록하였다. 이는 MacBook Pro 13형 2018년형의 Iris Plus 655의 성능을 능가하며 MacBook Pro 15형 기본모델의 Radeon Pro 555X의 성능보다는 열세인 수준이다. 전체적으로 GPU 성능은 엔비디아의 GeForce GT 1030과 비슷한 성능으로 취급되고 있다. 게이밍 성능과 실시간 3D 렌더링 성능 지표로 자주 인용되는 GFX Bench에서는 AMD Radeon Pro 555x를 능가하며 Intel Iris Plus 655와는 2배 이상의 격차를 보여주고 있다.# A12X의 개량형인 A12Z를 탑재한 DTK에서 Rosetta2로 구동된 섀도우 오브 더 툼 레이더의 준수한 소비전력 대비 성능은 이러한 높은 수준의 애플 GPU의 성능에 기인한 것이다.
4.1.9.2. A12Z Bionic
[image]
A12X Bionic APL1083의 개선형 AP로 4세대 12.9형 iPad Pro 및 2세대 11형 iPad Pro와 함께 공개되었다.
CPU는 공개일 기준, 정확한 정보에 대해서는 알려지지 않았다.
GPU는 공개일 기준, 정확한 정보에 대해서는 알려지지 않았다. Apple은 옥타코어 구성으로 탑재했다고만 밝혔다.
인공신경망 프로세서인 NPU는 Apple Neural engine을 탑재했다.[44] 이로 인해 생체인식 솔루션과 연계해 사용하거나 AI 성능을 별도로 처리한다. 또한, 센서 허브의 역할을 수행하는 Apple M12 모션 인식 프로세서를 탑재했다.
메모리 컨트롤러도 탑재했다. 그러나 지원 규격에 대해서는 공개일 기준, 알려지지 않았다. 이외에도 위상차 검출 AF를 지원하는 ISP를 탑재했다.
여기에 촬영 및 재생 등을 위한 여러 가지 코덱 및 컨트롤러 등을 탑재한 것으로 보인다.
생산 공정은 TSMC의 7nm FinFET 계열의 공정이다. 다만, 여러 공정 중 어떤 공정에서 생산되었는지는 확인되지 않았다.
링크를 보면 A12Z는 단순히 기존 A12X에 비활성화되어있던 GPU코어를 활성화한것에 불과하다는 주장이 제기되었는데 평면도 분석 결과 사실로 밝혀졌다.
WWDC 2020에서, A12Z칩셋을 그대로 사용해 macOS를 시연했다. 또한 ARM Mac의 호환성 체크를 위한 개발자용 Mac 기기를 500달러에 대여하는 서비스도 시작했는데, 이 기기에도 A12Z가 탑재되었다. 단, 원본 그대로는 아니고 RAM이 16GB로 올라갔다. 근데 이걸 가지고 Mac에서 5GB 가량의 포토샵 사진을 끊김없이 실시간 처리하고, 4K 영상 여러개를 실시간으로 렌더링하는 우수한 성능을 보여주었으며, Rosetta 2를 통한 x86 에뮬레이션이라는 불리한 환경에서도 쉐도우 오브 더 툼 레이더를 1080p로 구동해내는 모습을 보여줬다.
데스크탑용 벤치마크 툴인 시네벤치 R23버전이 업데이트되면서 arm기반 macOS를 지원하기 시작했다. 여기서 저번 6월에 공개됐었던 A12Z Bionic가 탑재된 개발자 킷의 밴치마크가 유출되었는데, 점수는 싱글 987점 / 멀티 4530점으로 나왔다. 이는 AMD Ryzen 5 2400G와 대등소이한 점수다. 랩탑 라인업에서는 Intel Core i5-1035G7과 비슷하다.
4.1.10. A13 Bionic
A12 Bionic APL1W81의 후속작으로 iPhone 11 | iPhone 11 Pro | iPhone 11 Pro Max와 함께 공개되었다.
CPU는 ARM big.LITTLE 기술을 채용하여 듀얼코어 Lightning를 빅 클러스터로, 쿼드코어 Thunder를 리틀 클러스터로 구성하였으며, 전작 대비 빅 클러스터 기준 약 20%의 성능 향상과 약 30%의 전력 소모율 향상이 있으며 리틀 클러스터 기준 약 20%의 성능 향상과 약 40%의 전력 소모율 향상이 있다고 한다.
GPU는 3세대 디자인 GPU 아키텍처를 쿼드코어 구성으로 탑재했다. 전작 대비 약 20%의 성능 향상과 약 40%의 전력 소모율 향상이 있다고 한다.
이외에도 위상차 검출 AF를 지원하는 ISP와, 영상 인코딩/디코딩을 위한 전용 하드웨어를 탑재한 것으로 보인다.
생산 공정은 TSMC의 7nm FinFET Performance-Enhanced Version (ArFi) 공정이다.
벤치마크 결과의 경우, iPhone 11을 기준으로 할 때 CPU 성능은 Geekbench 4 기준, 싱글코어 점수가 약 5,400 점으로 측정되었고 멀티코어 점수가 약 13,800 점으로 측정되었으며 Geekbench 5 기준, 싱글코어 점수가 약 1,350 점으로 측정되었고 멀티코어 점수가 약 3,300 점으로 측정되었다. GPU 성능은 Apple Metal API로 측정되는 Compute Bench 기준, 약 29,000 점으로 측정되었다.
Anandtech에서 A13 Bionic을 분석한 결과 전작인 A12 Bionic에 비해 클럭은 고성능 코어의 경우 6% 오른 2.67Ghz로 고효율 코어는 최대 12.3% 증가한 1.73Ghz로 작동한다고 밝혀졌다.[45] 특히 고효율 코어의 경우 전작인 A12보다 마이크로아키텍처에서 많은 부분이 변경되었는데 이로 인해 얻은 IPC 향상은 최대 38%라는 뛰어난 모습을 보여주고 있다. 이는 Snapdragon 855에 탑재된 리틀코어인 Cortex-A55보다 2.5배에서 3배 성능이 뛰어나며 또한 A55보다 절반 이하의 에너지를 소모하는 결과를 보여준다고 한다.
4.1.11. A14 Bionic
[image]
A13 Bionic APL1W85의 후속작으로 iPad Air(4세대)와 함께 공개 되었다.[47]
CPU는 ARM big.LITTLE 기술을 채용하여 2코어 Apple Firestorm을 빅 클러스터로, 4코어 Apple Icestorm을 리틀 클러스터로 구성하였으며, '''Apple A12 Bionic APL1W81''' 대비 약 40%의 성능 향상과 약 xx%의 전력 소모율 향상이 있다고 한다. Apple A13 Bionic APL1W85와 비교하면 약 16%의 성능 향상폭을 가진 셈이다.
GPU는 3세대 디자인 GPU 아키텍처를 4코어 구성으로 탑재했다. Apple A12 Bionic APL1W81 대비 약 30%의 성능 향상과 약 xx%의 전력 효율 향상이 있다고 한다. Apple A13 Bionic APL1W85와 비교하면 약 8%의 향상폭을 가진 셈이다.
NPU는 Apple 자체 뉴럴 코어 아키텍쳐를 16코어 구성으로 탑재했다. 공정 미세화로 인해 확보한 트랜지스터는 거의 다 Neural Engine의 성능 향상에 투자한 것으로 보인다. Apple 발표치에 따르면 성능은 11 TOPS이다. CPU에는 2세대 기계 학습 가속기가 들어가, 기계 학습 연산력이 기존 대비 10배가 증가했다.
이외에도 위상차 검출 AF를 지원하는 ISP와, 영상 인코딩/디코딩을 위한 전용 하드웨어를 탑재한 것으로 보인다.
생산 공정은 TSMC의 5nm FinFET (EUV) 공정이다. 5nm 공정 프로세서는 모바일 AP 중 최초이다. 트랜지스터 수는 Apple A13 Bionic APL1W85의 85억개에서 118억개로 약 38% 증가하였다고 한다.
벤치마크 결과의 경우 아직 공개되지 않았다. 다만 현재까지 발표 내용을 종합하면, 공정 미세화를 통하여 성능 향상 보다는 5G에 대비하여 AP의 전력효율 향상에 베팅하였다는 추정이 있다. 유명 IT 팁스터 아이스 유니버스가 공개한 AnTutu 벤치 결과에서도 A13 대비 성능 향상 폭은 상당히 적다는 것을 확인할 수 있고, 아이스 유니버스도 전력 소비와 발열, AI 성능을 개선하는데 중점을 둔 것 같다고 추측했다. #
2020년 10월 3일, Geekbench에 벤치마크 결과가 등록되었다. Geekbench 5 기준, 싱글코어 점수는 1,583점, 멀티코어 점수는 4,198점으로 측정되었다. A13 Bionic 대비 약 18~19% 정도의 향상된 것으로 확인된다.
4.2. M 시리즈
4.2.1. M1
Apple이 한국 시간 기준 2020년 11월 11일 오전 3시 Apple 이벤트#s-2.16.4에서 발표한 SoC로, Apple Silicon 기반 Mac에 탑재된 첫번째 SoC이다.
CPU는 ARM big.LITTLE 기술을 채용하여 4코어 Apple Firestorm을 빅 클러스터로, 4코어 Apple Icestorm을 리틀 클러스터로 총 8코어 CPU의 구성을 이룬다. Apple은 13형 MacBook Pro에 들어가던 Intel CPU 대비 Apple M1이 2.8배의 CPU 성능을 가지며, x86 CPU와 비교시 3배의 전력 효율을 가진다고 밝혔다.
Apple Firestorm은 8-Wide 디코더 구조를 가지는데, 이는 현용 CPU 역사상 가장 넓은 아키텍쳐에 속한다. 아직 출시되지 않은 IBM POWER10, 그리고 태어나지 못한채로 프로젝트가 드랍이 된 SARC의 Exynos M6만이 이정도의 코어 규모를 가진다고 한다. 백엔드 면에서도 Apple의 Firestorm은 7개의 정수 실행 유닛과 전작 대비 33% 확장된 4개의 FP/Vector 연산 유닛을 보유한다. 이를 통하여 약 3GHz의 클럭에서도 약 5GHz 전후로 작동이 되는 x86 CPU들을 SPECint/fp 기준 1코어 성능 비교에서 비등한 성능을 내고 있으며, AMD와 인텔의 x86 코어가 약 20W로 작동할 때, Apple의 Firestorm은 코어당 약 4~5W 선으로 전력소모를 억제하는 데 성공하였다. 최대 전력 소모량은 성능코어 최대 13.8W, 효율코어 최대 1.3W이다.
RAM은 SoC 패키지 안에 통합되어 있으며, 현재는 8GB와 16GB만 제공한다. CPU 다이 바로 옆에 메모리가 위치하여 극단적으로 짧은 레이턴시 특성을 가지며, M1이 높은 성능경쟁력을 가지는 비결 중 하나로 꼽힌다. 반면 이 때문에 RAM 확장이 어렵다는 단점이 있다.[50] Intel도 레이크필드에서 CPU 패키징에 LPDDR4X-4266MHz를 올렸지만 메모리 성능은 M1쪽이 2~3배 이상 이득을 보고 있는데 레이크필드는 모바일용으로 칩 사이즈를 줄이기 위해 칩 위에 칩을 얹는(Package on Package) POP 방식을 사용하면서[51] 듀얼채널로 메모리 컨트롤러와 연결되었었지만 M1은 이런 제약이 없이 쿼드채널로 연결되어 68GB/s의 대역폭을 가진다.
GPU는 3세대 디자인 GPU 아키텍처를 8코어 구성으로 탑재했다. 이를 통하여 섀도 오브 더 툼 레이더를 구동시 이전 세대의 MacBook Air와 비교하여 3.1배 더 빠른 게임 성능을 낼 수 있다고 한다. MacBook Air 기본형에는 7코어 구성으로 탑재된다.
128개의 실행 유닛(Execution Units)을 가지며, 2.6TFLOPS의 FP32 연산성능, 82GTex/s의 텍스쳐 성능과 41GPix/s의 ROP 성능을 가지며, 경쟁사 GPU와 비교시 2배의 전력 효율을 가진다고 밝혔는데, 이는 데스크탑용 GPU인 GTX 1050Ti와 GTX 1650 사이 급에 해당하는 연산성능 / TMU / ROP 성능을 보유한 셈이다. 다른 점이라면, 위의 데스크탑용 GPU는 TSMC의 N16, 그리고 N16의 하프노드인 N12에서 생산되는데 반해, Apple M1의 GPU는 N5 공정에서 생산되기 때문에 풀노드 기준으로 생산 공정이 3세대 차이가 났고, 그로 인하여 TDP 10W대의 AP 내에 넣을 수 있을 정도로 다이 면적, 전력 효율이 개선되었을 것이다.
NPU는 Apple 자체 뉴럴 코어 아키텍쳐를 16코어 구성으로 탑재했다. A14 Bionic과 동일한 11TOPS의 성능을 가진다고 한다.
이외에도 ISP와, 영상 인코딩/디코딩을 위한 전용 하드웨어를 탑재한 것으로 보인다. 그 외에도 PCI-E 4.0 등의 IO 규격을 지원한다.
생산 공정은 TSMC의 5nm FinFET (EUV) 공정이다. 트랜지스터 수는 Apple A14의 118억개에서 160억개로 약 35% 증가하였다고 한다. 다이 면적은 실측치 기준 약 120mm^2 수준이며, 트랜지스터 밀도는 약 133MT/mm^2 이다. 이는 N5의 이론상의 밀도보다는 부족한 수준이나, 2020H2 기준 최고로 미세한 공정을 사용한 것이라는 데에는 아무런 이견이 없다.
벤치마크 결과는 Geekbench 5 버전에 MacBook Air 기준으로 싱글 코어 약 1,700점, 멀티 코어 약 7,400점으로 확인되었다.# 이는 싱글코어 기준 기존 27형 Retina 5K 디스플레이 iMac, 16형 MacBook Pro 모델보다도 '''무려 400점 이상 더 높은 성능'''이라 기대를 모으고 있다. 또한 MacBook Pro의 Cinebench R23 점수가 나왔는데#, 싱글 코어 약 1,500점, 멀티 코어 약 7,500점이 나왔는데 이는 Ryzen 5600X와 비슷한 싱글코어 점수, Ryzen 2600X와 비슷한 멀티코어 점수이다. 저전력 프로세서와 비교하면 싱글코어는 i7-1165G7과 비슷하며#, 멀티코어는 Ryzen 4600U보다 낮은 수준이다.#
현재 M1 칩셋 탑재 Mac 제품군 모두에서 블루투스 관련 문제를 겪는 사례가 보고되고 있다. # 다음 업데이트에서 해결될 것으로 보인다.
ARM 기반이기 때문에 iOS용 앱들을 별도의 에뮬레이터 없이도 돌릴 수 있게 되었다. 기술적인 걸림돌은 사라졌으나 앱 개발자가 macOS에서도 사용할 수 있게 허가를 하지 않으면 다운로드가 불가능하다. 국내의 경우 2021년 초 기준 대부분의 뱅킹과 게임앱들은 이를 허용해놓지 않아 Mac에서의 사용이 불가능하다.
4.3. S 시리즈
4.3.1. S1
SoC가 아닌 SiP[53] 이다. 이는 스마트 워치인 Apple Watch에 탑재하기 위해 들어가는 많은 부품들을 작은 하나의 패키지로 통합하기 위함으로, 프로세서뿐만이 아니라 RAM, 낸드 플래시, NFC 컨트롤러, 터치 컨트롤러, 무선충전 솔루션, 통신 모듈 등 '''배터리만 빼고 모든 것이 원칩으로 집약'''되어 있다고 한다.
4.3.1.1. S1P
기존의 Apple Watch가 Apple Watch Series 2의 출시와 함께 Apple Watch Series 1으로 리네이밍되며 코어가 듀얼코어로 바뀌었고, 이에 S1칩의 명칭도 S1P칩으로 변경되었다. 같은 듀얼코어지만 S2가 아닌 이유는 GPS 모듈이 없기 때문으로 추정된다.
4.3.2. S2
Apple Watch의 2세대 모델 중 Apple Watch Series 2에서 처음 사용된 SIP이다. 같은 2세대 모델이지만 기존 1세대를 대체하는 제품인 Apple Watch Series 1에는 이 칩이 아닌 S1P칩이 탑재되었다. 듀얼코어이며 GPU성능이 업그레이드 되었다고 하나, 확실한 스펙은 밝혀지지 않았다. Apple 측의 주장으로는 CPU는 1.5배, GPU는 2배 가량 더 빨라졌다고 한다.
4.3.3. S3
Apple Watch Series 3에 사용된 SiP이다. Apple에 따르면 70%의 성능 향상과 50%의 전력효율이 증가되었다고 한다.
4.3.4. S4
Apple Watch Series 4에 사용된 SiP이다. Apple Watch에 최초로 탑재된 64비트 CPU로 Apple A12의 리틀코어인 Tempest 듀얼코어로 구성되어있다. GPU는 A12와 비슷하게 Apple에서 자체 디자인한 G11M을 탑재하였다 또한 S4칩에 뉴럴 엔진도 탑재가 되어 watchOS 6부터는 코어 ML를 지원한다. Apple에 따르면 S3에 비해 최대 2배 빨라졌다고 한다.
테스트를 해본 결과 iPhone 6s 이상의 기기에서만 가능할 프로세싱 파워를 보여주었다고 한다.
4.3.5. S5
Apple Watch Series 5에 사용된 SiP이다. S4와 비교했을 때 프로세서와 GPU는 동결되어 성능은 같다. 다만 AOD기능을 위한 저전력 디스플레이 컨트롤러 및 내장 나침반이 SiP 패키지에 추가되었다.
4.3.6. S6
Apple Watch Series 6에 사용된 SiP이다. S5와 비교했을 때 최대 20% 빨라졌다고 소개하고 있다. Apple S4와 유사하게 Apple A13 Bionic의 저전력 코어인 Thunder 듀얼코어로 구성되어있다. 또한 S4와 S5칩처럼 Apple W3 무선통신 칩을 내장하고 있고 새로운 Apple U1 초광대역 칩과 상시 감지형 고도계가 SIP 패키지에 추가된 것으로 보인다. 그리고 드디어 5 GHz Wi-Fi를 지원한다.
4.4. W 시리즈
W시리즈 칩은 Apple의 음향 기기, Apple Watch 등 소형 디바이스의 원활한 연결을 위한 통신, 오디오 처리 등의 기능을 담은 칩이다.
사실 이쪽은 AP 가 아닌 마이크로컨트롤러에 가까운 SoC이다.
4.4.1. W1
Apple의 AirPods, Beats의 Power Beats 3와 Beats X 등의 제품에 탑재된 칩셋이다. 블루투스 4.2를 지원한다.
Apple은 이 칩이 고음질의 음원을 지원하면서 블루투스 사용 상태를 효율적으로 관리하여 배터리를 오래 쓸 수 있게끔 하며, 자동으로 사용 설정을 해줄 수 있다고 주장한다.# 실제로 AirPods는 유닛의 무게와 크기에 비해 매우 긴 배터리타임을 가지며, 발매 이후 2년이 지난 2018년 기준으로도 수준급의 배터리 성능을 보여주고 있다.
W1칩이 복제 당하는 바람에 짝퉁 AirPods도 정품인증이 되는 사태가 발생했다.#
4.4.2. W2
W1칩의 후속작으로, Apple의 Apple Watch Series 3에 탑재된 통신 관련 칩셋이다. 블루투스 4.2를 지원하지만, 5는 지원하지 않는다.
Apple에 따르면 W2칩에 의해 Apple Watch의 Wi-Fi 속도가 85% 더 빨라졌으며, 블루투스 및 Wi-Fi를 사용할 때 소모되는 배터리 역시 50% 더 줄어들어 더욱 효율적으로 변했고, 이 덕분에 이전과 동일한 배터리 용량으로도 하루 종일 사용할 수 있게 되었다고 한다.#
4.4.3. W3
W1 및 W2칩의 후속작으로, Apple의 Apple Watch Series 4에 새로 탑재된 통신 관련 칩셋이다.
W2칩은 블루투스 4.2까지만 지원했었지만, W3부터는 블루투스 5를 지원하도록 변경되었다.
4.5. H 시리즈
4.5.1. H1
AirPods(2세대), AirPods Pro, Powerbeats Pro, Powerbeats, AirPods Max에 사용된 통신 칩이다. AirPods 제품군에 사용된 것을 보아서 H칩은 사실상 W칩의 후속인것으로 예상된다.
분해 리뷰에 따르면 H1 칩은 iPhone 4의 프로세싱 파워를 갖고 있다고 한다. 즉, H1칩의 프로세싱 파워는 A4칩과 동급이라는 분석이다. 또한 블루투스 5를 지원한다고 한다.
4.6. T 시리즈
4.6.1. T1
Apple이 MacBook에 Touch ID를 도입하며 추가한 AP이다. bridgeOS라 불리는 watchOS를 커스텀한 별도의 OS에서 돌아가며, macOS와는 분리되어 있어 시스템에서 제한적인 접근만 가능하다.[54]
이 점을 이용해 FaceTime 카메라 역시 이 프로세서로 작동되도록 만들어놨는데, 이 덕에 MacBook Pro 2016~2017 모델에서 카메라 해킹 사고는 일어나지 않을 것이라 예상되었고, 실제로도 상당한 성과를 내고 있는 듯 보인다.
다른 Touch ID 탑재 Apple 기기들과 동일하게 보안칩이 해당 MacBook Pro의 Touch ID 모듈과 1:1 매치되어 전원 버튼 모듈만의 교체가 불가능하며 '''전원 버튼 고장 시 로직보드까지 함께 교체해야 한다.'''
4.6.2. T2
Apple T2 Security Chip Security Overview
Crypto Officer Role Guidefor FIPS 140-2 Compliancefor ARM
T1과의 차이점은 다음과 같다:
- ISP(Image Signal Processor)가 들어가 FaceTime HD 카메라의 성능이 더 좋아졌다. (톤 매핑, 노출 제어, 자동 화이트밸런스 지원)
- 오디오 컨트롤러가 T2 칩에 들어가게 되면서, 더 나은 마이크/스테레오 스피커 성능을 보여준다.[55] 또한 Hey Siri(시리야) 기능도 사용할 수 있게 되었다.
- 암호화를 위한 전용 AES 엔진을 포함한 Mass Storage Controller가 들어가 FileVault를 켜든, 켜지 않든 디스크를 무조건 암호화하도록 변경되었다. T2 칩이 달려있지 않은 Mac의 경우 FileVault를 켰을 때 성능 저하가 발생하지만 T2 칩이 탑재된 Mac의 경우 성능 저하가 발생하지 않는다.[56]
- Secure Boot 기능이 추가되었다.
-하드웨어 HEVC 인코딩을 지원한다
SSD를 다른 iMac Pro나 MacBook Pro에 넣어도 파일을 못 읽게 하는 등 각종 보안과 관련된 정보를 처리하도록 업데이트되었다. 처음에는 iMac Pro에만 쓰였지만, 2018년 리뉴얼되어 출시한 MacBook Pro에도 탑재되었다. 그리고 새로 리메이크된 MacBook Air와 Mac mini에서도 탑재되었다. 2020년에 리프레시된 아이맥 27인치 모델도 지원한다.
링크1 부가적인 기능으로 '''탑재 기기의 임의적 부품 교체를 감지'''하고 오류코드와 함깨 '''기기를 잠가버리는 사설수리를 차단하는 킬스위치''' 역할을 병행한다고 한다.
링크2 비활성화 상태이지만 미국 내의 법령 해석 등의 변화에 따라 언제든지 소프트웨어 업데이트를 통해 임의수리 차단기능의 활성화가 가능하다고 한다.
보안 취약점이 발견되었다. T2칩의 기반인 A10 Fusion의 취약점을 응용한 것으로 보안을 위해 읽기 전용으로 만든 탓에 패치로 해결이 불가능하고 칩을 교체해야 한다고 한다.
다행히도 특수 제작된 USB-C 케이블을 물리적으로 연결 해야 하고 FileVault 암호화로 보호되는 파일을 해독 할 수는 없지만, 키로거 정도는 가능하다곤 한다.
4.7. U 시리즈
4.7.1. U1
- 주요 사용 기기: iPhone 11 전 모델, iPhone 12 전 모델, Apple Watch Series 6, HomePod mini
5. 관련 문서
- 퀄컴의 퀄컴 스냅드래곤 시리즈
- 삼성전자의 삼성 엑시노스 시리즈
- 화웨이의 인하우스 AP 설계업체 하이실리콘
- 미디어텍의 미디어텍 Helio, 미디어텍 Dimensity 시리즈
- ARM 기반 AP 벤치마크 모음
[1] 이는 게임 콘솔의 설계사상과도 비슷하다. 하드웨어와 소프트웨어 모두 자가 규격에 맞춰 개발하기에 상대적으로 CPU 활용이 효율적이기 때문이다.[2] Apple은 유난히 그 덩치에 비해서 보유한 특허 수가 적고, 특히 통신 분야에서는 그 정도가 더욱 심하다. 통신 특허 분야에서는 쟁쟁한 업체들이 워낙 많기에 통신 모뎀을 개발하지 않는 것이다. 그러나 2019년 7월에 Apple이 인텔의 모뎀사업부를 인수하면서 향후 Apple의 원칩 AP가 나올 가능성이 열렸다.[3] 이는 Apple이 본디 모바일 기기나 관련 업종에서는 비교적 신생 기업이기 때문이다. 그 분야에서 이미 개발된 것들이 많기 때문에 굳이 많은 비용을 투자해서 완전 독자적인 기술을 개발할 필요가 없는 것이다. 다른 쟁쟁한 업체들의 특허를 피해서 개발하는 것이 불가능에 가까운 수준이기도 하고... 사실 iPhone의 통화 성능 자체는 별로 좋았던 적이 없다.(...)[4] 1년 늦게 나오고 미국 시장에 팔지도 않은 갤럭시 A8(2016)은 예외.[5] 그나마도 64bit 애플리케이션은 1년 넘게 아예 지원이 안되다가 2020년 하반기에야 지원하는 것으로 결정이 났다. 설령 지원이 된다 하더라도 속도가 심각하게 느리다는 것이 문제지만.[6] macOS에서는 macOS Catalina부터, iOS에서는 11부터 32bit 애플리케이션이 더 이상 실행되지 않는다.[7] M1 칩에 대해서는 Boot Camp 지원 계획이 없다. # 대신 Parallels Desktop은 Windows 10 on ARM을 에뮬레이션하는 형태로 M1 칩을 지원할 예정이라고 한다. #[8] 물론 Mac에서 터치스크린이 지원되지 않는다는 가정 하에서는 개발자가 최적화를 지원해줘야 한다는 점은 걸림돌이다.[9] iPhone 3GS는 당대 최강의 성능을 보여주었던, 갤럭시 S에도 탑재되었던 삼성전자 허밍버드를 iOS에 맞도록 커스텀한 후 사실상 그대로 탑재하였다. 덕분에 성능 면에서 타 스마트폰들을 확실히 제압할 만한 성능을 낼 수 있었고, 이후 iPhone 4에는 허밍버드를 개선한 AP를 iOS에 적합하도록 커스텀하여 또 다시 한번 탑재하게 된다. 다만 구조는 변경된 부분이 있다. 이러한 삼성전자와 Apple의 밀월관계는 iPhone 4s 때까지 지속된다.[10] Apple A8의 물량이 그야말로 엄청났기에 Qualcomm을 비롯한 다른 대형 제조사들도 Apple에게 밀려 TSMC에게는 찬밥신세가 되었다. TSMC는 이로 인해서 자사의 생산공정을 미세화할 여력이 미처 없었고, 동시기의 AP였던 Snapdragon 805 APQ8084마저 기존 공정으로 생산되게 된다. 반면 삼성전자 시스템 LSI 사업부는 초창기에 모든 물량을 자사의 삼성 엑시노스와 함께 자사가 전량 생산하면서도 그런 것 없었다.[11] 그러나 이로 인해서 모바일 AP계에 커다란 문제가 발생하게 된다. Qualcomm Snapdragon 시리즈의 공정 미세화가 늦어짐으로써 발생한 사태였다. 자세한 내용은 퀄컴 스냅드래곤/8XX 라인업 문서 참조.[12] 실제로, Apple A9는 삼성전자 시스템 LSI 사업부와 TSMC에서 동시에 생산하기도 했다.[13] iPad mini 출시 이전 기기에서 사용했다.[14] iPad mini 출시 이후 기기에서 사용했다.[15] 초기에는 통상 듀얼코어 버전을 사용했으나 이후 전용의 싱글코어 버전을 사용하게 됨.[16] 그나마 태블릿 컴퓨터는 소형기기는 아니고 보통 들거나 세워놓고 사용하기 때문에 실제로 느끼는 체감온도는 비교적 적다. 허나 iPad 2/iPad 4세대 대비 체감온도는 확실하게 높다.[17] ARM Mali T-604나 Snapdragon S4 Pro APQ8064의 Qualcomm Adreno 320이 절대적으로 불리한 상황에서는 동급의 성능이 나올 수도 있었다는 뜻이다. 이들과 A6X의 GPU가 동급이었다는 말로 받아들이면 곤란하다. 다만 성능/전력소비 깡패였던 삼성 엑시노스 5250의 T-604는 논외.[18] 1136×640[19] 4인치대의 iPhone의 해상도는 FHD(1920×1080)에 비해 처리해야 할 양이 반도 채 되지 않는다(FHD가 2.8배 정도 더 많다). 따라서 비교적 저성능의 GPU로도 더 고성능을 낼 수 있다.[20] 물론 그래픽 성능은 온스크린 성능만이 전부가 아니기 때문에 2.8배 더 효율이 좋은 것은 아니지만, 오프스크린 성능이 크게 떨어지지 않는 이상 웬만하면 더 높은 성능을 낼 수 있다.[21] 단 약간씩 딜레이가 생긴다.[22] 모바일 AP 전체로 확대해보면, 동급인 22nm 공정에서 생산된 인텔 아톰 시리즈의 Bay Trail 시리즈가 있고, 아톰보다 더욱 미세한 20nm 공정으로는 A8보다 수개월 먼저 출시되어 갤럭시 알파와 갤럭시 노트 4에 탑재된 삼성 엑시노스 5430과 5433이 있다.[23] 여담으로, 인텔 하스웰 마이크로아키텍처를 탑재한 모바일 저전력 인텔 코어 i5 & i7 시리즈의 트랜지스터 갯수는 약 14억 개이다. '''그러나 절대 이 문장만으로 오해하지 말자.''' 저전력 아키텍처인 ARM 입장에서는 x86은 생각보다 호락호락한 놈들이 아니다.[24] 당연하지만 트랜지스터 수가 성능에 직결되는 것은 절대 아니다. AP 특성상 CPU, GPU가 통합되어 있고, 지원하는 명령어 셋도 훨씬 적으며, 모바일 AP는 LP공정으로 생산돼서 훨씬 낮은 전압, 비교적 낮은 클럭스피드로 돌아간다는 걸 감안해야 한다. 또한 동 클럭에서도 트랜지스터 수당 성능을 비롯한 여러 가지의 요소가 존재하므로 A8X를 비롯한 ARM 모바일 AP의 성능은 하스웰은커녕 콘로 시기의 x86 계열에 비벼볼 성능조차 되지 못한다. 이들의 실제 성능을 알아보고 싶다면 운영체제를 리눅스 계열로 통일한 후 벤치마크 작업을 수행한 그래프를 보자. 아마도 대부분은 놀랄 것이다.[25] 오해할까 봐 여기에서 언급하지만 '''절대''' 코어 1개당 성능이 MacBook Air에 근접한다는 뜻이 아니다. 모바일 OS는 PC용 OS보다 벤치마크 점수가 훨씬 잘 나온다는 사실 하나만 알아두자. 이유가 궁금하다면 ARM(CPU)와 IBM PC 호환기종 문서 참조. 실제 성능을 알아보려면 운영체제를 우분투 등으로 통일한 후 측정하여야 한다.[26] 삼성전자 시스템 LSI 사업부 역시 14nm 공정 로드맵이 2단계로 되어있다. 14nm FinFET LPE 공정은 1단계로, 2단계인 14nm FinFET LPP 공정은 2016년 1분기에 상용화될 예정이라고 한다. TSMC 역시 정석대로 간다면 삼성전자 시스템 LSI 사업부와 비슷한 시기에 16nm FinFET+ 공정이 상용화 되었겠지만, TSMC의 16nm 공정 로드맵 자체가 최대 1년 정도 지연되었기 때문에 일정이 조정된 것으로 보인다.[27] 다르게 말하면 다른 벤치마크 프로그램보다 전력 소모량이 더 커 삼성전자 생산분인 APL0898에 대하여 불리한 결과를 내놓을 수 있다는 것이다.[28] 삼성제 A9으로 나온 SE가 오히려 TSMC제 A9보다 쓰로틀링 성능이 더 좋았고 이런 상황이 벌어진 원인을 찾기 위해 TSMC제 A9이 장착된 3대를 더 구해서 측정해본 결과 같은 A9이 맞나 싶을 수준으로 개체 간의 차이가 심하게 나타났다.[29] True 14nm.[30] 삼성 14nm의 프로세스 노드가 게이트 피치 78nm, 메탈 피치 64nm이며 TSMC 16nm의 프로세스 노드가 게이트 피치 90nm, 메탈 피치 64nm임을 고려하면 이는 '''인텔의 22nm 프로세스 노드인 게이트 피치 90nm, 메탈 피치 80nm에 가까운 수준이다.''' 이렇듯 삼성이나 TSMC나 20nm 시절의 백앤드를 그대로 끌고와 14nm이네 16nm이네 해봐야...[31] 애초에 공정이 앞서네 뒤쳐지네 하는 건 스피드 게인보다도 양산이 가능한가가 더 크다. 그리고 이번엔 그게 안 되니까 두 기업에 쪼개서 물량을 맡긴 것이다.[32] 사실 같은 면적 기준으로는 어느정돈 있는게 당연하긴 하다. 근데 또 삼성제와 TSMC제의 면적이 같은 것도 아니라서...[33] 자세한 내용을 알고 싶다면 캐시 메모리 문서를 참조바람[34] 기존에는 데이터 네트워크를 이용해 대규모 서버의 인공신경망에서 처리된 데이터를 사용자들이 기기로 받아보는 것 이외에는 머신러닝을 효율적으로 사용할 방법이 없었고 기존의 CPU와 GPU를 이용한 기기 내부적인 머신러닝은 상당히 비효율적이었다. 그래서 이를 전담하는 프로세서를 내장해서 GPU를 이용할 때보다 훨씬 적은 전력을 소모하는 머신러닝을 구현할 수 있으며 이는 대형 서버에 의존하지 않고도 기기 자체적으로 효율적인 머신러닝을 소비자들이 이용할 수 있게 되었다는 점에서 주목할 만하다는 의견이 있다.[35] Apple의 2세대 자체 디자인 GPU IP이다.[36] 전작인 A11 Bionic APL1W72의 NPU 성능이 600 GOPS이었으므로 이는 0.6 TOPS이다. 즉, 약 8배 가량 성능이 높아진 것이다.[37] 실제로는 A7 APL0698부터 조합되어 사용되었으나 별도로 탑재되는 칩셋이었다. 이를 모바일 AP 내부에 내장시킨 것은 A9 APL0898 & APL1022 이후였다.[38] Apple이 공식 사이트를 통해 Next-Generation을 명시하지 않았다. 이는 A12X Bionic APL1083도 마찬가지이다.[39] 다만, 단순한 공개일을 기준으로 보면 하이실리콘의 Kirin 980이 먼저 공개되었다.[40] 공개 시점 기준, 하이실리콘의 Kirin 시리즈의 경우 Kirin 970부터 별도의 NPU를 탑재하고 있지만 삼성전자의 엑시노스 시리즈는 삼성 엑시노스 9 Series (9810) 기준, GPU인 ARM Mali-G72의 부가적인 머신러닝 기능을 활용하고 있는 등 머신러닝을 전문적으로 처리하는 칩셋이 보편적으로 사용되고 있지 않은 실정이다. 즉, NPU를 조기에 탑재해서 성장시키는 전략은 경쟁사 대비 상당히 우위에 놓일 수 있게 해주는 요소이다.[41] 본래 다이 상 존재하는 코어는 8개이나 1개가 비활성화되었다.[42] NPU 코어 구성은 알려지지 않았다. 다만, 최대 5 TOPS의 성능을 가진다고 명시하고 있어서 Apple Next-Generation Neural engine 옥타코어 NPU를 탑재한 것이 아니냐는 의견이 있다.[43] 단, 이는 상징적인 것에 불과하다. 일단 기반부터가 다르다. ARM 계열 CPU와 x86-64 계열 CPU의 비교이며 운영체제 역시 해당 모바일 AP는 iOS만 쓰는데 인텔 8세대 i5-8400는 Windows, macOS 그리고 리눅스 및 리눅스 계열 배포판 등 여러 종류에서 사용되고 프로세서가 같아도 운영체제가 다르면 점수가 달리 나오는 경우도 있다. 이외에도 여러 맹점들이 있어서 1대 1 비교는 정확하지 않다.[44] NPU 코어 구성은 알려지지 않았다.[45] 전작인 A12 Bionic와 마찬가지로 단일코어 클럭 기준이며 추가적인 부하가 걸릴 경우 고성능 코어는 2.59Ghz까지 낮아진다. 하지만 전작과 다르게 고효율 코어의 클럭은 그대로 유지된다.[46] iFixit의 iPhone 12, 12 Pro의 분해 결과, 마이크론 테크놀로지의 "MT53D512M64D4UA-046 XT:F"으로 확인되었다. 다만, 마이크론은 제품 분류에서 LPDDR4와 LPDDR4X를 구분짓지 않고 LPDDR4 하나로 표기하고 있다. 마이크론이 제공하는 파트 넘버링에 의하면 M은 Micron Technology, 53은 Mobile LPDDR4, D는 1.1V 전체 동작 전압(VDD), 0.6V I/O 동작 전압(VDDQ)을 뜻하고 있어, LPDDR4X로 확인된다. 출처[47] iPhone이 아니라 iPad에 의해 최초로 공개된 접미사가 붙지 않은 메인 AP인데 이는 팀 쿡 체제 이후에는 최초의 사례다. 스티브 잡스 시절의 경우 iPad 2와 함께 공개된 A5의 사례가 있다.[48] 성능코어[49] 효율코어[50] Intel 레이크필드처럼 아예 CPU다이 내에 적층되어있는게 아니라 그냥 옆에 붙어있기만 하기 때문에 온보드에 납땜되어있는 노트북들과 비슷한 구조다. 따라서 레이크필드와는 다르게 설계를 바꾸면 추가적인 램증설이 불가능하진 않다. [51] 이러면 보통 칩 가장자리의 일부만 연결배선용으로 사용할 수 있기 때문에 사용 가능한 핀 수가 적다. 메모리 채널을 늘리기 위해서는 물리접점 자체가 늘어나야한다.[52] 즉, Apple Watch Series 1(2세대)에는 탑재되지 않는다.[53] System in Package.[54] 예를 들면 지문을 다져다 대면 그 지문의 정보를 가져오는 것이 아니라 이 지문이 맞는 것인지 틀린 것인지에 대한 정보만 가져온다는 것이다.[55] 단 오디오 컨트롤러가 작동하지 않는 Boot Camp 기준으로는 탑재되지 않은 모델보다 음질이 떨어진다.[56] T2 칩이 탑재된 제품에서 시스템 환경설정의 FileVault 설정은 단순히 부팅 과정에 암호 입력 옵션을 추가하는 수준이다.