NVIDIA Tegra

[image]

1. 개요

2. 특징

2.1. 장점

2.2. 단점

3. 라인업

3.1. Tegra APX

3.2. Tegra 6xx

3.2.1. Tegra 600

3.2.2. Tegra 650

3.3. Tegra 2

3.4. Tegra 3

3.5. Tegra 4 패밀리

3.5.1. Tegra 4 (T114)

3.5.2. Tegra 4i (T148)

3.6. Tegra K1

3.7. Tegra X1 & X1+ (T210 / T210B01)

3.8. Tegra X2 (T186)

3.9. Xavier (T194)

3.10. Orin

1. 개요

NVIDIA에서 설계한 SoC 브랜드. 스마트폰, PDA, MID, 태블릿 컴퓨터 등을 대상으로 하고 있다.
ARM에서 개발한 마이크로아키텍처와 ARM 호환 자체 마이크로아키텍처를 CPU로 사용하고, 자사의 초저전력(ULP) GeForce GPU를 사용한다. 통신 모뎀은 모뎀 내장형 테그라 4i를 제외하고는 별도로 탑재해야 한다. 현재 해당 SoC의 주 생산처는 TSMC이다.
코드네임은 슈퍼히어로에서 따오는 게 많다.

2. 특징

ARM11을 CPU로 탑재한 Tegra APX는 놀라운 3D 성능과 고해상도 동영상 재생 능력을 보여 준다고 하여 많은 기대를 모았지만 실제로 채용한 제품은 별로 없다. 동영상 재생 능력은 '720p H.264/VC1/WMV9 디코딩 가능'이라고 밝혔지만 실 기기들이 나오자 그 수준은 아니었다고 한다. 1100 mAh 배터리로 MP3 100시간, HD 비디오 10시간을 재생한다고 했다. 저전력이긴 하지만 이건 좀 많이 무리수였다. Tegra APX를 채용한 첫 번째 제품은 마이크로소프트에서 아이팟 터치를 킬링하기 위해 내놓았던 Zune HD였다. 이 제품에 탑재된 OS는 훗날 Windows Phone 7 Core의 기반이 될 정도로 뛰어난 성능에 주목받았다. 두 번째 제품이 삼성전자의 YP-M1이었지만 둘 다 평은 좋지 않았다.
2011년 1월 3일 엔비디아는 Tegra 2를 발표한다. ARM Cortex-A9 듀얼코어 CPU에 엔비디아 GPU를 탑재했기에 실제 탑재 기기가 나오기도 전부터 관심을 가졌고, Tegra 2를 탑재한 스마트폰들이 일찌감치 예고되었다. 특히 마이크로소프트가 Windows 8에 Tegra 2를 탑재하겠다고 밝히면서 엔비디아에게는 경사스러운 날이 되었다.
2012년 2월 15일 엔비디아는 Tegra 2의 후속작인 Tegra 3를 발표한다. MWC 2011에서 세부 사항이 공개되었는데, ARM Cortex-A9 쿼드코어 CPU를 탑재한 Tegra 3가 인텔의 코어2 듀오 시리즈를 '''뛰어넘는 성능을 자랑한다'''고 밝혔다. 하지만 변수가 제대로 통제되지 않은 상태에서 이루어진 벤치마크 데이터에 의한 결과임이 밝혀지면서 거짓으로 결론이 났다. 실제로는 코어2 듀오 T7200에 비해 Tegra 3가 비교가 불가능한 수준으로 떨어지며 동급은 커녕 비교가 가능한 성능이라고 볼 수 없다. 원래 x86과 ARM은 아키텍처가 완전히 다르고 호환성이 없어 차이가 상당히 많이 난다. FLOPS 벤치마크 같은 단순한 연산에서는 불완전하게라도 이길 수 있을지 몰라도 여러 명령어를 사용해야 하는 상황에서는 2017년의 최신 ARM AP와 10년 전의 인텔 코어2 시리즈(메롬/펜린)를 비교하더라도 당연히 압도당할 수밖에 없다. 그렇기 때문에 x86과 ARM은 단순하게 비교할 수가 없다. 물론 시간이 지나면서 애플 M1의 경우 15W도 안된되는 TDP이면서 코어2 듀오 따위는 우습게 뛰어넘고 라이젠 5600X와 비슷한 싱글코어 점수, 라이젠 2600X와 비슷한 멀티코어 점수를 보여주며 실성능 역시 적어도 노트북용 인텔 i시리즈 최신형보다 높은 성능에 거의 없다시피한 발열을 보여준다. 이와 함께 아이폰 12에 탑재되는 애플 A14 칩셋의 경우 코어 i7-4770k보다 싱글코어 우위, 멀티코어 동급의 성능을 보여준다. 코어2 듀오에 비해서도 밀리는 갤럭시 s7, 아이폰 6 때와는 상황이 많이 달라진것.
기존 GPU를 사골까지 우려먹었다는 평을 받는 Tegra 4를 2013년 1월에 공개했고, 드디어 GPU로 Kepler 아키텍처를 사용한 Tegra K1을 2014년 1월에 공개했으며 2015년 1월 Tegra X1까지 공개하면서 지금까지 이어지고 있다. 테그라 K1부터는 점점 좋은 평을 받고 있다. 그러나 성능이 실제로 상향되었고 경쟁작들인 삼성 엑시노스나 퀄컴 스냅드래곤 8XX에 비해 뛰어난 성능을 내지만 제조사인 엔비디아가 ARM Mali GPU를 탑재한 삼성 엑시노스보다는 물론이고 퀄컴 스냅드래곤보다도 커널 지원에 소극적일 뿐더러 최적화하기 어려워 채용한 기기가 그리 많지 않다. 넥서스 9의 예를 보면 알 것이다.
또한 이 플랫폼을 통한 임베디드 개발자 플랫폼까지 공략 중에 있다. 젯슨 보드가 대표적이다 젯슨 보드는 일단 임베디드라고 표기되어 있긴 한데 엄청난 발열량 때문인지 개발자보드에 쿨러가 기본으로 장착되어 나온다. 그만큼 성능도 높지만 임베디드에서 그 성능을 쓸 곳이 많지는 않다. 말이 임베디드 보드지 엔비디아 측도 "임베디드 '''수퍼컴퓨터'''"라고 말하는 판이고 이렇게 할 수 밖에 없는 것이 엔비디아가 가장 잘 할 수 있는 분야이면서 차세대 먹거리 산업으로 노리고 있는 분야가 자율주행 자동차, 인공신경망 등 딥러닝 부문이고 이를 노리고 만드는 제품인지라 더욱 무지막지한 연산 능력을 확보하기 위해 개발 중이다.

2.1. 장점

뭔가 중요한 것이 많이 빠지다 보니 칩셋의 크기, 다이 사이즈가 작아진다. Tegra 2는 동급의 듀얼코어 SoC 가운데 다이 사이즈가 가장 작다. 같은 듀얼코어인 삼성 엑시노스 4210의 다이 사이즈는 Tegra 2의 3배 가까이나 된다. 다이 크기가 작으면 전력 소비량이 적고 발열이 잘 나지 않는다. 지지부진한 배터리 기술 상황을 감안할 때 적은 전력 소비량은 분명 큰 장점이 된다. 그러나 내장 모뎀이 없기 때문에 프로세서에서 절약한 소비 전력은 내장 모뎀이 잡아 먹어서 의미가 없어진다. 통신 모뎀이 필수적이지 않은 태블릿 같은 기기라면 해당하지 않는다.

ARM의 big.LITTLE 솔루션이 주류가 되기 전부터 거의 같은 작동 방식의 파워 세이빙 코어(이전 컴패니언 코어)를 탑재했다. 그러나 파워 세이빙 코어가 어떻게 주 코어와 연결되어 있는지는 알려져 있지 않다. 예를 들어 파워 세이빙 코어와 주 코어가 데이터를 직접 주고받을 수 없는 구조라면 왔다갔다 하는 동안 까먹는 전력 때문에 전력 소비가 커질 수도 있다. ARM big.LITTLE에 사용되는 CCI-400은 실시간으로 코어간의 캐시를 동기화할 수 있어서 전력 소비를 줄일 수 있다. 다만 이후 늘어나는 전력 소비를 감당하지 못한 채 Tegra 4 이후 태블릿 외에 스마트폰 같은 모바일 기기에는 탑재되지 못하고 있다.

애초에 GPU 만드는 회사답게 GPU 성능은 동시대의 ARM 계열 AP들 기준 어디에 올라가던 대부분을 찍어 누르는 최상의 성능을 보여주고 있다. 탑재된 기기가 적어서 최적화가 부족하다는 의견이 있지만, K1부터 동세대 2배 정도의 성능으로 찍어 누르는 상황.

Tegra K1과 X1에서 데스크탑용 GPU 아키텍처를 그대로 채용, 동세대 PC급의 API 프로파일을 지원한다. 일례로 K1은 동시기 타 경쟁 칩셋들이 모바일 용으로 최적화된 OpenGL ES 3.1을 지원하냐 마느냐 하는데, K1은 ES 3.1의 모태인 Open GL 4.5를 풀 프로파일로 지원. 데스크탑용 GPU 아키텍처를 사용한 위엄을 충분히 보여주고 있다.

2.2. 단점

ARM의 Media Processing Engine, NEON SIMD 엔진이 빠진 종류가 많아서 그래픽 성능이 거품이 아니냐는 논란이 있다. NEON SIMD 엔진은 ARM CPU의 SIMD 확장으로, x86 CPU의 SSE와 비슷한 종류의 명령어이다. 화상 처리나 게임 등에 주로 쓰이는 실수 연산을 가속하는 명령이기 때문에 이게 없으면 게임 성능의 저하가 일어날 수 있다. 거기에 Tegra 2와 Tegra 3에서는 VFU 레지스터 수가 다른 모바일 AP에 비해 적었다. Tegra 4가 Kepler 아키텍처를 사용한 GPU로 변경된다는 루머 때문에 이를 보완할 수 있는 CUDA 기술을 사용할 수 있는 아키텍처를 탑재하나 싶었지만 기존 아키텍처에 셰이더 코어만 추가하는 수준에 그쳤다. 이는 Kepler 아키텍처를 사용한 그 다음 세대인 Tegra K1에서 해결되었다.

동영상 코덱 지원이 상당히 미비하다. 이유는 위의 NEON 엔진 부재도 있으나, Tegra에 탑재된 영상 처리 DSP 칩의 성능이 심각하게 떨어지기 때문이다. 특히 Tegra 2가 그런데, 고화질 영상을 제작하는데 주로 쓰이는 H.264/AVC 코덱의 지원이 부실하다. H.264 코덱은 용도에 따라 프로파일이 Baseline, Main, High 등으로 구분되는데, Tegra 2는 Main, High 프로파일의 지원이 부실하다. H.264 코덱을 제외한 DivX, Xvid, WMV 코덱은 아주 잘 지원하지만, 문제는 이것들을 사용한 고화질(HD/FHD) 영상이 거의 없다는 점이다. 이 문제는 세계 최초 듀얼코어 스마트폰 옵티머스 2X를 통해 알려졌으며, 해당 기기를 만든 제조사는 프로파일 지원 범위를 늘린 패치를 배포하기 전까지 비난을 받아야 했다. 자체에 코덱이 내장된 플레이어(Vital Player 등)을 사용할 수도 있으나, 이런 플레이어는 CPU 성능에 크게 의존하며, CPU 사용이 크다는 것은 그야말로 배터리 식신을 의미한다. 또한 하드웨어 디코딩으로는 돌아가던 동영상이 소프트웨어 디코딩으로 재생 시 안 돌아갈 수도 있다. 사실 저성능 DSP로 인한 영상 코덱 지원 문제는 Tegra APX에서도 이야기되었지만, 정작 그것을 사용한 기기가 MP3 플레이어를 제외하면 별로 없어(...) 부각되지 않았다. 준 HD는 미국에서만 출시된 기기였고, 그나마 가능성 있던 YP-M1도 같은 YEPP 제품에 팀킬을 당한 것이 컸다. 이 문제는 Tegra 2부터 크게 알려졌고, Tegra 2 3D 에서 해당 문제가 적당히 개선되었다. 이후 절치부심한 Tegra 3부터는 동세대 최고의 동영상 재생 능력을 보여 준다. NEON SIMD 유닛을 탑재하기 시작한 Tegra 3는 H264 High Profile을, Tegra 4는 동세대 최초 4K를, Tegra X1은 4K 10 Bit를 지원한다.

리누스 토르발스가 말한 것처럼, NVIDIA에선 공개 플랫폼인 안드로이드에 칩을 제공하면서, 관련 드라이버 소스를 일체 제공하고 있지 않다. 게다가 지원마저 끊기면 모토로라 아트릭스 꼴 난다. 이건 휴대폰 제조사가 자력으로 해보려고 해도 답이 없다. 구글한테는 잘 주는지 모르겠지만... 부실한 커널 지원은 Tegra 계열이 들어간 제품군의 커펌을 만드는데 장벽이 되고 있다. 애초에 ARM 특성상 운영체제에 커스텀화가 무척 심하게 들어간다는걸 생각해본다면 매우 심각한 단점이며 드라이버 지원이 안좋아서 이미 업체들도 한번 써보고 안쓰다보니 테그라가 스마트폰 시장에서 철수한 전적이 있다.

리눅스 커널 공개 및 지원이 타 SoC 제조사에 비해서 매우 늦다. 덕분에 Tegra를 채용한 스마트폰들의 업그레이드까지 덩달아 늦어진다. 진저브레드 같은 경우 2.6.35 커널이 권장되는데 NVIDIA에서 내놓은 건 2.6.32로서 프로요에서 권장되는 커널이다. 심지어 최신 SoC인 Tegra 3의 ICS 커널은 3.0 권장이지만 엔비디아 제공 커널은 2.6.39이다! 커널 버전이 낮으면 일부 기능의 지원이 상당히 힘들어진다. 그 예로 모토로라 디파이의 ICS/젤리빈 커스텀롬 개발 당시 커널 소스가 공개되지 않은 상태에서 2.6.32 커널로 돌리려니 하드웨어 가속이 작동하지 않았다. 결국 개고생해서 2.6 커널에 하드웨어 가속을 백포팅하긴 했다. 역시 전설의 XDA.

현재 LG Tegra 기기가 ICS에서 쓰는 커널은 2.6.39이며, ICS와 거의 비슷한 시기에 나왔다. 허니컴 운영체제 이전에는 NVRM 커널을 썼는데 NVRM 커널은 ICS 이후부터 사용하는 커널과는 구조가 달랐다. 그래서 NVRM 커널을 쓴 옵티머스 2X와 모토로라 아트릭스 등은 아이스크림 샌드위치를 올리려면 거의 새 기기 만드는 수준으로 부트로더부터 커널까지 처음부터 다시 만들어야 했으며, 당시 분위기로는 4.0 아이스크림 샌드위치 업그레이드는 거의 포기 상태였다. 사실 옵티머스 Q2, 옵티머스 EX에 사용한 AP25와 내용이 상당 부분 겹쳤기 때문에 허니컴 이후 제품이나 NVRM 커널을 안 썼다면 운영체제 업그레이드는 잘 된다. 그러나 LG전자는 옵티머스 2X의 모든 것을 엔비디아 Tegra 소스 기반으로 완전히 새로 만들었다. NVRM 커널을 쓴 제품 중에는 2012년 10월 기준 전세계에서 유일하게 ICS 업그레이드를 했다. 삼성의 경우 엔비디아가 제공한 커널 소스를 사용하지 않고 직접 커널을 제작해서 ( 갤럭시 R의 ICS 업그레이드 시기는 2012년 7월이다.) 사용했기 때문에 타 Tegra 2 기기보다 빠르게 업그레이드 되었다. 그렇기 때문에 갤럭시 R의 ICS의 커널은 3.1.10이다.

모바일 게임과의 호환률이 고자다. 모토로라 아트릭스의 경우를 예로 들자면, 아이러브커피가 구동되지 않으며, 확산성 밀리언 아서도 잘 돌아가질 않는다. 아이러브커피의 경우 커스텀 롬에서는 이용 가능하다. 확산성 밀리언 아서의 경우도 패치로 해결. 현재는 정상 작동하는 듯.

GPU 사골이 매우 심하다. Tegra 2에서 사용하던 셰이더 코어를 그 수만 늘려서 Tegra 4까지 그대로 사용했는데, 이 '셰이더 코어'는 지포스 7000 시리즈 아키텍처다. 당연히 상당수의 최신 기술들을 지원하지 못하며, 호환성 문제도 여기서 나오는 것으로 추정된다. 이는 추후에 나온 Tegra K1에서 해결.

Tegra 3까지는 듀얼 채널을 지원하지 않는다. 덕분에 램 대역폭이 엄청나게 좁다. 간단하게 계산해 보면 넥서스 7에 탑재된 Tegra 3 T30L의 메모리는 싱글 채널 LPDDR3-1333이며 이론상의 대역폭이 5.34GB/s 정도이다. 그 전에 출시된 넥서스 시리즈인 갤럭시 넥서스는 OMAP 4460에 LPDDR2-800이 듀얼 채널로 탑재되어 이론상의 대역폭은 6.4GB/s이다. 삼성 엑시노스 4210도 마찬가지로 6.4GB/s. 거기다 싱글 채널 시 32비트다! 64비트가 아니다! Tegra 2도 그랬는데 Tegra 3에 와서도 듀얼 채널 지원을 안 했다. 다수의 XDA 유저들이 위의 이유들과 함께 특히 램 대역폭 때문에 개발이 힘들다고 Tegra 3을 아주 싫어하며, 국내에서는 쓰레기 취급당하는 스냅드래곤 S3 듀얼코어의 실성능이 더 낫다고 하는 이유도 여기에 있다.

'''위와 같은 이런 저런 이유로 좋은 소리가 나오는 걸 어딜 가서 찾아볼 수가 없는 SoC다.''' Tegra 3에 들어와서 시장 점유율이 바닥을 쳤고, Tegra 4부터는 태블릿에서나 볼 수 있었고, K1에 이르러서는 태블릿/콘솔용으로 전환되었다. 사실상 너무 폐쇄적이고 CUDA처럼 기술 및 드라이버 공유를 전혀 안해서 망친 사례라 볼 수 있다. PC시장도 이미 그러고 있었지만 ARM 시장에선 통하지 않는다는것.[1] 그로인해 여러 업체들로부터 배척을 당하고 있다고 보아도 무방하다.

3. 라인업

3.1. Tegra APX

<rowcolor=white> 파트넘버	APX 2500	APX 2600
<colbgcolor=black><colcolor=#76B900> CPU	ARM11 MP1 600 MHz
GPU	NVIDIA GeForce ULV MP- -- MHz
메모리	32비트 싱글채널 LPDDR ?MHz
생산 공정	???
탑재 기기	마이크로소프트 Zune HD, YEPP, YP-M1	-

3.2. Tegra 6xx

3.2.1. Tegra 600

<rowcolor=white> 파트넘버	T600
<colbgcolor=black><colcolor=#76B900> CPU	ARM 11 MP1 700MHz
GPU	NVIDIA ULP MP? ?MHz
메모리	32비트 싱글채널 LPDDR 166MHz
생산 공정	???
탑재 기기	-

2008년 6월 2일에 발표된 AP로 GPS 장치와 자동차를 대상으로 판매한다.

3.2.2. Tegra 650

<rowcolor=white> 파트넘버	T650
<colbgcolor=black><colcolor=#76B900> CPU	ARM 11 MP1 800MHz
GPU	NVIDIA ULP MP? ?MHz
메모리	32비트 싱글채널 LPDDR 200MHz
생산 공정	???
탑재 기기	-

3.3. Tegra 2

<rowcolor=white> 파트넘버	AP20H	T20	AP25	T25
<colbgcolor=black><colcolor=#76B900> CPU	ARM Cortex-A9 MP2
	1 GHz		1.2 GHz
GPU	NVIDIA ULP GeForce MP12
	300 MHz	333 MHz	400 MHz
메모리	32-bit 싱글채널 LPDDR2 300 MHz/DDR2 333 MHz
생산 공정	TSMC 40nm
탑재 기기	옵티머스 2X, 아트릭스 갤럭시 R	Xoom, 갤럭시 탭 10.1 갤럭시 탭 8.9 Wi-Fi	옵티머스 Q 2 옵티머스 EX	-

2010년 1분기에 상용화된 AP다. 위에서 언급했듯이 ARM Holdings의 NEON SIMD 엔진이 포함되어 있지 않아서 동영상 호환성이 크게 떨어진다. 이후 마이너 업데이트 버전인 AP25와 T25가 2011년 1분기에 상용화되었다. 3D 디스플레이를 지원하는 특징이 생겨 이들은 구분을 위해 Tegra 2 3D라고 지칭하는 경우도 있다.

3.4. Tegra 3

<rowcolor=white> 파트넘버	T30L	T30	AP33	T33
<colbgcolor=black><colcolor=#76B900> CPU	ARM Cortex-A9 MP4 with Companion Core -- MHz
	1.2 GHz	1.4 GHz		1.6 GHz
GPU	NVIDIA ULP GeForce MP12
	416 MHz	520 MHz
메모리	32-bit 싱글채널
	DDR3 1333 MHz	LPDDR2 1066 MHz / DDR3L 1.5 GHz		DDR3 1.6 GHz
생산 공정	TSMC 40nm LPG
탑재 기기	넥서스 7	서피스 RT 옵티머스 뷰 [2] 해외판 전용.	옵티머스 4X HD ONE-X	ONE-X+

Tegra 2의 후속 라인업으로, 2011년 4분기에 상용화 되었다. 개발 코드네임은 Kal-El. 이번에는 ARM Holdings의 NEON SIMD 엔진을 포함시켜 전작의 단점을 개선했다고 한다. 또한 상대적으로 가벼운 작업을 처리하는 컴패니언 코어(Companion Core)가 최초로 탑재되었다. GPU는 전작과 동일한 물건을 사용하나, 파이프라인과 픽셀 셰이더의 개수를 늘리고 클럭을 높여 전작 대비 약 3배가량 향상 시켰다고 한다.

3.5. Tegra 4 패밀리

3.5.1. Tegra 4 (T114)

<rowcolor=white> 파트넘버	T114
<colbgcolor=black><colcolor=#76B900>CPU	ARM Cortex-A15 MP4 1.9 GHz with Companion Core 825 MHz
GPU	NVIDIA ULP GeForce MP72 672 MHz
메모리	32-bit 듀얼채널 LPDDR3/DDR3L 933 MHz
생산 공정	TSMC 28nm HPL
탑재 기기	SHIELD Portable, 서피스 2, Tegra Note 7 Mi 3 일부 모델, Geek 일부 모델

Tegra 3의 후속 라인업으로, 2013년 2분기에 상용화 되었다. CES 2013에서 SHIELD Portable과 같이 공개되었다. 개발 코드네임은 Wayne. 엔비디아가 인수한 통신 모뎀 솔루션 설계사인 Icera의 통신 모뎀 솔루션을 지원한다. 원칩 AP는 아니나, 외장으로 탑재할 수 있다고 한다.

3.5.2. Tegra 4i (T148)

<rowcolor=white> 파트넘버	T148
<colbgcolor=black><colcolor=#76B900> CPU	ARM Cortex-A9 "R4" MP4 2GHz with Companion Core 825 MHz
GPU	NVIDIA ULP GeForce MP60 660 MHz
메모리	32-bit 싱글채널 LPDDR3 800 MHz
생산 공정	TSMC 28nm HPL
내장 모뎀	4G LTE-FDD/TDD Cat.4+3G WCDMA/TD-SCDMA+2G GSM
탑재 기기	G2 mini 일부 모델

Tegra 4 소속의 중상급형 타겟 AP로 MWC 2013에서 공개되었다. 개발 코드네임은 Grey. 2014년 1분기에 상용화 되었다.
ARM Holdings와 협업을 통해 개발한 CPU를 탑재해 현존하는 모바일 AP 중 최고 효율과 최고 성능을 자랑하며 퀄컴의 Qualcomm Krait 400 CPU보다 성능이 좋다고 밝혔으나, 그냥 ARM Cortex-A9의 최종 리비전 버전인 ARM Cortex-A9 R4를 사용한다.
또한 Tegra 시리즈 최초로 통신 모뎀 솔루션이 내장되어 이동통신 네트워크를 모바일 AP에서 지원하는 원칩 AP 형태를 갖추고 있다. Icera의 i500을 내장했다고 한다.

3.6. Tegra K1

<rowcolor=white>파트넘버	T124	T132
<colbgcolor=black><colcolor=#76B900> CPU	ARM Cortex-A15 MP4 2.3 GHz with Companion Core -- MHz	NVIDIA Denver MP2 2.5 GHz
GPU	NVIDIA Kepler GK20A MP192 852 MHz
메모리	64-bit 듀얼채널 LPDDR2/LPDDR3/DDR3L -- MHz
생산 공정	TSMC 28nm HPM
탑재 기기	Mi Pad, SHIELD Tablet Jetson TK1 개발키트	넥서스 9

Tegra 4의 후속 라인업으로, CES 2014에서 공개되었다. 개발 코드네임은 Logan. T124는 2014년 2분기에, T132는 2014년 3분기에 상용화 되었다.
드디어 GPU 아키텍처가 Kepler 기반으로 변경되었다. OpenGL ES 3.0 API와 OpenGL 4.4 API 등을 지원하며 450MHz로 동작하는 퀄컴 Adreno 330 GPU의 약 3배 이상의 성능을 보여준다고 한다. CPU는 32비트 모델과 64비트 모델이 나뉘어서 출시되며, 전자는 ARM Cortex-A15 쿼드코어 CPU가 탑재되고 후자는 ARM 호환 엔비디아의 자체 CPU인 NVIDIA Denver 듀얼코어 CPU를 탑재한다고 한다.
정작 2분기나 되어서야 시작에 실 기기가 출시 되었다. 첫 기기는 Lenovo의 스마트 4K 모니터인 ThinkVision 28.
모바일 첫 탑재 기기는 샤오미 Mi Pad. 등장하자 마자 모바일 AP계를 평정했다. 당시 최고의 퍼포먼스를 보여 준 애플 A7의 G6430이나 퀄컴 스냅드래곤 80X의 오버클럭한 Adreno 330보다 2배 이상의 퍼포먼스를 보여주었다.
그리고 2014년 말에 출시한 아이패드 에어 2 전용의 A8X와 비슷한 성능을 보여주었다. A8X도 최적화가 진행되면서 현재는 A8X의 75% 정도의 성능을 보여 주고 있다. 하지만 아직도 대단한 성능으로 발표 약 1년 후 A8X, 거의 2년이 다 되는 2015년 말에나 A9가 애플 진영의 AP로는 K1보다 높은 성능을 내고 있고, 안드로이드 진영에서는 K1보다 높은 성능 그래픽 성능을 보여 주는 것은 후속작인 X1밖에 없다. 단 테그라는 발표랑 동시에 실 제품이 나오지는 않았다.
CPU 파트 성능은 거의 단순 클럭 상승에 의한 향상으로 전작 Tegra 4와 K1은 큰 차이가 없지만,연말에 출시된 자체 아키텍처인 덴버 기반의 듀얼코어 모델은 싱글 스레드 성능이 2배 가까이 올라서 단일 코어로는 '''ARM 기반 AP 중 가장 높은 성능'''을 보여주었다. 현재는 애플 A9시리즈에 좀 밀린다. 다만 듀얼코어 구성으로 멀티 스레드는 비슷한 시기 출시된 타 AP대비 높지 않다.
들어간 GPU가 본래 데스크탑에 일반적으로 사용되는 케플러 기반이라서 OpenGL ES나 안드로이드 익스텐션 팩 같은 모바일에 사용되는 그래픽 API의 적용은 쉬운지 OS 업데이트를 할 때마다 꾸준히 GPU 드라이버도 업데이트해 준다. 그 덕에 2015년 말 최신의 OpenGL ES 3.1 + AEP 환경에서 타사의 최신 AP들과 비교해도 50% 이상 우위의 성능. 이었지만 스냅드래곤 810을 기점으로 (쓰로틀이 없는 상태 한정) 그래픽 부분에서 성능이 조금씩 밀리기 시작하다 820에서 아드레노 530이 40%정도 높은 성능으로 앞서버렸다.

3.7. Tegra X1 & X1+ (T210 / T210B01)

<rowcolor=white>파트넘버	T210 (X1)	T210B01 (X1+)
<colbgcolor=black><colcolor=#76B900> CPU	ARM Cortex-A57 MP4 1.9 GHz + ARM Cortex-A53 MP4 1.3 GHz
GPU	NVIDIA Maxwell GM20B MP256 1 GHz
메모리	64-bit 듀얼채널 LPDDR3/LPDDR4 3200 MHz	LPDDR4/LPDDR4X
생산 공정	TSMC 20nm SoC[3] 코드네임 Logan	16nm[4] 코드네임 Mariko
내장 모뎀	없음
탑재 기기	Nintendo Switch, SHIELD Android TV 픽셀 C, Jetson TX1 Jetson Nano	Nintendo Switch^신공정, Nintendo Switch Lite SHIELD Android TV (2019)

Tegra K1의 후속 라인업으로, CES 2015에서 공개되었다. 개발 코드네임은 Erista. Tegra M1이 아니라 Tegra X1이 된 이유로는 X가 더 멋있는 네이밍이라 정했다고 한다(...). 2015년 2분기에 상용화 되었다.
GPU는 Kepler 아키텍처 기반 전작에서 2세대 Maxwell 아키텍처로 업그레이드 되었다. OpenGL ES 3.1 API와 OpenGL 4.4 API를 지원하며 성능은 Maxwell 아키텍처의 노트북용 GPU인 GeForce 830M과 840M, 940M의 중간급이라고 한다. 자체 CPU인 NVIDIA Denver가 아닌 ARM 레퍼런스 CPU인 ARM Cortex-A57로 도로 회귀했다. 그러나 'Parker'라는 개발 코드네임을 가진 엔비디아의 모바일 AP가 준비되고 있다는 설이 지속적으로 나오고 있기 때문에 Tegra K1처럼 자체 CPU 마이크로아키텍처를 탑재한 모델이 나올 수 있다고 추측되고 있다. ARM Cortex-A53과 big.LITTLE을 구성하고 있으나, 문제는 삼성전자가 삼성 엑시노스 5410에 그랬던 것처럼 HMP 모드를 지원하지 않고 클러스터 마이그레이션으로만 동작한다고 한다. HMP 모드는 고부하 작업 시 빅코어와 리틀코어 모두 사용하여 효율을 올리는 모드이고 클러스터 마이그레이션은 고부하시에는 빅코어만, 저부하 작업은 리틀코어만 사용하는 것이다. 후자의 경우 구현이 쉽고 저전력이지만, 고사양 작업시 노는 AP(리틀코어)가 존재하는 단점이 있다.
성능은 역시나 기대하던 대로 엄청나며, 이전 K1의 거진 2배의 성능을 보여주어 그래픽 벤치마크의 그래프를 또 한번 갱신하였다. 게다가 안드로이드(운영체제)라는 범용 운영체제를 사용한다는 단점을 가지고 있음에도 2015년 말에 출시된 iPad Pro 전용의 A9X와 동급의 성능을 보이고 있다. 소폭으로 밀리기는 하나, 애초에 iOS라는 특정 플랫폼에 최적화된 A9X와 어떤 운영체제에서, 어떤 조건에서나 이 성능이 나오는 안드로이드 스마트폰 전용 AP의 GPU를 비교하는 것 자체가 공정하지 못한지라... 게임에 최적화된 운영체제를 사용하는 게임기인 닌텐도 스위치의 경우에는 게임 구동에 있어서 A9X나 A10 Fusion보다 나은 성능을 기대하여 볼 수 있었으며 실제 성능은 그 이상. 멀티 플랫폼 게임인 포트나이트를 통한 성능 비교에서 iPhone X의 A11 Bionic과 비슷한 모습을 보여준다. 프레임 유지는 iPhone X나 갤럭시 노트8 등 플래그십 스마트폰이 더 잘 되는 편이고 해상도도 더 높지만, 그래픽 효과가 스위치판이 낫다. 하지만 스위치는 히트파이프 등을 통한 패시브 쿨링만 가능한 일반적인 스마트폰과 달리 쿨링 팬을 통한 액티브 쿨링이 가능한 기기라는 점에서 공정한 비교라고 보기는 힘들다. 그리고 애초에 이건 칩셋의 성능 비교가 아닌, 게임만을 특정해서 돌리는 OS와 최적화 또한 그 특정 한 기기만을 위해 해도 되는 플랫폼과, 단순히 게임만을 돌리기 위한 OS가 아닌, 수 많은 기능들을 돌리면서 게임도 돌려야 하는 플랫폼의 차이이다.
사실 출시된 기기도 AC로 전원을 공급받는 셋톱박스 형태의 기기라서 엔비디아가 모바일을 정말로 포기한 것이 아닌가 라는 의견이 있었다. 스마트폰 쪽은 모뎀 사업을 접고( ), 테그라 4 이후로 나온 K1이 탑재되는 스마트폰이 없는 등 이미 반 포기상태였다. 기존 SHIELD Tablet의 리뉴얼 모델이 Tablet K1으로 이름을 바꾸어 후속작의 떡밥을 남기더니, X1을 탑재한 실드 태블릿이 벤치마크에 잠시 유출되었다 사라짐으로 Tablet X1의 출시가 준 기정사실화 되는 듯 했지만 프로젝트가 취소되었다.
그리고 X1을 탑재한 픽셀 C가 출시되었다.
nVIDIA의 SBC(Single Board Computer)라인업인 Jetson TX1에 리틀코어가 비활성화 된 모델이, 저가형 버전인 Jetson Nano에는 TX1에 추가로 빅 코어 클럭이 1GHz 중반으로 다운클럭되고 GPU 코어 개수가 절반이 된 버전으로 탑재되었다.
닌텐도 스위치에 탑재된 SoC도 X1이다. 투시 사진을 통해 논 커팅 칩이라는 것이 판명되었다. 리틀 코어가 작동하는지는 불명이기는 하나 Cortex-A53 리틀코어도 멀쩡히 살아 있다. 개발자들은 이를 버추얼 콘솔을 통한 에뮬레이션에 사용할 수 있을 것으로 추정한다.[5]
2019년 8월에 출시한 닌텐도 스위치 신공정 모델에서는 20nm에서 16nm로 공정미세화 개선이 이루어진 파트넘버 T210B01의 테그라 X1+를 탑재했다. 덕분에 전력소비가 상당히 개선되었다고 한다.

3.8. Tegra X2 (T186)

<rowcolor=white>파트넘버	T186
<colbgcolor=black><colcolor=#76B900>CPU	NVIDIA Denver2 2 GHz + ARM Cortex-A57 MP4 2 GHz
GPU	NVIDIA Pascal GP10B MP256 1.5 GHz
메모리	64-bit 듀얼채널 LPDDR4 3200 MHz
생산 공정	TSMC 16nm FinFET+
내장 모뎀	없음
탑재 기기	Drive PX2, Jetson TX2, 매직리프원

Tegra X1 T210의 후속작이다. 개발 코드네임은 Parker.
CPU는 NVIDIA Denver2를 듀얼코어 구성으로 빅 클러스터를 이루고, ARM Cortex-A57을 쿼드코어 구성으로 리틀 클러스터로 이뤄서 ARM big.LITTLE 솔루션을 적용한 HMP 모드 지원 헥사코어 CPU를 탑재했다. 또한, GPU는 엔비디아의 Pascal 아키텍처를 이용한 GP10B를 256코어 구성으로 탑재했다. 퀄컴 스냅드래곤 820 MSM8996과 비교할 때 약 2.5배의 성능을 보이고 Apple A9APL0898 & APL1022와 비교할 때 약 1.5배의 성능을 보인다고 한다. 또한, LPDDR4 SDRAM을 지원하는 총 128비트의 메모리 컨트롤러를 탑재한만큼 GPU L2 캐시의 용량이 두배가 되었다.
생산 공정은 TSMC의 16nm FinFET+ 공정이다.
전반적인 성능은 매우 높지만 전력 소모율 역시 매우 높다. 특히, 빅 클러스터에 들어가는 ARM Cortex-A57을 리틀 클러스터로 사용했기 때문에 저전력 성능은 어느정도 포기한 것으로 보인다. 즉, 스마트 디바이스 등 휴대 기기보다는 자동차에 제어 장치를 주요 타겟으로 잡은 것으로 보인다. 실제로 닌텐도가 Switch에 '''X1'''이 아닌 '''X2'''를 탑재하려 했으나 전력 소모 등의 이유로 탑재하지 못한 것으로 알려졌다. FP32 성능은 0.75 TFLOPS, FP16 성능은 1.5 TFLOPS로 전작인 Tegra X1 T210보다 약 1.5배 가량 높다.
진지하게 말하자면 둘은 체급부터 차이가 크다. 당장 XBOX ONE의 칩셋은 CPU를 포함한 수치이며 그간의 공정미세화를 고려해야겠지만, 엔비디아의 하이엔드 칩셋이었던 GP104보다도 훨씬 거대한 칩이며, 동세대 같은 회사의 Tahiti 칩보다도 크다. 또한 12cu 768코어 구성으로 단순 코어의 개수는 256개의 X2보다 3배는 많고 전력은 7배를 더 잡아먹는다. 거기에 GCN 특유의 tflops 뻥튀기 같은 현상도 있어 ATI와 엔비디아의 아키텍처간 tflops를 통한 단순비교는 부적절하다. 당장 tflops만을 기준으로 두면 퓨리는 맥스웰 타이탄을, 베가는 파스칼 타이탄을 털어먹고 Radeon vii는 RTX 2080Ti까지 털어먹는다.

3.9. Xavier (T194)

<rowcolor=white>파트넘버	T194
<colbgcolor=black><colcolor=#76B900>CPU	Nvidia custom Carmel MP8 -.- GHz
GPU	NVIDIA Volta MP512 GV10B? 1.27 GHz
메모리	64-bit 쿼드채널 (256 bits) LPDDR4X 4266 MHz
디스플레이
기능
생산 공정	TSMC 12nm FFN
탑재 기기	Drive PX Pegasus

NVIDIA DRIVE 라인업에 속해있는 SoC로써 코드명은 찰스 자비에로부터 따온 자비에로 볼타 아키텍처가 적용돼서 나오는 첫 테그라가 될 것이라고.
8-core ARM v8.2 64-bit CPU, 8MB L2 + 4MB L3 코어이고 FP16 성능이 2.6Tflops가 나온다고 한다. TDP는 20~30W이다. 임베디드 자동화 기기용으로 각종 산업용 로봇과 자율주행 자동차 등 각종 딥러닝이 필요한 분야에서 활약할 것으로 보인다. 현재 개발자 키트는 모듈형인 Jetson AGX Xavier 8GB는 679달러, Jetson AGX Xavier는 999달러에 판매 중이고 키트형인 Jetson AGX Xavier developer kit은 699달러에 판매 중이다.

3.10. Orin

<rowcolor=white>파트넘버	미정
<colbgcolor=black><colcolor=#76B900>CPU	-
GPU	-
메모리	-
디스플레이	-
기능	-
생산 공정	-
탑재 기기	-

2018년 3월 27일 GPU 기술 컨퍼런스에서 발표된 차세대 NVIDIA DRIVE SoC로 Xavier를 여러개 결합한 Pegasus 보드를 다시 하나의 칩으로 만드는 과정에 있는 제품으로 Xavier에 비교하면 최소 2배 이상의 성능과 이를 뒷받침할 코어가 들어갈 것이라고 한다. 이처럼 향후 엔비디아의 SoC 발전 방향은 이렇게 칩을 개발하고 성능이 부족해지면 여러개를 결합해서 시간을 벌다가 공정을 개선 및 개발하여 다시 하나의 칩으로 합치는 방항으로 갈 것이라고 한다.
코드명은 아쿠아맨에 나오는 Orin인 듯 하다.
2019년 12월 Orin을 적용한 NVIDIA DRIVE AGX Orin를 발표했다. 자비에르의 후속기로써 암페어 아키텍쳐가 적용된 GPU를 탑재하고 ARM의 헤라클레스(Hercules) CPU 코어, 그리고 초당 200조의 연산을 제공하는 새로운 딥 러닝과 컴퓨터 비전 액셀러레이터를 통합한 SoC로 이전 세대인 자비에르에 비해 최대 7배 향상된 연산 성능을 보여줄 것이라고 한다. 이러한 성능은 5단계의 완전 자율 주행 차량을 구현하는데 충분한 성능을 가질 것이라고 한다.
2023년 안에 해당 SoC가 적용된 실차량이 공개될 것으로 기대된다고 한다. 실제로 스웨덴의 아인라이드(Einride)라는 회사에서 오린을 적용하여 Level 4 수준의 자율주행트럭을 구현할 예정이라고 발표했다.

[1] CUDA때문에 애플이 Metal API를 따로 개발해서 쓰는 이유이다.[2] 해외판 전용.[3] 코드네임 Logan[4] 코드네임 Mariko[5] 갤럭시 S II 등의 옛날 스마트폰도 5세대 거치용 게임기나 6세대 휴대용 게임기 정도는 문제 없이 에뮬레이션이 가능하다는 것을 보면 리틀 코어만으로도 버추얼 콘솔용으로는 충분한 성능을 낼 것이다.

NVIDIA Tegra

1. 개요

2. 특징

2.1. 장점

2.2. 단점

3. 라인업

3.1. Tegra APX

3.2. Tegra 6xx

3.2.1. Tegra 600

3.2.2. Tegra 650

3.3. Tegra 2

3.4. Tegra 3

3.5. Tegra 4 패밀리

3.5.1. Tegra 4 (T114)

3.5.2. Tegra 4i (T148)

3.6. Tegra K1

3.7. Tegra X1 & X1+ (T210 / T210B01)

3.8. Tegra X2 (T186)

3.9. Xavier (T194)

3.10. Orin

분류