인텔 네할렘 마이크로아키텍처

 



[image]
2008~2009년 초기 네할렘 기반 제품의 로고.
[image]
2009~2011년 후기 네할렘 및 웨스트미어 기반 제품의 로고.
1. 개요
2. 상세
2.1. 배경
2.2. 특징
3. 채용 프로세서
3.1. 네할렘 (45nm 공정)
3.2. 웨스트미어 (32nm 공정)
4. 재조명
4.1. 한계
6. 관련 문서


1. 개요


IDF 2007에서 처음 공개된 후 2008년에 정식 발표된 마이크로아키텍처. 11월에 출시된 1세대 코어 i 시리즈를 비롯한 다수의 인텔 제품에 사용되었고, 인텔의 틱톡전략에 톡전략으로 만들어진 아키텍처이다. 코어 i 시리즈 자체의 브랜드를 탄생해준 아키텍처였지만 2018년을 기점으로 발표된지 10년을 맞이한 오래된 아키텍처가 되었다.

2. 상세



2.1. 배경


2006년부터 시행된 틱톡 전략에 따라 이번에는 펜티엄M 시리즈와 코어 시리즈에 사용된 개량판 P6 마이크로아키텍처, 코어 2 시리즈에 사용된 코어 마이크로아키텍처로 연달아 활약한 이스라엘의 하이파 연구소가 아니라 IAL 출신인 미국 오리건 주의 힐스버러 연구소에서 설계되었다. 기존의 코어 마이크로아키텍처가 매우 뛰어난 IPC를 보여준 것과 펜티엄 4, 펜티엄 D에 사용된 넷버스트 마이크로아키텍처로 거하게 말아먹은 전례가 맞물려서 우려하는 분위기였으나, 2007년부터 정보가 조금씩 공개된 이후 불신감은 점차 사그라졌다.

2.2. 특징


[image]
네할렘 마이크로아키텍처의 코어 내부의 주요 변경 사항은 다음과 같다.
  • 명령어 인출 단계의 버퍼 용량이 32 바이트 → 16 바이트로 축소
  • 명령어 큐와 루프 스트림 탐지기(LSD)가 디코드 단계의 다음 단계로 재배치
  • 명령어 큐가 18엔트리 → 28엔트리로 확장
  • 재정렬 버퍼(ROB)가 96엔트리 → 128엔트리로 확장
  • 통합 연산 스케줄러가 32엔트리 → 36엔트리로 확장
변경 사항들을 보면 이전 세대만큼 많이 변경되지 않았다. 그래서 IPC가 평균 10~15% 정도로 향상률이 소폭 낮아졌지만, 이미 경쟁사의 K10 마이크로아키텍처를 한참 웃도는 수준이라서 큰 논쟁 거리는 아니었다. 오히려 넷버스트 마이크로아키텍처를 설계했던 IAL의 후신 연구소라서 기대한 것보다 잘 나왔다는 의견이 있었을 정도.
SoC 레벨에서 보면 CPU 코어 본연의 성능보다는 외부 기능들을 내장 및 통합하여 CPU의 기능을 확장하는 것에 초점을 맞춘 것으로 보이는데, 가장 큰 특징은 메인 메모리 컨트롤러를 비롯한 메인보드 칩셋의 노스브리지 기능이 CPU에 내장된 점이다. 그 덕에 메인보드 칩셋의 구성이 간소화되었지만, 메인 메모리 컨트롤러가 칩셋이 아닌 CPU로 옮겨졌기 때문에 CPU의 특성에 영향을 받아서 오버클러커들에게는 CPU의 쿨링에 더 신경 써야 하는 단점이 생겼다.
이전 세대 쿼드코어와는 다르게 네이티브 쿼드코어로 설계되었다. 사실 코어 마이크로아키텍처에도 더닝턴으로 알려진 네이티브 헥사코어가 있으나, L3 캐시 메모리 자리 대신에 듀얼코어가 자리 잡았다면 듀얼코어가 4개인 옥타코어가 되었을지도 모를 구성이었기에 태생부터 완전한 쿼드코어는 사실상 네할렘 마이크로아키텍처부터라고 볼 수 있다. 캐시 메모리 구조가 변경되어 더닝턴과 마찬가지로 L3 캐시 메모리 슬라이스들이 LLC 메모리로 자리잡았다. L2 캐시 메모리 용량이 크게 축소되었지만, L3 캐시 메모리의 대역폭과 공유 기능으로 보완할 수 있어서 종합적인 캐시 메모리 성능에 치명적이지는 않았다.
과거의 기능이었던 하이퍼스레딩이 부활되었다. 싱글코어 시대였던 펜티엄 4와는 다르게 멀티코어를 통한 멀티스레딩 시대에 재도입한 것이기 때문에 이에 대한 효용성은 그나마 있었으며, 멀티스레드를 잘 활용하는 렌더링, 인코딩 작업 한정으로 4코어 4스레드보다 뛰어난 멀티스레드 성능을 발휘할 수 있게 되었다.
네할렘의 첫 라인업인 블룸필드는 한국에서 워낙 초고가를 형성하고 있던데다, 당시 가격이 자비없던 DDR3 SDRAM을 무려 '''트리플채널'''로 구성해야 제대로 된 하이엔드 PC를 구축할 수 있었던만큼 자금적 여유가 있지않은한 블룸필드 구매는 거의 그림의 떡 수준이었다. 당시 막 쏟아져나오던 그래픽 좋은 게임이 Core i7 최적화라는 타이틀을 붙이고 나온데다, 웨스트미어가 출시된 이후에 등장한 스타크래프트2 열풍 속에서 스2를 풀옵으로 그나마 프레임을 제일 높게 뽑아내려면 블룸필드는 어쩔 수 없는 선택이었다보니 네할렘은 그야말로 꿈의 CPU였다. 다행히 2009년 9월에 블룸필드와 크나큰 차이점 없는 린필드가 비교적 저렴한 가격으로 출시되자, 꿈과 환상에 젖어있던 많은 이들이 나도 코어 i 시리즈 좀 써보자고 린필드를 구매하여 샌디브릿지 출시 이전까지 린필드는 국민 CPU 반열에 오르기도 하였다.
네할렘(Nehalem)을 기초로 공정미세화(45→32nm) ''''틱'''' 제품은 웨스트미어(Westmere)이다. 참고로 GPU와 내장 메모리 컨트롤러 부분은 그대로 45nm이며, 이 둘이 MCM 형태로 패키징되어 있다.
네할렘 마이크로아키텍처가 사용된 블룸필드, 린필드 프로세서 한정으로, 린필드는 DDR3 SDRAM 컨트롤러가 트리플 채널에서 듀얼 채널로 변경되고 별도의 칩셋으로 분리되어 있던 사우스브리지 영역의 I/O 컨트롤러가 추가 내장되며, 메인보드 칩셋과 연결되는 외부 인터커넥트가 QPI 대신 DMI로 치환해서 보면 된다.[1] 웨스트미어 마이크로아키텍처 기반의 클락데일 프로세서도 코어 내부와 캐시 메모리까지는 린필드와 같은 구조이지만, 메모리 컨트롤러와 I/O 컨트롤러가 내장 그래픽이 포함된 아이언레이크에 옮겨졌다는 차이점이 있다.
이 중 가장 압권은 2010년에 출시된 웨스트미어 기반 '''헥사코어'''의 걸프타운 라인업이었는데 걸프타운은 많은 컴덕과 컴퓨터애호가들의 성물 취급을 받았다. 죽기전에 걸프타운 한 번 써보면 여한이 없겠다고 할 정도. 특히, 2013년 초반에 화제였던 괴물급 그래픽카드인 지포스 GTX TITAN과 걸프타운을 함께 콜라보 시킨 조립PC는 당시 아이비브릿지가 최신이라 구형 모델이 된 걸프타운 CPU임에도 많은 이들의 부러움을 샀다. 그만큼 상징성이 큰 CPU였고 지금은 간간히 컴퓨터 관련 커뮤니티에 '걸프타운의 향수'를 다룬 추억팔이성 글이 올라오기도 하니 그 당시 컴퓨팅 성능의 향상에 많은 이들이 환상과 추억을 가지고 있었다는걸 알 수 있다.
그나마 서버나 워크스테이션, 하이엔드 데스크탑(코어 i7 900 시리즈)은 공정 기술 변화로 세대 교체를 제대로 했지만, 일반 데스크탑 CPU와 모바일 CPU는 그러하지 못했다. 처음 나온 네할렘(블룸필드, 린필드) 모델은 쿼드코어 i5 이상만 나왔고, 반대로 듀얼코어 i5 이하나 i3, 펜티엄, 셀러론 CPU는 공정 개량형인 웨스트미어만 나왔다. 이렇게 되어서 쿼드코어급 데스크탑 CPU는 끝까지 웨스트미어 세대 제품을 내놓지 않았다. 이러니 사람들의 인식은 이 두 CPU를 다른 세대로 전혀 인식하지 못했고, 그냥 '''내장 그래픽 코어가 들어간, 늦게 나온 듀얼코어 CPU'''로 받아들였을 뿐 공정 기술의 발전이나 미세한 추가 기능을 전혀 생각하지 않았다. 상황이 이래서 인텔조차 두 CPU를 같은 세대로 묶어 버리고 있다.
후속 아키텍처는 인텔 샌디브릿지 마이크로아키텍처. 현재의 코어 i 시리즈 CPU의 원조임에도 불구하고 나무위키에서의 대접은 그야말로 아오안 그 자체. 또한 한 아키텍처로 두 세대의 CPU를 내놓은 후속 아키텍처와 달리 단 한 세대로 끝을 맺은 비운의 아키텍처이기도 하다. 정확히는 Tick에 해당하는 공정 기술 개량형 제품(Westmere)이 있음에도 일부 모델에만 적용이 되어 온전히 한 세대를 바꾸지 못했고, 그래서 이 두 가지 제품군을 그냥 1세대 코어로 뭉뚱그려 표현하는 것. 인텔은 이전 세대의 공정 기술을 쓰면서 아키텍처만 개량하는 세대(Tock)와 그 아키텍처를 바탕으로 약간 개량을 하고 공정 기술을 업그레이드한 세대(Tick)의 CPU를 내놓는 개발 전략을 갖고 있다.

3. 채용 프로세서



3.1. 네할렘 (45nm 공정)


  • CPU-칩셋 간 통신 규격의 변화. LGA 1366 플랫폼 한정으로 FSB에서 QPI로 대체됨.
    • 구조적으론 AMD의 하이퍼트랜스포트와 비슷하지만 전송 속도 및 대역폭은 이쪽이 훨씬 빠르다.
    • 단, 노스 브리지가 프로세서에 통합된 LGA 1156 플랫폼에서는 이전에 노스-사우스간 연결에 사용하던 DMI 인터페이스를 그대로 사용.
    • 프로세서가 코어와 언코어 부분으로 나뉘게 되어 기존보다 훨씬 다양한 라인업이 가능해졌다. 파트를 모듈로 나눈 것과 비슷한 효과로 각 파트를 따로 설계해서 조합하는 식으로 간단하게 설계 변경이 가능해짐.
  • 하이퍼스레딩(2-way Simultaneous Multithreading per core) 기술의 복귀.
  • 네이티브 쿼드코어 설계
  • L3 공유 캐시 메모리 추가. L2 캐시 메모리는 코어 당 256KB 개별 내장.
  • 노스 브리지 내장 (PCI-E 컨트롤러(LGA 1156 한정), 메모리 컨트롤러 등을 통합)
  • LGA 1366 플랫폼에서 트리플 채널 DDR3 메모리 기술 적용, DDR2 규격은 더이상 지원하지 않음
  • LGA 1156 플랫폼에서는 듀얼 채널 DDR3 메모리로 유지되며, LGA 1366 플랫폼과 마찬가지로 DDR2를 지원하지 않음
  • SSE 4.2 명령어 추가
  • VT(Virtualization Technology, 가상화 기술)인 VT-d, 단일 스레드만을 사용할 때 다른 코어의 활동을 정지시켜 전력 소비를 줄이는 기술과 스레드를 1개나 2개만을 사용할때 순간적으로 코어클럭을 끌어올리는 터보부스트등 새로운 명령어가 다수 탑재.
  • 코어 아키텍처 모델에 비해 단일 스레드에서 최고 25%, 같은 전력 소비량의 다중 스레드에서 최고 100% 성능 향상
  • 코어 아키텍처 CPU와 성능이 같은 경우 전력 소비량이 최고 30% 적음

3.2. 웨스트미어 (32nm 공정)


  • IDF 2009에서 처음 공개된 후 2010년 1월에 본격 투입된 마이크로아키텍처.
  • CPU 코어는 45nm에서 32nm 공정으로 미세화되었고, 나머지 내장 GPU와 내장 메모리 컨트롤러는 45nm 공정 그대로 유지되었다.
  • AES, AES-NI 알고리즘 포함. 지원하는 소프트웨어 사용 시 암호화 및 해제 속도를 최고 3배까지 향상시킬 수 있다.
  • 일부(듀얼코어 모바일/데스크탑 모델) 모델에 내장 그래픽 코어 포함. 원래는 초기형 네할렘 모델인 어번데일(모바일)과 헤븐데일(데스크탑)에 넣을 계획이었지만, 여러 이유로 프로젝트를 뒤엎었다. 그 이유로 초기형 네할렘 모델에는 듀얼코어 제품군이 없다.
  • 가상화 반응 속도 개선 및 가상화 무제한 모드 추가

4. 재조명


일반적으로 구 세대 CPU는 새로운 아키텍처를 쓴 CPU에 밀려 단종이 되고, 더 시간이 지나면 중고 거래조차 뜸해져 정말 역사의 뒤안길로 사라지는 것이 보통이다. 그렇지만 네할렘 아키텍처 CPU 가운데 일부 모델은 2014년을 전후로 갑자기 재조명을 받으며 활발한 중고 거래가 이뤄지게 된다. 그 중심에 있는 것이 제온 X5650이라는 CPU.
제온 X5650은 LGA1366 규격을 쓰는 웨스트미어-EP 코어의 서버용 헥사코어 CPU다. 그냥 헥사코어 제품군 가운데 기본형 모델이기에 일반 사용자와 큰 접점이 없었어야 했으나, 이 CPU를 데스크탑/세미 워크스테이션용 칩셋인 X58 칩셋 메인보드에 쓸 수 있다는 것이 알려지면서 일부 인외마경 커뮤니티를 중심으로 붐이 일었다. 메인보드 가격이 중고임에도 비싸지만[2], 헥사코어 CPU를 10만원 미만으로 구할 수 있었기 때문. 물량이 풍부하게 돌아다닐 때는 6만원대까지 떨어졌다. 아키텍처가 구 세대[3]에 작동 속도도 느리지만, 작동 속도는 오버클럭으로 극복할 수 있고, 비록 최신형 CPU보다 성능이 떨어진다고는 하나 헥사코어 + 하이퍼스레딩의 조합이 내는 성능은 무시할 수 없어 저렴한 가격으로 많은 코어를 필요로 하는 작업을 하는 사용자부터 그냥 저렴하게 업그레이드를 하려는 사람까지 몰려들었다. 2014년 말을 기준으로 CPU 공급이 줄어들고 열풍도 잠잠해져 다시 CPU 가격이 10만원 선으로 올라갔지만, 조금만 싼 매물이 나오면 바로 달려들 정도로 잠재 수요가 남아 있는 편.

4.1. 한계


2019년 이후로는 X5650보다 한 단계 더 윗등급인 X5670 중고를 2만원 정도에 구할 수 있는 상황이다. 4.0GHz 이상 오버클럭이 손쉽게 들어가며 이 경우 정수 연산 능력도 현세대 CPU들에 크게 밀리지 않아 압축 성능 벤치마크 등에서는 꽤 선전하는 모습을 볼 수 있으나, 렌더링과 인코딩 및 게임 등 다양한 분야에 영향을 미치는 부동소수점 연산이 확연히 딸리고 최신 명령어도 지원하지 않기 때문에 실제 체감 성능은 신통치 않다. 게다가 DDR3 램을 사용하기에 메모리 읽기/쓰기 속도 및 레이턴시가 당연히 뒤쳐지고, 어지간히 고급형 보드가 아닌 이상 SATA3나 USB 3.0 등의 규격을 지원하지 않기에 CPU 외적으로 속도에서 발목잡는 부분이 많다.
간단히 비교하면 6코어 12스레드 제품을 4.2GHz 정도로 오버했을 때 2019년 시점의 현역 6코어 6스레드 CPU들[4]과 정수 연산 능력은 엇비슷하거나 살짝 우위를 점하는 반면, 부동소수점 연산 능력은 거의 반절 이상 뒤떨어진다. 여기에 전력은 엄청나게 퍼먹고 앞서 언급한 DDR3 램이나 SATA2, USB 2.0 등 CPU 자체 성능 외적인 부분까지 보면 더욱 못 써먹을 물건이다.
결정적으로 걸림돌이 되는건 메인보드다. X58 칩셋 메인보드들은 나온지 10년은 된 것들이라 수명이 간당간당하고 그나마 매물도 적은 편이라 10년 먹은 중고 주제에 10만 정도 시세로 책정되어 올라오는 경우가 빈번하다. 똑같이 6c/12t인 샌디브릿지 제품군 3930K나 E5-1650는 중고 매물 시세도 웨스트미어 제온들과 비슷하고, 품질에 의구심이 들 수는 있겠지만 중국산 신품 소켓 2011 메인보드[5] 매물이 넘쳐나기에 시스템을 구성하기가 한참 더 쉽다.
냉정하게 말해 X58 메인보드를 기존에 가지고 있던게 아니라면 10만 넘는 돈을 들여가면서까지 웨스트미어 시스템을 맞출 가치는 없다. 어디까지나 취미의 영역.

5. 사용 모델


인텔 네할렘 마이크로아키텍처/사용 모델 문서 참조.

6. 관련 문서



[1] QPI 자체가 없어진 것은 아니고 코어 간, 코어-언코어 간에 존재한다. CPU-메인보드 칩셋 간 외부 인터커넥트가 QPI가 아닐 뿐이다.[2] 2015년 3월 기준으로도 7만원 이상.[3] 이것도 인텔 CPU를 기준으로 할 때의 열세다. AMD CPU로는 2014년말 기준 최신형 모델인 카베리 코어 CPU에 들어서야 겨우 네할렘 아키텍처 CPU를 넘는 IPC를 갖게 되었다.[4] 인텔 i5 9600K나 AMD 라이젠5 3500X.[5] 주로 소켓 1155 메인보드의 6X ~ 7X 시리즈 칩셋을 마개조해서 소켓 2011 CPU들을 사용할 수 있게 만든 물건들.