명령어 파이프라이닝과 슈퍼스칼라 기법을 실제로 CPU에 적용하려면 명령어가 파이프라이닝에 최적화되어 있어야 한다. 쉽게 말해 CPU가 파이프라이닝과 슈퍼스칼라 기법을 효과적으로 사용하려면 CPU가 인출하고 해석하고 실행하는 명령어가 파이프라이닝 하기 쉽게 생겨야 한다.
’파이프라이닝 하기 쉬운 명령어는 무엇일까?’ 명령어가 어떻게 생겨야 파이프라이닝에 유리할까? 이와 관련된 CPU의 언어인 ISA와 각기 다른 성격의 ISA를 기반으로 설계된 CISC와 RISC를 학습해보자.
3장에서 학습한 명령어를 기억하는가? 명령어의 생김새와 주소 지정 방식 등을 학습했고, CPU는 명령어를 실행한다고 했다. 그런데 한 가지 의문이 든다. 이 세상 모든 CPU들이 똑같이 생긴 명령어를 실행할까? 세상에는 수많은 CPU 제조사들이 있고, CPU마다 규격과 기능, 만듦새가 다 다른데, 모든 CPU가 이해하고 실행하는 명령어들이 다 똑같이 생겼을까?
그렇지 않다. 물론 명령어의 기본적인 구조와 작동 원리는 3장에서 학습한 내용에서 크게 벗어나지 않지만, 명령어의 세세한 생김새, 명령어로 할 수 있는 연산, 주소 지정 방식 등은 CPU마다 조금씩 차이가 있다. CPU가 이해할 수 있는 명령어들의 모음을 명령어 집합(Instrunction set) 또는 명령어 집합 구조(ISA, Instruction Set Architecture)라고 한다. 즉, CPU마다 ISA가 다를 수 있다는 것이다.
가령 인텔의 노트북 속 CPU는 x86 혹은 x86-64 ISA를 이해하고, 애플의 아이폰 속 CPU는 ARM ISA를 이해한다. x86(x86-64)과 ARM은 다른 ISA이기 때문에 인텔 CPU를 사용하는 컴퓨터와 아이폰은 서로의 명령어를 이해할 수 없다. 실행 파일은 명령어로 이루어져 있고 서로의 컴퓨터가 이해할 수 있는 명령어가 다르기 때문이다.
3장에서 어셈블리어는 명령어를 읽기 편하게 표현한 언어라고 했다. ISA가 다르다는 건 CPU가 이해할 수 있는 명령어가 다르다는 뜻이고, 명령어가 달라지면 어셈블리어도 달라진다. 다시 말해 같은 소스 코드로 만들어진 같은 프로그램이라 할지라도 ISA가 다르면 CPU가 이해할 수 있는 명령어도 어셈블리어도 달라진다는 것이다.
ISA가 같은 CPU끼리는 서로의 명령어를 이해할 수 있지만, ISA가 다르면 서로의 명령어를 이해하지 못한다. 이런 점에서 볼 때 ISA는 일종의 CPU의 언어인 셈이다. 각기 다른 언어를 사용하는 나라들을 보면 사용하는 언어만 다른게 아니라 언어에 따라 사람들의 가치관과 생활 양식도 다른 것을 볼 수 있다. 마치 높임말이 있는 나라에서는 비교적 어른을 공경하는 문화가 자리잡혀 있고, 높임말이 없는 나라에서는 비교적 평등한 문화가 자리잡힌 것처럼 말이다.
CPU도 마찬가지이다. CPU가 이해하는 명령어들이 달라지면 비단 명령어의 생김새만 달라지는 게 아니다. 제어장치가 명령어를 해석하는 방식, 사용되는 레지스터의 종류와 개수, 메모리 관리 방법 등 많은 것이 달라진다. 그리고 이는 곧 CPU 하드웨어 설계에도 큰 영향을 미친다. 우리가 사용하는 실행 프로그램은 명령어로 이루어져 있는데 ISA는 CPU의 언어임과 동시에 CPU를 비롯한 하드웨어가 소프트웨어를 어떻게 이해할지에 대한 약속이라고 볼 수 있다.
앞서 명령어 병령 처리 기법들을 학습했었다. 이를 적용하기에 용이한 ISA가 있고, 그렇지 못한 ISA도 있다. 다시 말해 명령어 파이프라인, 슈퍼스칼라, 비순차적 명령어 처리를 사용하기에 유리한 명령어 집합이 있고, 그렇지 못한 명령어 집합도 있다. 그렇다면 명령어 병렬 처리 기법들을 도입하기 유리한 ISA는 무엇일까? 이와 관련해 현대 ISA의 양대 산맥인 CISC와 RISC에 대해 알아보자.
우선 CISC에 대해 알아보자. CISC는 Complex Instruction Set Computer의 약자이다. 이를 그대로 해석하면 ‘복잡한 명령어 집합을 활용하는 컴퓨터’를 의미한다. 여기서 ‘컴퓨터’를 ‘CPU’라고 생각해도 좋다. CISC란 이름 그대로 복잡하고 다양한 명령어들을 활용하는 CPU 설계 방식이다. 앞서 ISA의 한 종류로 소개한 x86, x86-64는 대표적인 CISC 기반의 ISA이다.
CISC는 다양하고 강력한 기능의 명령어 집합을 활용하기 때문에 명령어의 형태와 크기가 다양한 가변 길이 명령어를 활용한다. 메모리에 접근하는 주소 지정 방식도 다양해서 아주 특별한 상황에서만 사용되는 독특한 주소 지정 방식들도 있다. 다양하고 강력한 명령어를 활용한다는 말은 상대적으로 적은 수의 명령어도로 프로그램을 실행할 수 있다는 것을 의미한다.
이런 장점 덕분에 CISC는 메모리를 최대한 아끼며 개발해야 했던 시절에 인기가 높았다. ‘적은 수의 명령어만으로도 프로그램을 동작시킬 수 있다’는 점은 메모리 공간을 절약할 수 있다는 장점이기 깨문이다. 하지만 CISC에는 치명적인 단점이 있다. 활용하는 명령어가 워낙 복잡하고 다양한 기능을 제공하는 탓에 명령어의 크기와 실행되기까지의 시간이 일치하지 않는다. 그리고 복잡한 명령어 떄문에 명령어 하나를 실행하는 데에 여러 클럭 주기를 필요로 한다.
이는 명령어 파이프라인을 구현하는 데에 큰 컬림돌이 된다. 예를 들어 명령어 파이프라인 기법을 위한 이상적인 명령어는 아래 그림과 같이 각 단계에 소요되는 시간이 동일해야 된다. 그래야 파이프 라인이 마치 공장의 생산 라인처럼 결과를 낼 것이기 때문이다.
하지만 CISC가 활용하는 명령어는 명령어 수행 시간이 길고 가지각색이기 때문에 파이프라인이 효율적으로 명령어를 처리할 수 없다. 한마디로 규격화되지 않은 명령어가 파이프라이닝을 어렵게 만든 셈이다. 명령어 파이프라인이 제대로 동작하지 않는다는 것은 현대 CPU에서 아주 치명저인 약점이다. 현대 CPU에서 명령어 파이프라인은 높은 성능을 내기 위해 절대 놓쳐서는 안 되는 핵심 기술이기 때문이다.
게다가 CISC가 복잡하고 다양한 명령어를 활용할 수 있다고는 하지만, 사실 대다수의 복잡한 명령어는 그 사용 빈도가 낮다. 1974년 IBM 연구소의 존 코크(John Cocke)는 CISC 명령어 집합 중 불과 20% 정도의 명령어가 사용된 전체 명령어의 80%가량을 차지한다는 것을 증명하기도 했다. CISC 명령어 집합이 다양하고 복잡한 기능을 지원하지만 실제로는 자주 사용되는 명령어만 쓰였다는 것이다.
정리하면 CISC 명령어 집합은 복잡하고 다양한 기능을 제공하기에 적은 수의 명령으로 프로그램을 동작시키고 메모리를 절약할 수 있지만, 명령어의 규격화가 어려워 파이프라이닝이 어렵다. 그리고 대다수의 복잡한 명령어는 그 사용 빈도가 낮다. 이러한 이유로 CISC 기반 CPU는 성장에 한계가 있다.
CISC의 한계가 우리들에게 준 교훈은 크게 아래와 같다.
빠른 처리를 위해 명령어 파이프라인을 십분 활용해야 한다. 원활한 파이프라이닝을 위해 ‘명령어 길이와 수행 시간이 짧고 규격화’되어 있어야 한다.
어차피 자주 쓰이는 명령어만 줄곧 사용된다. 복잡한 기능을 지원하는 명령어를 추가하기보다는 ‘자주 쓰이는 기본적인 명령어를 작고 빠르게 만드는 것’이 중요하다.
이런 원칙 하에 등장한 것이 RISC이다. RISC는 Reduced Instruction Set Computer의 약자이다. 이름처럼 RISC는 CISC에 비해 명령어의 종류가 적다. 그리고 CISC와는 달리 짧고 규격화된 명령어, 되도록 1클럭 내외로 실행되는 명령어를 지향한다. 즉, RISC 고정 길이 명령어를 활용한다.
명령어과 규격화되어 있고, 하나의 명령어가 1클럭 내외로 실행되기 때문에 RISC 명령어 집합은 명령어 파이프라이닝에 최적화되어 있다.