상위 질문
타임라인
채팅
관점
크레이-2
벡터 슈퍼컴퓨터 위키백과, 무료 백과사전
Remove ads
크레이-2(Cray-2)는 크레이 리서치가 1985년부터 제작한 4개의 벡터 프로세서를 갖춘 슈퍼컴퓨터이다. 최대 성능 1.9 GFLOPS로 출시 당시 세계에서 가장 빠른 컴퓨터였으며, 그 자리를 차지했던 크레이 X-MP를 대체했다. 이후 1988년에 크레이 Y-MP에 의해 그 자리를 내주었다.






크레이-2는 시모어 크레이의 설계 중 다중 CPU를 성공적으로 사용한 첫 번째 디자인이었다. 1970년대 초 CDC 8600에서 시도되었지만, 당시의 이미터-결합 논리 (ECL) 트랜지스터는 작동하는 기계로 조립하기가 너무 어려웠다. 크레이-2는 ECL 집적 회로를 사용하여 이를 해결했고, 회로 밀도를 크게 높이는 새로운 3D 배선 방식으로 조립했다.
크레이-2의 밀집된 패키징과 그로 인한 열 부하는 주요 문제였다. 이 문제는 전기적으로 불활성인 플루오르계 불활성 액체 액체를 압력으로 회로를 통과시킨 다음 프로세서 상자 밖에서 냉각하는 독특한 방식으로 해결되었다. 독특한 "폭포" 냉각 시스템은 대중의 눈에 고성능 컴퓨팅을 상징하게 되었고, 한동안 많은 정보 영화와 영화 소품으로 등장했다.
원래의 크레이-1과 달리, 크레이-2는 최고 성능을 발휘하는 데 어려움이 있었다. X-MP 및 Y-MP와 같은 회사의 다른 기계들은 크레이-2보다 훨씬 많이 팔렸다. 크레이가 크레이-3 개발을 시작했을 때, 회사는 대신 크레이 C90 시리즈를 개발하기로 결정했다. 이것은 8600이 개발될 때 발생했던 일련의 사건과 동일하며, 그 경우와 마찬가지로 크레이는 회사를 떠났다.
Remove ads
초기 설계
요약
관점
자신이 유명한 크레이-1을 성공적으로 출시한 후, 시모어 크레이는 그 후속작의 설계에 착수했다. 1979년까지 그는 이제 대기업이 된 곳에서의 경영 간섭에 지쳐 있었고, 과거에 그랬던 것처럼 경영직을 사임하고 새로운 연구소를 설립하기로 결정했다. 미네소타주 미니애폴리스에 있는 컨트롤 데이터 본사에서 위스콘신주 치페와 폴스로 처음 이전했을 때처럼, 크레이 경영진은 그의 필요를 이해하고 콜로라도주 볼더에 있는 새로운 연구소로의 이전을 지원했다. 1980년부터 이 새로운 크레이 랩스에서 독립 컨설턴트로 일하면서, 그는 팀을 꾸리고 완전히 새로운 디자인에 착수했다. 이 연구소는 나중에 폐쇄되었고, 10년 후 콜로라도스프링스에 새로운 시설이 문을 열었다.
크레이는 이전에 세 가지 동시 발전으로 속도 증가 문제를 해결했다: 시스템에 더 높은 병렬성을 부여하기 위한 더 많은 기능 장치, 신호 지연을 줄이기 위한 더 밀집된 패키징, 더 높은 클록 속도를 가능하게 하는 더 빠른 구성 요소. 이 설계의 고전적인 예는 CDC 8600으로, 1×1미터 원통형 안에 ECL 논리를 기반으로 한 4개의 CDC 7600과 유사한 기계를 패키징하고 8 ns 사이클 속도 (125 MHz)로 구동했다. 불행히도, 이 사이클 시간을 달성하는 데 필요한 밀도는 기계의 몰락으로 이어졌다. 내부 회로 기판은 밀집되어 있었고, 단 하나의 오작동하는 트랜지스터라도 전체 모듈을 고장 나게 할 수 있었기 때문에 더 많은 트랜지스터를 카드에 패키징하는 것은 고장 가능성을 크게 높였다. 밀집된 개별 구성 요소를 냉각하는 것도 주요 과제였다.
이 문제에 대한 한 가지 해결책은 대부분의 컴퓨터 공급업체가 이미 채택한 것으로, 개별 구성 요소 대신 집적 회로 (IC)를 사용하는 것이었다. 각 IC는 자동화된 제작 공정을 통해 회로에 미리 배선된 모듈의 구성 요소들을 포함했다. IC가 작동하지 않으면 다른 IC가 시도되었다. 8600이 설계될 당시에는 간단한 MOSFET 기반 기술이 크레이가 필요로 하는 속도를 제공하지 못했다. 그러나 1970년대 중반까지 끊임없는 개선으로 상황이 바뀌었고, 크레이-1은 새로운 IC를 사용하고도 12.5 ns (80 MHz)의 적절한 속도로 작동할 수 있었다. 실제로 크레이-1은 IC의 작은 크기 덕분에 시스템에 훨씬 더 많은 논리를 집적했기 때문에 8600보다 실제로 다소 빨랐다.
IC 설계는 계속 발전했지만, IC의 물리적 크기는 주로 기계적 한계에 의해 제약되었다. 그 결과 구성 요소는 시스템에 납땜할 수 있을 만큼 커야 했다. 마이크로프로세서 설계의 급속한 발전이 보여주듯이, 밀도의 극적인 개선은 가능했지만, 크레이가 사용하는 유형의 IC, 즉 전체 회로의 아주 작은 부분을 나타내는 IC의 경우 설계는 정체되어 있었다. 크레이가 목표로 했던 크레이-1보다 성능을 10배 더 향상시키기 위해서는 기계가 더 복잡해져야 했다. 그래서 그는 다시 8600과 유사한 해결책으로 눈을 돌려, 밀도 증가를 통해 클록 속도를 두 배로 늘리고, 이러한 더 작은 프로세서를 기본 시스템에 더 많이 추가한 다음, 기계에서 열을 제거하는 문제를 해결하려고 시도했다.
또 다른 설계 문제는 프로세서와 주기억장치 사이의 성능 격차가 커지는 것이었다. CDC 6600 시대에는 메모리가 프로세서와 같은 속도로 작동했고, 주요 문제는 메모리에 데이터를 공급하는 것이었다. 크레이는 시스템에 10개의 더 작은 컴퓨터를 추가하여 이 문제를 해결했다. 이 컴퓨터들은 느린 외부 저장 장치(디스크 및 테이프)를 처리하고, 주 프로세서가 바쁠 때 메모리에 데이터를 "뿌려넣었다". 이 해결책은 더 이상 어떤 이점도 제공하지 않았다. 메모리는 전체 데이터 세트를 읽어들일 수 있을 만큼 충분히 컸지만, 프로세서가 메모리보다 훨씬 빠르게 작동하여 데이터가 도착하기를 기다리는 데 오랜 시간을 보내는 경우가 많았다. 4개의 프로세서를 추가하면 이 문제가 더욱 악화될 뿐이었다.
이 문제를 피하기 위해 새로운 설계는 메모리를 뱅크하고 두 세트의 레지스터(B- 및 T-레지스터)를 캐시가 아닌 로컬 메모리라고 불리는 가장 빠른 메모리 16 KWord 블록으로 대체하고, 4개의 백그라운드 프로세서를 별도의 고속 파이프로 연결했다. 이 로컬 메모리는 CPU당 Gbit/s 채널을 통해 주 메모리에 연결된 전용 포그라운드 프로세서에 의해 데이터가 공급되었다. 대조적으로 X-MP는 두 개의 동시 로드와 하나의 저장을 위해 세 개의 채널을 가졌고, Y-MP/C-90은 폰 노이만 병목 현상을 피하기 위해 다섯 개의 채널을 가졌다. 컴퓨터를 "실행"하고, 저장 공간을 처리하며, 주 메모리로의 여러 채널을 효율적으로 사용하는 것은 포그라운드 프로세서의 작업이었다. 포그라운드 프로세서는 기존 캐시 파이프를 백그라운드 프로세서에 묶지 않고 8개의 16 워드 버퍼를 통해 실행해야 하는 명령을 전달하여 백그라운드 프로세서를 구동했다. 최신 CPU도 이 설계의 변형을 사용하지만, 이제 포그라운드 프로세서는 로드/스토어 장치로 불리며 자체로 완전한 기계는 아니다.
주 메모리 뱅크는 동시에 액세스할 수 있도록 쿼드런트로 배열되어 프로그래머가 메모리 전체에 데이터를 분산하여 더 높은 병렬성을 얻을 수 있도록 했다. 이 접근 방식의 단점은 포그라운드 프로세서에서 스캐터/개더 장치를 설정하는 비용이 상당히 높다는 것이다. 메모리 뱅크 수에 해당하는 스트라이드 충돌은 성능 저하(지연)를 겪었는데, 이는 2의 거듭제곱 FFT 기반 알고리즘에서 때때로 발생했다. 크레이 2는 크레이 1이나 X-MP보다 훨씬 큰 메모리를 가졌기 때문에 배열에 사용되지 않는 요소를 추가하여 작업을 분산함으로써 이 문제를 쉽게 해결할 수 있었다.
밀집된 회로 기판과 새로운 설계 아이디어
초기 크레이-2 모델은 곧 IC로 가득 찬 대형 회로 기판을 사용하는 설계에 정착했다. 이로 인해 납땜하기가 매우 어려웠고, 밀도는 여전히 성능 목표에 도달하기에 충분하지 않았다. 팀은 약 2년 동안 설계 작업을 했지만, 크레이 자신조차도 "포기"하고 프로젝트를 취소하고 모든 작업자를 해고하는 것이 최선이라고 결정했다. 크레이 본사에 남아 있던 크레이의 전 설계 협력자 레스 데이비스는 낮은 우선순위로 계속 진행해야 한다고 결정했다. 약간의 인력 이동 후에도 팀은 이전과 거의 동일하게 계속 작업했다.

6개월 후 크레이는 그의 "유레카" 순간을 맞았다. 그는 주요 엔지니어들을 회의에 소집하여 문제에 대한 새로운 해결책을 제시했다. 하나의 큰 회로 기판을 만드는 대신, 각 "카드"는 8개의 3차원 스택으로 구성되며, 표면에서 튀어나온 핀("포고" 또는 "z-핀"으로 알려짐)을 사용하여 보드의 중앙에서 서로 연결된다. 카드들은 서로 바로 위에 쌓여 있었으므로, 그 결과로 생긴 스택의 높이는 약 30mm에 불과했다.
이러한 밀도에서는 어떤 기존의 공랭식 시스템도 작동할 수 없었다. IC들 사이에 공기가 흐를 공간이 너무 적었기 때문이다. 대신 시스템은 3M의 새로운 불활성 액체인 플루오르계 불활성 액체가 담긴 탱크에 잠겨 있을 것이다. 냉각액은 압력 하에 모듈을 통해 옆으로 강제로 흘러갔고, 유속은 초당 약 1인치였다. 가열된 액체는 냉각된 물 열교환기를 사용하여 냉각된 후 주 탱크로 돌아갔다. 새로운 설계 작업은 원래 시작일로부터 몇 년이 지난 1982년에 본격적으로 시작되었다.
이러한 작업이 진행되는 동안, 크레이 본사에서는 스티브 첸의 지휘 아래 크레이 X-MP가 개발되고 있었으며, 크레이-2에 심각한 경쟁자가 될 것으로 보였다. 이러한 내부 위협과 새로운 일본의 크레이-1과 유사한 기계들에 대처하기 위해 크레이-2 메모리 시스템은 크기와 프로세서로의 "파이프" 수 모두에서 극적으로 개선되었다. 1985년에 이 기계가 마침내 출시되었을 때, 지연이 너무 길어서 성능 이점의 상당 부분이 더 빠른 메모리 덕분이었다. 이 기계를 구매하는 것은 대규모 데이터 세트를 처리해야 하는 사용자에게만 실제로 의미가 있었다.
처음 출시된 크레이-2는 이전에 출시된 모든 크레이 머신을 합친 것보다 더 많은 물리적 메모리(256 MWord)를 가지고 있었다. 시뮬레이션은 느린 가상 메모리에 의존할 필요가 없었기 때문에 2차원 또는 거친 3차원 영역에서 더 정밀한 3차원 영역으로 이동했다.
Remove ads
용도 및 후속 기종
크레이-2는 주로 미국의 미국 국방부와 미국 에너지부를 위해 개발되었다. 용도는 핵무기 연구나 해양 (소나) 개발에 주로 사용되었다. 그러나 첫 번째 크레이-2 (일련 번호 1)는 로렌스 리버모어 국립연구소의 국립 자기 융합 에너지 컴퓨터 센터에서 비분류 에너지 연구에 사용되었다. 또한 민간 기관(NASA 에임스 연구 센터 등), 대학, 전 세계 기업에도 도입되었다. 예를 들어, 포드와 제너럴 모터스는 모두 크레이-2를 사용하여 자동차 차체에 대한 복잡한 유한 요소 해석 모델을 처리하고, 생산 전에 차체 부품에 대한 가상 충돌 테스트를 수행했다.
크레이-2는 크레이-3에 의해 계승되었어야 했지만, 개발 문제로 인해 단 한 대의 크레이-3만 제작되었고 비용도 지불되지 않았다. 크레이-2의 정신적 후손은 크레이에서 제공하는 크레이 X1이다.
이후 컴퓨터와의 비교
2012년, 잭 동가라의 전 박사 과정 학생이었던 피오트르 루쉬체크는 아이패드 2가 내장된 LINPACK 벤치마크에서 크레이-2의 역사적 성능과 일치한다는 결과를 발표했다.[1]
Remove ads
기타
액체 냉각 방식의 사용으로 인해 크레이-2는 "버블스"라는 별명을 얻었으며, 이 독특한 시스템에 대한 농담이 컴퓨터 주변에 흔했다. "낚시 금지" 표지판, 열교환기 탱크에서 솟아오르는 네스호의 괴물의 판지 그림, 교환기 안의 플라스틱 물고기 등이 있었다. 크레이-2의 전력 소비량은 150~200 kW였다. 1990년대 초 로렌스 리버모어 국립연구소에서 수행된 연구에 따르면, 크레이-2 회로를 냉각하는 데 사용된 퍼플루오르화 폴리에테르가 제한된 범위 내에서 분해되어 매우 유독한 가스인 퍼플루오로이소부틸렌을 형성할 수 있다고 한다.[2] 당시 크레이는 냉각액이 시각 효과를 위해 흐르는 투명한 "버블 챔버"를 보여주는 포스터를 제작했는데, 같은 물질이 바닥에 반짝이는 모습이 담겨 있었다. 농담은 실제로 이런 일이 발생하면 시설을 대피시켜야 할 것이라는 것이었다.[3] 액체 제조업체는 이 독성 분해 산물을 촉매적으로 분해할 수 있는 스크러버를 펌프와 직렬로 배치하여 개발했다.
논리 모듈의 각 수직 스택은 5볼트 버스바에 전력을 공급하는 전력 모듈 스택 위에 위치했으며, 각 버스바는 약 2200암페어를 공급했다. 크레이-2는 480V 3상을 사용하는 두 개의 모터-제너레이터에 의해 전원이 공급되었다.
같이 보기
- 슈퍼컴퓨팅의 역사
각주
외부 링크
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads