미 슈퍼컴퓨터 서밋, 1초당 20경 7000조 회 연산가능



미국이 중국을 제치고 다시 슈퍼컴퓨터 세계 1위 왕좌를 탈환했다. 2013년 6월 세계에서 가장 빠른 슈퍼컴퓨터 보유국 지위를 중국에 뺏긴 지 5년 만이다. 지난 달 25일 국제슈퍼컴퓨터학회(ISC)가 발표한 '슈퍼컴퓨터 글로벌 톱500' 순위에서다.


슈퍼컴퓨터가 국가 과학기술 수준을 보여주는 상징이 되면서 G2(미국•중국) 간 최고자리를 차지하기 위한 경쟁이 치열하게 전개되고 있다. 각종 첨단기술 집약체인 슈퍼컴퓨터 활용 분야는 우주 탐사, 해킹이나 테러 위협 예방, 항공기 비행과 충돌 시뮬레이션, 암 치료제 등 신약 개발, 경기와 주가 예측 등 무궁무진하다. 슈퍼컴퓨터는 경제 정책 수립에도 활용될 수 있다.


 미국 연방준비은행 연구자들은 2014년 주어진 세율에 대해 각 가구가 어떤 반응을 보이는지에 대한 수학적 모형을 만든 뒤 슈퍼컴퓨터로 미국 수백만 가구 케이스를 빠르게 계산해 최적 세율 53%를 뽑아낸 바 있다.


 최근에는 바이오 분야 활용도 늘어나는 추세다. 신약을 개발하기 위해서는 단백질을 구성하는 수십만 개 분자 행동을 일일이 파악해야 하는데 분자 움직임을 예측하는 물리학 공식을 슈퍼컴퓨터로 계산하면 경우의 수를 미리 알아내 치매, 파킨슨병 등 퇴행성 뇌 질환부터 당뇨, 암에 이르는 각종 질병에 대한 원자 수준의 치료법을 찾아낼 수 있다.


█ 미국의 자존심 회복


미국은 지난 2013년 이후 5년 만에 정상 자리를 되찾아 자존심을 다시 세웠다. 지난 4년 동안 '코랄(CORAL)' 사업을 진행하며 절치부심한 결과다. 중국은 2013년 6월 이후 줄곧 1위 자리를 유지하다 차순위로 물러났다.


미국이 내놓은 최종병기는 에너지부 산하 아크리지국립연구소(ORNL)에 위치한 '서밋(SUMMIT)'이다. 서밋의 이론 성능은 207페타플롭스(PF)다. 1초당 20경7000조 번이나 연산이 가능하다. 종전에 1위를 지키던 중국 타이후라이트(TaihuLight)의 125PF보다 두 배 가까이 높다. 메모리는 2.4페타바이트(PB), 디스크는 250PB다. 15메가와트(MW)에 달하는 전력이 필요하다.

서밋은 강력한 연산 능력을 발휘하기 위해 두 가지 프로세서를 병용했다. 4608개 서버에 IBM CPU와 엔비디아 GPU를 담았다.


                                                          게티이미지뱅크


CPU는 IBM이 개발한 최신 서버용 22코어 '파워9 프로세서' 9000개를 썼다. 이 CPU는 코어당 4~8개 스레드를 지원, CPU 하나로 여러 개를 쓴 효과를 낸다.

GPU는 엔비디아 '테슬라 V100' GPU 2만7000개를 활용했다. 이 GPU는 200억 개가 넘는 트랜지스터를 집적한 프로세서다. 보통 연산은 물론이고 기계학습을 위한 연산도 빠르게 수행할 수 있다. 이 결과로 기계학습, 신경망 네트워크를 비롯한 인공지능(AI) 기술 활용을 위해 설계된 세계 최초 모델이 됐다.


오크리지국립연구소는 서밋을 암 발생이나 지구 온난화 추세 예측과 같이 방대한 연산능력이 필요한 분야에 활용할 계획이다. 미국은 이밖에 서밋과 구조는 같지만 성능은 다소 낮은 슈퍼컴퓨터 '시에라(Sierra)'도 3위로 순위에 올렸다.


그렇다고 중국이 힘을 잃은 것은 아니다. 타이후라이트가 여전히 2위를 지키고 있다. 역시 중국이 보유한 '텐허(Tianhe)-2'도 4위를 지켰다. 중국은 '질'에서는 다소 주품했지만 '양'에서는 미국을 앞질렀다.


중국이 보유한 톱500 내 슈퍼컴퓨터는 총 206대에 달한다. 이전 순위 발표 시점인 지난해 11월 당시보다 4대나 늘었다. 반면에 미국은 144대에서 124대로 내리막길을 걸었다.


미국과 중국은 앞으로도 슈퍼컴퓨터 분야에서 경쟁을 거듭할 전망이다. 슈퍼컴퓨터가 국가 과학기술 수준을 보여주는 바로미터가 되면서 날이 갈수록 경쟁이 격화되고 있다.


미국은 2021년까지 1초에 100경번 연산이 가능한 '엑사플롭스(EF)' 수준의 속도를 구현할 컴퓨터를 개발할 계획이다. IBM과 엔비디아를 비롯한 미국 주요 IT기업도 고성능 프로세서 개발에 나서고 있다.


중국도 기존 슈퍼컴퓨터를 업그레이드한 모델을 내놓을 것으로 보인다. 텐허-2를 강화한 '텐허-2A' 등장이 목전이라는 전망이 나온다.


이번 톱500순위에서는 우리나라의 성과도 두드러졌다. 한국과학기술정보연구원(KISTI)이 보유한 국가 슈퍼컴퓨터 5호기 '누리온'이 랭킹 11위를 차지했다. 누리온의 성능은 이론 기준 25.7PF다. 지난해 슈퍼컴퓨터 4호기가 500위 순위권 밖으로 밀려난 치욕을 덜어냈다. 이밖에 기상청이 보유한 슈퍼컴퓨터 미리와 누리가 각각 75위와 76위에 이름을 올렸다.


우리나라가 보유한 500위권 내 슈퍼컴퓨터는 총 7대다. 순위권내 시스템 보유대수 순위는 중국, 미국, 일본, 영국, 독일, 프랑스, 네덜란드에 이어 8위다.


박찬열 한국과학기술정보연구원(KISTI) 슈퍼컴퓨팅개발센터장은 "슈퍼컴퓨터는 워낙 여러 기술의 복합체라 속도를 높이기 위해 다양한 시도를 하는 과정에서 기존에 적용되지 않았던 신기술이 접목되기도 하면서 엄청난 혁신을 몰고 온다"며 "국가 간 기싸움도 없지는 않겠지만 슈퍼컴퓨터 경쟁에서 주도권을 쥔다는 것은 그야말로 첨단기술을 선도한다는 지표로 활용될 수 있다"고 설명했다.


특히 슈퍼컴퓨터에서 시작된 혁신이 향후 PC나 휴대폰 등 일상 곳곳으로 파급될 수 있고 다수의 이용자가 원격지에서 공동으로 슈퍼컴퓨터를 활용해 더 빠른 속도로 정보를 확보할 수 있기 때문에 더 중요하다는 게 박 연구원의 설명이다.


작년까지는 '과학 굴기'를 부르짖는 중국의 약진이 뚜렷했다. 선웨이 타이후즈광이 2년 연속 랭킹 1위를 굳건히 지켰을 뿐 아니라 상위 500위 슈퍼컴퓨터 중 가장 많은 202대가 중국 소유로 집계돼 미국(143대)을 큰 차이로 제쳤다.


 이 때문에 올해 서밋의 등장은 미국의 짓밟힌 자존심을 회복한다는 의미가 크다. 일반 데스크톱으로 30년간 작업할 분량을 단 1시간에 끝내고 앞선 미국의 대표 슈퍼컴퓨터 '타이탄'의 이론성능 27페타플롭스의 약 8배 빠르기를 자랑한다는 서밋. 어떻게 단기간에 이 같은 속도의 혁신이 가능해진 걸까.


슈퍼컴퓨터의 머리 역할을 하는 중앙처리장치(CPU)를 대신해 이미지처리장치(GPU)를 많이 장착한 게 바로 서밋 성능의 비결이다. 2010년 전까지는 슈퍼컴퓨터에 CPU를 주로 사용했고 각국은 CPU 성능을 높이는 데 집중됐다. CPU가 사람의 '머리'라면 코어는 사람의 '뇌'인데 뇌를 머리에 최대한 많이 달아 계산을 빠르게 하려는 시도가 이어졌다. 선웨이 타이후즈광에는 코어가 1000만개나 장착됐을 정도다. 또 한 대의 CPU 성능을 높이는 데 한계에 부딪치자 병렬 처리 방법으로 여러 대의 CPU를 연결하는 경쟁이 격화됐다. 그러나 무조건 '다다익선'은 아니었다. 코어 수가 기하급수적으로 늘어나면서 엄청난 양의 전기가 필요해졌고 발열 등 새로운 문제점이 나타났다. 결국 2010년을 넘어가면서부터 CPU 대안으로 등장한 게 보다 값싸고 효율적인 GPU다. 주로 이미지 데이터 처리에 쓰이던 프로세서를 슈퍼컴퓨터에 적용함으로써 범용 계산에 이용하기 시작한 것이다.


박 센터장은 "슈퍼컴퓨터의 가장 큰 문제 중 하나가 전력 소모였는데 서밋은 에너지를 덜 먹는 GPU를 과거에 비해 많이 집어넣어 성능뿐만 아니라 전력 효율을 높였다"며 "GPU는 그래픽처럼 조금은 단순한 연산을 대량으로 할 수 있기 때문에 속도를 높이는 데 효과가 있다"고 말했다. 서밋은 강력한 연산 능력을 발휘하기 위해 CPU와 GPU를 모두 사용했다. IBM 최신 서버용 CPU인 '파워9' 9216개와 엔비디아가 개발한 볼타 V100 기반의 GPU 2만7648개가 들어갔다. 연산은 GPU가 하고 CPU는 이런 연산을 통제•관리하는 구조다. 총 무게만 340t이고 크기는 테니스 코트 두 개와 맞먹는다. 물론 여전히 열을 식히기 위해 분당 1만5000ℓ의 물을 사용하고 정점일 때 전력 소비량은 7000가구에 전원을 공급할 수 있는 약 15메가와트에 달하지만 이전 모델들에 비해서는 효율도가 많이 높아진 것이다.


슈퍼컴퓨터가 인공지능(AI)과의 접점을 늘려간다는 점도 괄목할 만한 변화다. 그동안 GPU는 주로 머신러닝(기계학습) 연산이나 비트코인 같은 가상화폐 채굴에 쓰여 왔다. 가령 이세돌 9단을 꺾은 알파고 머릿속도 역시 GPU를 병렬 처리해 연결한 구조로 돼 있다. 이런 GPU를 많이 장착한 결과 서밋은 일반 연산뿐 아니라 AI 연산을 훨씬 빠르게 수행할 수 있게 됐다. 현시점에서는 '지구에서 가장 강력한 AI 컴퓨터'라는 얘기다. IBM의 고성능 컴퓨팅 인지시스템 담당 부사장 데이브 튜렉은 "시장이 AI와 고성능 컴퓨팅이 별도 영역에 존재하는 게 아니라 통합될 수 있다는 것을 인식하기 시작했다"며 "머신러닝 기술을 통합하면 최적의 결과를 얻기 위해 수행해야 하는 시뮬레이션 양을 크게 줄일 수 있다"고 말했다.


글로벌 슈퍼컴퓨터 전쟁은 서밋으로 되찾은 우위를 놓지 않으려는 미국과 선두를 되찾으려는 중국의 도전으로 점점 더 치열해질 전망이다. 미국은 2021년까지 엑사플롭스(ExaFlops•1초에 100경번 연산) 수준의 속도를 구현할 컴퓨터를 만든다는 목표로 개발에 앞장서고 있다. 중국 역시 정부의 전폭적인 지원으로 후속 모델을 개발 중이다. 선웨이 타이후즈광의 경우 이미 외부 도움 없이 스스로 개발한 CPU를 장착해 모든 부품을 국산화하는 데도 성공했다. 기기만 중국 소유고 머릿속은 모두 미국산으로 이뤄졌다는 한계까지 극복한 것이다. 다만 하드웨어에 비해 소프트웨어 부분은 아직 미국에 한 발 뒤처진다는 지적은 여전하다. 중국과학원 컴퓨터과학 국가중점연구실의 차오지엔원 연구원은 "중국이 빠른 슈퍼컴퓨터를 보유해 좋은 토대를 닦은 것은 맞지만 어떻게 그 사용 효과를 극대화할 수 있는지 아는 데는 10년이라는 시간이 더 걸릴 수 있다"고 실토했다.


한때 글로벌 1위였다가 지난해 말 현재 4위로 밀려난 일본은 슈퍼컴퓨터 개발에 올인한 상태다. 교우코우 슈퍼컴퓨터는 기기가 뿜어낸 열을 절연성 액체에 담가 식히는 방법으로 에너지를 절약해 효율과 친환경 측면에서는 세계 최고 수준으로 평가 받고 있다.


█ "톱500 슈퍼컴 모두가 리눅스", IBM AIX와 유닉스 사라져


전세계 슈퍼컴퓨터 운영체제 시장이 리눅스로 통일됐다.


올해 상반기 순위표에서 사상 처음으로 톱500에 등재된 모든 슈퍼컴퓨터의 운영체제가 리눅스였다. IBM AIX나 유닉스 등의 운영체제가 순위표에서 사라졌다.


                                   미국 에너지부 산하 오크리지 국립연구소의 서밋(Summit)


오크리지 국립연구소의 서밋은 레드햇에서 제공한 레드햇엔터프라이즈리눅스(RHEL)로 작동된다. 제작은 IBM에서 맡았다. 하드웨어는 22코어 파워9 CPU와 엔비디아 테슬라 V100 GPU, 멜라녹스 EDR 인피니밴드 등으로 했다. 노드는 4천356개로 이뤄졌다.


리눅스가 고성능컴퓨팅(HPC) 시장에서 초강세를 기록한게 새롭진 않다. 그러나 이제 HPC OS의 경쟁자가 완전히 사라졌다.


하드웨어 아키텍처 측면에선 엔비디아 GPU의 강세가 이어졌다. 500대 슈퍼컴퓨터 가운데 가속기술을 활용한 장비가 110대다. 이 가운데 엔비디아 GPU 기반이 98대로 가장 많다. 인텔 제온파이가 7대였다.


톱500 순위에서 엔비디아 테슬라 GPU는 56%의 추가 연산성능을 제공했다. GPU가 성능기여에서 CPU를 처음으로 넘어섰다. 엔비디아에 따르면, 서밋 슈퍼컴퓨터의 피크성능인 187.7페타플롭스의 95%는 2만7천686개 GPU에서 비롯된 것이다.


톱500에 등재된 슈퍼컴퓨터의 성능 총합이 처음으로 1엑사플롭스를 돌파해 1.22엑사플롭스를 기록했다. 작년 11월 순위 발표 당시 총합 성능은 845페타플롭스였다.


세계 1위 슈퍼컴퓨터는 미국과 IBM에게 돌아갔지만, 슈퍼컴퓨터 제조업체 1위는 중국의 레노버였다. 레노버는 톱500에서 23.8%(122대)의 점유율을 기록했다. HPE가 15.8%(79대)로 2위였다. 중국 인스퍼가 13.6%(68대), 미국 크레이가 11.2%(56대) 등으로 뒤를 이었다. IBM은 1위인 서밋과 3위인 시에라를 만들었지만 전체 순위에서 19대만 제작했다.


프로세서별로 인텔 프로세서가 476개 시스템에 활용됐다. IBM 파워 프로세서는 13개 시스템에 채택됐다. 이는 작년 11월보다 1개 줄어든 것이다.


한국의 누리온은 11위를 차지해 한국 슈퍼컴퓨터 사상 최고 성적을 기록했다. 한국과학기술정보연구원(KISTI)이 구축한 슈퍼컴퓨터 5호기 '누리온'은 실측 성능 13.9페타플롭스를 기록했다. 기상청 슈퍼컴퓨터 '누리', '누리'는 각각 75위, 76위를 기록했다.

저작권자 © 파이낸셜포스트 무단전재 및 재배포 금지