AI 하드웨어, 그리고 더 높은 연산 능력을 위한 전쟁

  • 원문 : AI Hardward and the Battle for More Computational Power. (링크)

  • 저자 : Sciforce

    (원작자의 허락을 받아 번역하였습니다.)

_images/ai-hardware-00.png

우리는 인공지능과 그 알고리즘, 접근 방식, 기술에 대해 여러 글을 작성하고 있습니다. 소프트웨어 개발 회사로서, 우리의 프로젝트에 빠르게 적용할 수 있는 이러한 혁신에 많은 관심을 가지고 있습니다. 인공지능은 기적을 수행하는 스마트한 프로그램이기도 하지만, 많은 경우에 이 프로그램을 포함하는 물리적 장치에 의존합니다. 신체가 없는 로봇이 그런 것처럼, AI 소프트웨어는 생산적이기 위해서는 종종 껍질을 필요로 합니다. 이 포스트에서, 우리는 AI 하드웨어가 무엇을 의미하는지 살펴봅니다.

AI 시스템이 더욱 정교해지면서, 하드웨어로부터 더욱 높은 연산 능력을 필요로 합니다. 그 요구에 대응하기 위해서, AI를 위해 특별히 설계된 새로운 하드웨어가 뉴럴 네트워크의 훈련과 성능을 가속하고, 파워 소모를 감소시키는 역할을 하게 됩니다. 로직 게이트의 크기를 줄이고 더 많은 트랜지스터를 사용하는 것이 전통적인 솔루션이었지만 로직 게이트를 5 nm (5×10 -9 m) 아래로 줄이게 되면 양자 터널링 현상에 의해 칩이 오작동 할 수 있습니다. 그래서 이제 새로운 방법을 찾는 도전이 필요합니다.


AI 하드웨어란?

먼저, AI 하드웨어가 무엇이고, 우리가 사용하는 일반적인 하드웨어와 어떻게 다를까요. 근본적으로, 우리가 AI 하드웨어에 대해 말할 때, 어떤 종류의 AI 가속기, 즉 기계학습, 뉴럴 네트워크, 컴퓨터 비전 등과 같은 AI 어플리케이션의 빠른 처리를 위해 설계된 마이크로프로세서 또는 마이크로칩을 의미합니다. 그것들은 보통 여러 개의 코어로 설계되며, 낮은 정확도의 연산, 새로운 데이터 처리 구조, 그리고 인-메모리 컴퓨팅 (in-memory computing) 능력에 중점을 둡니다.

AI 가속기의 기본 아이디어는 AI 작업의 많은 부분이 대량으로 병렬화될 수 있다는 것입니다. 예를 들어, 범용 GPU (general purpose GPU)가 있다면, 매우 병렬적인 계산 작업에 그래픽 카드를 사용해서 CPU 성능의 10배까지 향상시킬 수 있습니다.

AI 가속기의 두번째 특징은 멀티코어 구현에 있습니다. 보통 픽셀을 스크린으로 보내는데 사용하는 여러 개의 단순한 코어의 작업을 가속하는 GPU를 생각해보세요. 이러한 코어들은 AI에서 흔하며, 숫자가 너무 많아지면 전통적인 연산 방식에서 할 수 없는 단순한 산술 연산을 위해 설계됩니다. 특정 목적을 가지고 설계된 ASICs (application-specific integrated circuits)가 있다면, GPGPU보다 더 높은 효율성을 구현할 수 있고, 에지 AI 작업에 도움이 됩니다.

일반적으로, 특정 목적으로 만들어진 가속기는 주어진 작업을 수행하는데 있어 뛰어난 성능과 파워 효율, 그리고 다양한 기능을 보여줍니다.


AI 하드웨어의 새롭고 중요한 능력


_images/ai-hardware-01.png

최신의 소프트웨어를 처리하기 위한 연산 자원에 대한 요구가 기하급수적으로 증가하면서, 산업에서는 새로운 능력을 가진 새로운 시대의 AI 칩을 기다리고 있습니다.

더 큰 연산 능력과 비용 효율 : 새로운 시대의 AI 하드웨어 솔루션은 복잡한 훈련 모델의 요구를 만족하기 위해 더 강력하면서도 비용 효율적이어야 합니다.

클라우드와 에지 컴퓨팅 : 클라우드에서 훈련 모델을 사용하는 딥러닝, 뉴럴 네트워크 그리고 컴퓨터 비전 알고리즘을 지원하기 위해서, 그리고 에지에서 유비쿼터스 AI를 제공하기 위해 새로운 실리콘 아키텍처가 적용되어야 합니다.

빠른 통찰력 : 비지니스에 유용하려면, AI 솔루션은 (소프트웨어와 하드웨어 모두) 고객의 행동과 선호에 대해 더 빠른 통찰력을 제공해야 합니다. 그것들이 판매와 고객 만족을 향상시키고, 제조 과정과 가동시간을 업그레이드하며, 비용을 줄일 수 있기 때문입니다.

새로운 물질들 : 전통적인 실리콘으로부터 광학 컴퓨팅 칩으로의 변화를 위해, 전통적인 CPU 또는 GPU 보다 훨씬 빠른 광학 시스템을 개발하는 연구가 이루어지고 있습니다.

새로운 아키텍처 : 뇌신경세포를 모방하려는 뉴로모픽 칩 (neuromorphic chip)과 같은 새로운 종류의 아키텍처가 있습니다. 뉴런이 상호연결된 이 아키텍처는 낮은 전력을 사용하는 신호들로 폰 노이만 (von-Neumann) 보틀넥을 대체할 수 있습니다. 만약 에지에서 또는 클라우드에서 뉴럴 네트워크를 훈련시키고자 한다면, 이러한 아키텍처가 큰 이점을 제공할 수 있습니다.


AI 하드웨어 업체를 선택하는 방법

물론 AI 하드웨어를 구입하기 전에, 다양한 하드웨어가 어떻게 다양한 요구 사항을 충족시키는지 이해해야 합니다. 요즘 특정 목적을 위해 칩이 만들어지는 추세에서 당신은 필요하지 않은 하드웨어에 많은 돈을 쓰고 싶어하지 않을 것입니다.

AI 하드웨어를 선택하는 첫번째 스텝은 고객과 또는 공급자와의 상호작용에 있어서 개선 사항들이 어떻게 비지니스에 영향을 미치는지 세심하게 살펴보는 것입니다. 그 후에, 이러한 변화를 지원하는 소프트웨어 솔루션과 그에 맞는 적합한 하드웨어를 기대할 수 있습니다.

GPU와 같은 범용칩, TPU, VPU와 같은 더 전문화된 솔루션 중에서 결정하거나, 또는 유망한 스타트업이 제공하는 더 혁신적인 디자인을 기대하는 것은 비지니스가 필요로 하는 AI 작업에 달려있습니다.


Top 5 AI 하드웨어 솔루션


_images/ai-hardware-02.png

AI 하드웨어의 아키텍처로 대부분 GPU가 사용되고 있다고 생각할 수도 있지만, 그렇지 않습니다. 지난 수십 년간, 여러 스타트업과 이름있는 칩 벤더들이 AI 작업에 최적화된 하드웨어 아키텍처의 새로운 시대를 열어 왔습니다.

현재 AI 가속을 위해 가장 인기 있는 하드웨어 솔루션은 다음과 같습니다.


Tensor Processing Unit 은 클라우드 솔루션을 특징으로 하며 특히 뉴럴 네트워크 기계학 습을 위해 구글이 개발한 AI 가속기 ASIC입니다.

Nervana Neural Network Processor-I 1000 은 인텔이 제작하는 이산 가속기 (discrete accelerator)로서, 복잡도와 스케일이 점점 증가하고 있는 추론 분야 (inference application)를 위해 특별히 설계되었습니다.

EyeQ 는 Mobileye가 설계한 시스템-온-칩 (SoC) 제품군으로서, 낮은 전력을 소모하면서 복잡하고 강도 높은 계산을 요구하는 영상 처리를 지원합니다.

Epiphany V 는 1,024개 코어 프로세서를 갖는 Adapteva의 칩입니다. 실시간 이미지 처리, 자율 주행 그리고 기계학습을 목표로 합니다.

Myriad 2 는 Movidus의 영상 처리 유닛 (VPU) 시스템-온-칩 (SoC)입니다. 계산 카메라(computational camera)에 전력을 공급하기 위해 프로그래밍 가능한 프로세서의 세트와 특정 목적을 위한, 설정 변경 가능한 이미지 영상 가속기로 구성됩니다.


더욱 유망한 스타트업들


_images/ai-hardware-03.png

이름있는 반도체 회사들 이외에도, 특정 목적의 칩을 만들거나 혹은 슈퍼컴퓨터를 구성하는 새로운 아키텍처를 개발하는 많은 투자가 이루어진 스타트업들이 많습니다.

Graphcore 는 프로세서 안에서 완성된 기계학습 모델을 갖는 IPU (Intelligent Processing Unit)를 개발하는 반도체 회사입니다. IPU는 대량 병렬처리 그리고 낮은 정확도의 부동소수점 연산을 강조하고, 높은 연산 밀도를 제공하기 때문에 복잡한 고차원 모델에서도 동작하도록 설계되었습니다.

Wave Computing 은 매우 혁신적인 대량 병렬 데이터플로우 아키텍처를 적용한 Wave DPU (the Wave Dataflow Processing Unit)를 개발하고 있습니다. Wave의 DPU 기반 솔루션을 도입하면, 세계에서 가장 빠르며 가장 에너지 효율적인 딥러닝 컴퓨터 제품군이 될 수 있다고 주장합니다.

Luminous Computing 는 단일칩에서 AI를 위한 슈퍼컴퓨터를 개발하며, 이는 3000개의 TPU 보드를 대체할 것입니다. 이 회사의 아이디어는 전통적인 프로세서가 극복해야하는 모든 주요한 보틀넥 문제를 해결하기 위해 포토닉스 (photonics)를 사용하는 것입니다.

Mythic 는 종래의 디지털 아키텍처, 메모리, 연산 요소들을 뛰어넘는 IPU의 버전을 개발합니다. 트랜지스터, 물리, 회로와 시스템, 그리고 소프트웨어와 AI 알고리즘까지 모든 것을 다시 생각하고 있습니다.

Prophesee 는 칩 생산자들과 약간 다르게 모든 인공 시각 분야를 위한 혁신적인 컴퓨터 비전 센서와 시스템에 초점을 맞추고 있습니다. 이 회사의 센서 기술은 생물학적 안구에서 영감을 받아서, 효율적인 방식으로 시각 정보를 얻고 처리합니다.


AI 하드웨어 시장이 빠르게 진화하고 있지만, 컴퓨팅, 스토리지, 네트워킹이라는 하드웨어 인프라 구조의 주요 세 부분 중에서 최근 몇 년간은 컴퓨팅에만 초점을 맞추고 진전이 있어 왔습니다.

업계는 가장 빠르게 선택 가능한 옵션을 선택하고, 이를 딥러닝 솔루션으로 홍보하고 있습니다. 나머지 두 분야인 스토리지와 네트워킹은 여전히 가까운 미래를 기다려 볼 일입니다.