뉴럴 네트워크용 컴퓨팅 플랫폼

몇 년 전에 텐서 프로세스가 도입되면서 하이브리드 CPU를 포함해 새로운 차원의 실리콘 특화 아키텍처가 개발되었습니다. 현재 ARMIntel은 머신 러닝과 기타 인공 지능 형태에 맞게 설계한 신제품을 도입하고 있습니다.

2000년 중반에 영국계 캐나다인 연구자 Geoffrey Hinton(논리학자인 George Boole의 고손자)이 새로운 뉴럴 네트워크 계층을 효율적으로 교육하는 방법을 발견했는데, 이것은 컴퓨터 과학 사상 가장 중요한 발견 중 하나입니다.[1] Hilton의 이론은 현재 사용되고 있는 인공 지능 응용의 토대가 되는 머신 러닝(ML: machine learning)의 길을 닦았습니다.

뉴럴 네트워크에는 규모가 큰 기본 구성요소가 있어야 하는데 바로 컴퓨팅 능력과 데이터입니다.

AI에 뉴럴 네트워크를 사용하는 것에 관한 이론과 실험은 1950년대부터 존재했으나 실제 응용에 필요한 엄청난 양의 데이터와 처리 능력은 이번 세기가 되어서야 실현되었습니다.

현재 사용하고 있는 스마트폰의 처리 능력은 NASA에서 인간을 최초로 달에 보낼 때 사용했던 컴퓨터의 수백만 배입니다. 그리고 인터넷에서는 이미지, 텍스트, 비디오, 클릭 수, 트윗 등 모든 종류의 데이터를 매일 매초 수십억 단위씩 수집하고 있습니다.

ML과 AI에 새로운 능력을 부여하는 텐서 프로세서

기존 소프트웨어가 새로운 AI 알고리즘에 자리를 내주면서 컴퓨터 처리 기술에 대한 요구사항이 달라지고 있습니다. 머신 러닝은 복잡한 수학 모델을 바로 처리해야 하며, Intel과 ARM 같은 기업의 일반적인 프로세싱 코어는 이 용도로 설계되지 않았습니다.

다양한 부문에서 AI 수요가 늘고 ML이 성공하면서 차세대 AI 칩의 제작 경쟁이 시작되었습니다.

초기에는 NVIDIA가 비디오 게임용 하드웨어에 갖고 있는 전문 기술을 이용해 AI의 새로운 요구사항에 그래픽 처리 알고리즘을 활용하면서 이 공백을 채웠습니다. 2016년과 2018년 사이에 NVIDIA는 머신 러닝에서 암호 화폐 채굴까지 칩 시장의 모든 부문에서 활약을 보이며 그 주가가 10배나 올랐습니다.

그 동안 자사 칩을 제조하지 않았던 Microsoft 같은 기업들도 지금은 칩에 거액을 투자하고 있습니다. Intel도 이 경주에 합류했으며, 현재 Facebook과 함께 최초의 AI 특화 실리콘을 시범적으로 사용하고 있습니다.[2]

2016년에 Google은 텐서 처리장치(TPU: Tensor Processing Unit)라고 하는 “딥 러닝 추론”용 프로세서 아키텍처를 발표했습니다.[3] Google의 TPU는 처음부터 Google Maps와 스트리트 뷰 같은 매핑 애플리케이션의 정확도를 높이는 일을 맡았습니다.

Google은 2017년 5월과 2018년 5월에 2세대와 3세대 TPU를 발표했습니다. 2세대 디자인은 광역폭이 600GB/s까지 증가했고 성능은 45테라플롭까지 향상되었으며, 3세대는 성능이 2세대의 두 배로 향상되었습니다.

2018년 7월에 Google은 Edge TPU를 발표했는데 이것은 엣지 컴퓨팅용 ML 모델을 실행하도록 특별히 설계된 ASIC 칩입니다.[4]

현재 Nvidia와 기타 AI 칩 공급업체들은 TPU에 자체 기술을 함께 사용하여 자율 주행과 안면 인식 등의 다양한 애플리케이션을 처리할 수 있는 SoC를 생산합니다. Nvidia는 정해진 전력 소모량으로 강력한 성능을 발휘하는 뉴럴 네트워크가 필요한 비-모바일 기기용 ML 파워하우스인 Jetson도 판매합니다.[5]

최근에 Nvidia는 Grace[6](미국의 컴퓨터 프로그래밍 선구자인 Grace Hopper의 이름을 딴)를 발표했는데 Grace는 2023년에 초대형 슈퍼컴퓨터에 사용될 예정인 새로운 칩 디자인입니다. 주로 ARM 기술을 사용하는 이 새로운 아키텍처를 통해 현재의 칩 디자인으로는 어려운 복잡한 AI 컴퓨팅 작업을 실행할 수 있어 컴퓨터가 일반 인공 지능에 한 걸음 더 다가갈 것입니다.

새로운 뉴럴 네트워크 아키텍처를 개발한 ARM

Cortex 아키텍처로 유명한 ARM은 몇 년 전부터 새로운 뉴럴 처리장치(NPU: neural processing unit)인 Ethos NPU[7] 시리즈를 개발해왔습니다. Ethos 시리즈는 Cortex 코어를 사용해 작동하도록 설계되었습니다. 이 둘을 함께 사용하면 일반 NPU에 비해 성능과 출력 효율이 향상되어 비용 효과가 좋으면서 성능도 우수한 엣지 ML 제품을 개발할 수 있습니다.

ARM 기술은 저전력 용도에서 더 좋은 성능을 발휘한다는 장점이 있어, 사물 인터넷 시장을 겨냥하고 있습니다. 그 기술은 수백만 개의 커넥티드 디바이스에 사용되는 저전력 SoC에 통합하도록 설계되었습니다.

Ethos 프로세싱 코어는 클라우드에서 개발된 학습된 머신 러닝 알고리즘을 이용해 엣지에서 애플리케이션을 실행해 바로 결과를 얻을 수 있다는 장점이 있습니다. 이러한 코어는 원래 복잡한 ML 교육용으로 설계된 것은 아니지만 그 성능은 엣지 컴퓨팅 작업에서 규모가 더 큰 경쟁 제품과 동일하면서 비용과 전력 사용량은 적습니다.

예를 들어, ARM에 따르면 1GHz로 실행되는 Ethos-U65에 512-GOPS를 구현하면 MobileNet_v2 딥 뉴럴 네트워크를 실행할 때보다 3ms 이내에 개체를 인식할 수 있습니다.[8]

NXP Semiconductors는 현재 Ethos-U65 microNPU를 사용하여, NXP의 i.MX 제품군에 이미 있는 Cortex-M 코어와 온칩 SRAM과 함께 작동합니다.[9]

Computing Platforms Image 1

ARM은 Ethos U 시리즈 외에 Ethos N 시리즈도 설계하는데[10], 이것은 스마트폰, 차량 인포테인먼트, 디지털 TV 같은 일반 소비재를 겨냥한 것입니다. 현재 Ethos N 시리즈는 커넥티드 차량에 사용되어 액세스 제어, 운전자 경고, 음성 인식 등 안전 운전에 도움이 되는 새로운 지능형 기능을 제공합니다.

스마트폰에서 Ethos N 시리즈는 증강 현실, 가상 현실, ML 등의 기능으로 온보드 CPU의 처리 능력을 확대하기에 적합합니다.

차세대 AI 솔루션에 동력을 주는 양자 컴퓨팅

Google의 양자 하드웨어 담당 수석 과학자인 John Martinis는 “물리학자들이 30년 전부터 양자 컴퓨팅의 능력에 대해 이야기했지만 '이것에 투자할 만한 유용성이 있을지'가 항상 문제였습니다”라고 말했습니다.[11]

폭스바겐은 3년 이상 Google과 일하면서 자율 주행 차량의 필수 기술 중 하나인 뉴럴 네트워크 교육에 드는 시간을 단축하는 것을 포함해 다양한 부문에서 양자 컴퓨터를 사용하고 있습니다.[12]

폭스바겐의 CIO인 Martin Hofmann은 “고성능 컴퓨팅에 관한 요구사항이 많아지고 있습니다. 문제는 이를 개선할 방법이 있는가입니다”라고 말했습니다.

IBM에 따르면 “현재의 제한된 수의 양자 컴퓨터에 액세스하는 것으로도 이미 전 세계 연구자들이 이익을 얻고 있습니다. 전에는 불가능했던 자연 법칙의 작동 원리를 들여다보는 것은 물론 화학, 시뮬레이션, 최적화, 인공 지능 및 기타 분야에서 새로운 방식으로 문제에 접근하고 있습니다.” [13]

대부분의 응용 부문에서는 아직 양자 컴퓨팅의 능력을 실현할 수 없지만 실험에서 얻은 결과는 정말 대단합니다. 새로운 54큐비트 프로세서인 Google의 “Sycamore”[14]로 양자 우위 실험을 완료하는 데 200초 걸렸습니다. 세계에서 가장 빠른 슈퍼 컴퓨터는 비슷한 출력을 내는 데 10,000년이 걸릴 것입니다.

Computing Platforms Image 2-min

“Google Cloud 서버에서 Schrödinger–Feynman 알고리즘을 사용해 0.1%의 충실도로 m = 20의 작업을 수행할 경우 50조의 코어 시간이 걸리고 1페타와트-시의 에너지가 드는 것으로 추산됩니다.”[15]

인공 일반 지능을 향해

이러한 기술을 구현해 AI와 ML로 가능한 것보다 많은 일을 해냈습니다. 그리고 이것을 통해 AI 연구의 궁극적 목표로 여겨지는 인공 일반 지능(AGI: Artificial General Intelligence), 즉 스스로 생각하며 사람처럼 지적인 작업을 수행할 수 있는 기계를 곧 만들 수 있다고 생각하게 되었습니다.

Nvidia의 Grace와 Google의 Sycamore 같은 강력한 프로세서에 새로운 알고리즘과 방대한 양의 새로운 데이터가 결합되면서 세계는 새로운 AI 시대로 나아가고 있습니다.

newsletter 1


[1] http://www.cs.toronto.edu/~hinton/absps/cbpweb.pdf

[2] https://finance.yahoo.com/news/intel-working-facebook-ai-chip-013746099.html

[3] https://cloud.google.com/blog/products/gcp/google-supercharges-machine-learning-tasks-with-custom-chip

[4] https://coral.ai/docs/edgetpu/benchmarks/

[5] https://www.forbes.com/sites/patrickmoorhead/2017/03/15/nvidia-introduces-jetson-tx2-for-edge-machine-learning-with-high-quality-customers/

[6] https://nvidianews.nvidia.com/news/nvidia-announces-cpu-for-giant-ai-and-high-performance-computing-workloads

[7] https://www.arm.com/solutions/artificial-intelligence

[8] https://developer.arm.com/ip-products/processors/machine-learning/arm-ethos-u/ethos-u65

[9] https://www.nxp.com/company/blog/why-the-arm-ethos-u65-micronpu-is-a-big-deal-and-how-it-came-to-be-this-way:BL-ARM-ETHOS-U65-MICRONPU

[10] https://www.arm.com/products/silicon-ip-cpu/ethos/ethos-n57

[11] https://ai.googleblog.com/2019/10/quantum-supremacy-using-programmable.html

[12] https://blogs.wsj.com/cio/2017/11/07/vw-expands-its-quantum-computing-research-with-google/

[13] https://www.ibm.com/blogs/research/2021/04/quantum-accelerate-discoveries/

[14] "Sycamore 프로세서 - Wikipedia." https://en.wikipedia.org/wiki/Sycamore_processor. 

[15] Arute, F., Arya, K., Babbush, R. et al. Quantum supremacy using a programmable superconducting processor. Nature 574, 505–510 (2019). https://doi.org/10.1038/s41586-019-1666-5

최신 뉴스

Sorry, your filter selection returned no results.

개인정보 보호정책이 업데이트되었습니다. 잠시 시간을 내어 변경사항을 검토하시기 바랍니다. 동의를 클릭하면 Arrow Electronics 개인정보 보호정책 및 이용 조건에 동의하는 것입니다.

당사의 웹사이트에서는 사용자의 경험 향상과 사이트 개선을 위해 사용자의 기기에 쿠키를 저장합니다. 당사에서 사용하는 쿠키 및 쿠키 비활성화 방법에 대해 자세히 알아보십시오. 쿠키와 추적 기술은 마케팅 목적으로 사용될 수 있습니다. '동의'를 클릭하면 기기에 쿠키를 배치하고 추적 기술을 사용하는 데 동의하는 것입니다. 쿠키 및 추적 기술을 해제하는 방법에 대한 자세한 내용과 지침을 알아보려면 아래의 '자세히 알아보기'를 클릭하십시오. 쿠키 및 추적 기술 수락은 사용자의 자발적 선택이지만, 웹사이트가 제대로 작동하지 않을 수 있으며 사용자와 관련이 적은 광고가 표시될 수 있습니다. Arrow는 사용자의 개인정보를 존중합니다. 여기에서 당사의 개인정보 보호정책을 읽을 수 있습니다.