banner

소식

Mar 23, 2024

몇 가지 간단한 문의에 응답하여 세련된 에세이, 이메일 및 코드를 생성하는 ChatGPT의 역량은 국제적인 관심을 끌었습니다. MIT 연구원들은 ChatGPT를 담당하는 것보다 몇 배 더 뛰어난 기계 학습 프로그램의 길을 열 수 있는 잠재력을 가진 방법을 보고했습니다. 더욱이 그들의 기술은 오늘날의 기계 학습 모델을 지원하는 최첨단 슈퍼컴퓨터보다 더 적은 에너지를 소비할 수 있습니다.

연구팀은 수백 마이크론 규모의 레이저를 사용하여 전자가 아닌 빛의 움직임을 기반으로 계산을 수행하는 새로운 시스템의 첫 번째 실험 시연을 보고합니다. 새로운 시스템은 기계 학습을 위한 현재의 최첨단 디지털 컴퓨터보다 에너지 효율성이 100배 이상 높고 컴퓨팅 밀도가 25배 더 강력합니다.

게다가 그들은 “향후 개선을 위해 훨씬 더 많은 규모가 필요하다”고 언급했습니다. 과학자들은 이를 통해 “데이터 센터에서 분산형 엣지 장치에 이르기까지 기계 학습 작업을 가속화할 수 있는 대규모 광전자 프로세서의 길을 열어준다”고 덧붙였습니다. 미래에는 휴대폰과 같은 작은 장치가 대규모 데이터 센터에서만 계산할 수 있는 프로그램을 실행할 수 있게 될 수도 있습니다.

뇌의 정보 처리를 모방하는 대규모 기계 학습 모델은 ChatGPT를 지원하는 것과 같은 심층 신경망(DNN)의 기초입니다. 기계 학습이 확장되는 동안 오늘날의 DNN을 지원하는 디지털 기술은 정체 상태에 있습니다. 또한 에너지 수요가 매우 높기 때문에 매우 큰 데이터 센터에서만 발견되는 경우가 많습니다. 이는 컴퓨팅 아키텍처의 혁신을 주도하고 있습니다.

심층 신경망(DNN)의 등장으로 데이터 과학 분야가 진화하고 있습니다. 기존 컴퓨터 하드웨어의 기능에 부담을 주는 이러한 DNN의 기하급수적인 확장에 대응하여 ONN(광 신경망)은 최근 DNN 작업을 높은 클럭 속도로 병렬로 실행하고 데이터 손실을 최소화하도록 진화했습니다. 낮은 전기광학 변환 효율성, 거대한 장치 설치 공간 및 채널 혼선은 ONN의 낮은 컴퓨팅 밀도에 기여하는 반면, 인라인 비선형성이 부족하면 상당한 지연이 발생합니다. 연구원들은 이러한 모든 문제를 한 번에 해결할 수 있는 공간-시간 다중화 ONN 시스템을 실험적으로 보여주었습니다. 그들은 대량으로 만들어지고 우수한 전기광학 변환을 나타내는 마이크로미터 규모의 수직 공동 표면 방출 레이저(VCSEL) 배열을 사용하여 뉴런 인코딩을 사용합니다.

연구자들은 처음으로 이 세 가지 문제를 동시에 해결하는 작은 설계를 제공했습니다. 최신 LiDAR 원격 감지 및 레이저 인쇄는 모두 VCSEL(수직 표면 방출 레이저) 어레이를 기반으로 구축된 이 아키텍처를 사용합니다. 이러한 조치는 가까운 시일 내에 두 배 정도 개선될 것으로 보입니다. 광전자 프로세서는 중앙 집중식 및 분산형 인프라 전반에서 기계 학습 프로세스의 속도를 높일 수 있는 새로운 기회를 제공합니다.

확인해 보세요종이그리고블로그 . 이 연구에 대한 모든 공로는 이 프로젝트의 연구원에게 돌아갑니다. 또한, 가입하는 것을 잊지 마세요27,000개가 넘는 ML SubReddit,디스코드 채널, 그리고이메일 뉴스레터에서는 최신 AI 연구 뉴스, 멋진 AI 프로젝트 등을 공유합니다.

Dhanshree Shenwai는 컴퓨터 과학 엔지니어이며 AI 응용에 깊은 관심을 갖고 금융, 카드 및 결제, 은행 분야를 다루는 FinTech 회사에서 좋은 경험을 갖고 있습니다. 그녀는 모든 사람의 삶을 편리하게 만들어주는 오늘날의 진화하는 세계에서 새로운 기술과 발전을 탐구하는 데 열정을 갖고 있습니다.

종이블로그27,000개가 넘는 ML SubReddit디스코드 채널이메일 뉴스레터
공유하다