**Jaehoon Lee**
Technical Content Manager, Nota AI

엔비디아 행사 두 곳에 참석한 김태호 노타 CTO를 담은 현장 사진 두 장. 왼쪽은 아태지역 로보틱스 및 엣지 AI 파트너 데이의 패널 세션으로, 무대 화면에 세션명 'How Physical AI is Helping Transform Smart Spaces'와 패널 명단이 표시되고 그중에 노타의 김태호 CTO가 포함된다. 오른쪽은 코리아 파트너 나이트에서 젠슨 황 엔비디아 CEO와 참석자들이 함께한 장면이다. — 자료 1: 엔비디아 아태지역 로보틱스 및 엣지 AI 파트너 데이와 코리아 파트너 나이트에 참석한 김태호 노타 CTO 겸 공동창업자

전 세계 테크 기업들의 혁신 기술이 한자리에 모인 대만 컴퓨텍스 2026. 그중에서 차세대 AI의 미래 비전이 가장 뜨겁게 논의된 자리는 단연 '엔비디아 아태지역 로보틱스 및 엣지 AI 파트너 데이'였습니다. 각국의 대표적인 하드웨어 제조사와 AI 선도 기업들이 모여 치열한 기술 주도권을 겨룬 이 자리에서, 패널석에 한국 기업으로는 유일하게 노타의 이름이 올랐습니다.

노타의 김태호 CTO는 이곳에서 피지컬 AI(Physical AI)와 엣지 최적화를 주제로 글로벌 기업들과 깊이 있는 논의를 나눴습니다. 쟁쟁한 하드웨어·로보틱스 기업들 사이에서 모델 최적화를 전문으로 하는 노타가 나란히 설 수 있었던 배경에는, 기술의 화려함 뒤에 숨겨진 산업계의 공통된 고민이 자리 잡고 있습니다.

엔비디아의 청사진: 물리 세계로 진입한 피지컬 AI

최근 산업계의 가장 큰 화두는 단연 '피지컬 AI'입니다. AI 에이전트가 코딩과 사무 업무 등 소프트웨어 영역의 자동화를 이끈다면, 피지컬 AI는 AI가 챗봇과 화면을 넘어 공장, 도로, 도시, 로봇이라는 실제 물리 세계로 직접 들어가 인식하고 행동하는 패러다임의 전환을 의미합니다.

이러한 피지컬 AI 트렌드를 가장 선두에서 주도하고 있는 기업이 바로 엔비디아입니다. 젠슨 황 CEO는 지난 GTC 2026 기조연설에서 '로봇계의 챗GPT 모멘트(ChatGPT moment for robotics)'가 다가왔음을 선언했습니다. 더 나아가 최근 젠슨 황 CEO의 한국 내방 행보를 살펴보면, 그가 피지컬 AI 생태계 구축에 얼마나 공을 들이고 있는지 고스란히 드러납니다. 방한 중 노타를 비롯한 AI 및 로보틱스 분야의 주요 스타트업들과 간담회를 열어 심도 있는 논의를 나눌 예정이며, 현대차 및 두산로보틱스와 연이어 미팅을 진행하는 등 화면 속 '가상 모델'에 머물던 AI를 실제 '물리 하드웨어'와 결합하려는 엔비디아의 움직임이 뚜렷하게 관측되고 있습니다.

자료 2: 피규어 AI 휴머노이드가 컨베이어 위 택배를 집어 방향을 맞추는 라이브 시연 장면

최근 업계의 이목을 집중시킨 피규어 AI(Figure AI)의 휴머노이드 택배 분류 라이브 시연 역시 이러한 흐름 위에 있습니다. 시연에서 로봇은 컨베이어 벨트 위로 지나가는 택배 상자의 바코드 위치를 스스로 찾아 판독한 뒤, 바코드가 아래를 향하도록 정확히 방향을 맞춰 벨트 위에 되올려 놓았습니다. 개당 처리 주기는 약 3초로, 실제 사람 작업에 견줄 만한 속도를 보여줬습니다.

이 시연이 진정으로 놀라운 이유는 눈으로 보이는 자연스러운 움직임 그 너머에 있습니다. 그동안 수많은 로봇 시연이 뒤에서 사람이 조종하는 원격 제어 방식이거나 고성능 클라우드 서버의 연산에 의존했던 반면, 피규어 AI는 외부 네트워크 연결 없이 오직 로봇 자체에 탑재된 프로세서만으로 복잡한 시각 정보를 실시간으로 처리하고 다음 행동을 독자적으로 제어해 냈기 때문입니다.

엣지 AI가 필수적인 이유: 클라우드 컴퓨팅의 4가지 한계

피규어 AI의 로봇이 외부 네트워크의 도움 없이 독립적인 자율 제어 구조 안에서 움직여야 했던 이유는 분명합니다. 수천 대의 로봇과 카메라가 깔린 실제 양산 현장에서 피지컬 AI가 클라우드에 의존할 경우, 산업 현장은 즉각적으로 네 가지 거대한 벽에 부딪히게 되기 때문입니다.

속도와 실시간성: 현장에서의 판단은 밀리초 단위로 일어납니다. 카메라로 인식한 결과를 클라우드로 보냈다가 다시 받아오는 왕복 지연 시간은 실시간 제어에 너무 길며, 로보틱스 환경에서는 단 0.1초의 판단 지연조차 대형 사고로 직결될 수 있습니다.
네트워크 단절 리스크: 속도의 지연만큼 치명적인 것이 통신 장애입니다. 공장 한복판이나 도로 위에서 네트워크가 일시적으로라도 끊길 경우, 로봇과 기기가 그 자리에 멈춰 서거나 제어 불능 상태에 빠지게 됩니다. 외부 연결에 의존하는 구조 자체가 현장의 안전에 거대한 위협이 됩니다.
비용과 대역폭: 공장이나 도시에 설치된 수많은 카메라와 센서가 만들어내는 고해상도 데이터를 24시간 클라우드로 올리게 되면, 막대한 통신 대역폭과 클라우드 서버 비용이 발생해 비즈니스의 수익성을 크게 훼손합니다.
보안과 규제 리스크: 공장 내부의 핵심 공정이나 사람의 얼굴이 담긴 민감한 데이터가 외부 네트워크로 나가는 것 자체가 거대한 보안 리스크입니다.

이러한 이유로 피지컬 AI는 데이터가 생성되는 그 자리, '엣지' 내부 구동이 필수적입니다. 그러나 AI 지능을 엣지로 내리는 바로 그 순간, 산업계는 더 거대한 기술적 장벽과 마주합니다.

피지컬 AI 상용화의 장벽: 거대 모델과 엣지 하드웨어의 충돌

”과거의 컴퓨터 비전 기술로는 충분히 풀리지 않던 문제를, 이제 비전 언어 모델(VLM)로 풀고 있습니다. 특히 비전 언어 모델은 기존 비전 모델보다 똑똑하면서도 데이터 의존도가 낮아 현장을 넓혀 가기가 한결 수월합니다. 다만 똑똑한 모델일수록 무겁습니다. 작은 디바이스 위에서 그 모델을 돌리려면, 결국 최적화가 관건입니다. 넷츠프레소는 이러한 최적화를 지속적으로 수행해 온 플랫폼입니다."

김태호, 노타 CTO (패널 참석 발언 中)

향후 피지컬 AI는 단순한 택배 분류를 넘어, 인간의 한계를 뛰어넘는 고난도의 물리적 임무까지 수행해 내는 것을 목표로 합니다. 이를 구현하기 위해서는 모델이 시각적으로 이해하고 판단해야 할 변수가 기하급수적으로 늘어나며, 이에 비례하여 AI 모델의 크기 역시 거대해질 수밖에 없습니다.

실제로 피지컬 AI를 작동시키는 핵심인 VLA(Vision-Language-Action) 모델은 비전 인코더, 대규모 언어 모델(LLM), 액션 헤드가 순차적으로 연결되어 수십억에서 수백억 개 이상의 매개변수를 요구할 정도로 그 규모가 방대합니다.

문제는 이렇게 팽창하는 거대 모델을 전력, 메모리, 연산 능력이 극도로 제한된 엣지 하드웨어 환경에서 실시간으로 구동해야 한다는 점입니다. 이것이 바로 피지컬 AI가 직면한 본질적인 장벽입니다.

산업계에서는 무거운 모델을 작은 엣지 디바이스에 탑재하기 위해 양자화 같은 압축 기법을 흔히 시도합니다. 그러나 이러한 단순 압축은 현장의 요구사항을 충족하기 어렵습니다. 양자화 과정에서 연산 데이터의 정밀도를 강제로 낮추다 보면 미세한 정보 손실이 필연적으로 발생하기 때문입니다. 비록 초기 계산 과정에서는 아주 작은 오차에 불과할지라도, 이것이 여러 단계를 거치며 연쇄적으로 누적되어 결국 로봇의 최종 행동 정확도를 완전히 무너뜨리는 치명적인 결과로 이어질 위험이 있습니다.

하드웨어 맞춤형 AI 모델 최적화: 피지컬 AI 배포를 위한 핵심 열쇠

무거운 모델과 제한된 하드웨어 사이의 간극을 메우는 것이 바로 노타가 제공하는 '환경 맞춤형 엣지 최적화' 역량입니다. 노타의 넷츠프레소 플랫폼은 타깃 하드웨어의 특성과 모델 구조를 함께 분석해 최적의 구동 조합을 찾아냅니다. 최근 EVS 2026에서 산업 관계자들의 이목을 집중시킨 퀄컴(Qualcomm) IQ-9075 보드 기반 SmolVLA 모델 구동 시연이 그 대표적인 사례입니다.

핵심은 모델을 무작정 압축하지 않았다는 점입니다. 노타는 오차 전파에 민감한 앞단(비전 인코더와 대규모 언어 모델)의 가중치는 온전히 보존하고, 마지막 단계인 액션 헤드의 추론 과정만 선별적으로 효율화했습니다. 그 결과 작업 성공률은 사실상 원본과 동일하게 유지하면서도, 액션 헤드의 지연 시간(latency)을 218ms에서 31ms로 약 187ms 단축해 전체 추론 속도를 1.63배 끌어올렸습니다.

액션 헤드 추론과 전체 추론을 각각 원본과 노타 최적화로 비교하는 세로 막대 그래프 두 개(퀄컴 IQ-9075, FP16, 낮을수록 좋음). 액션 헤드 추론은 원본 218 ms에서 노타 최적화 31 ms로 약 7배 단축되고, 전체 추론은 원본 505 ms에서 노타 최적화 310 ms로 1.63배 빨라진다. — 자료 3: 액션 헤드 추론과 전체 추론의 원본·노타 최적화 비교 (퀄컴 IQ-9075, FP16)

이러한 추론 시간 단축은 곧 현장 생산성으로 이어집니다. AI가 '다음 동작을 결정하는 데 쓰는 시간'이 그만큼 줄어든다는 의미이기 때문입니다. 개별 동작에서는 찰나의 차이처럼 보이지만, 앞서 본 휴머노이드의 택배 분류처럼 동일한 작업이 24시간 끊임없이 반복되는 양산 현장에서는 이야기가 달라집니다. 이런 미세한 지연이 쌓이느냐 걷히느냐가 곧 하루 총처리량의 격차로 직결되기 때문입니다.

이러한 노타의 기술적 유연성은 다양한 타깃 하드웨어를 대상으로 수행해 온 실질적인 배포 프로젝트들로 확인됩니다. 실제로 퀄컴뿐만 아니라 삼성전자 차세대 모바일 AP '엑시노스 2600'에 AI 최적화 기술을 공급하고, 퓨리오사AI의 2세대 신경망 처리 장치(NPU) 'RNGD'의 추론 성능 최적화 플랫폼을 구축한 레퍼런스를 보유하고 있습니다. 이처럼 모바일 및 차량용 AP부터 로봇 제어 보드에 이르기까지, 각기 다른 엣지 하드웨어의 연산 구조와 제약 조건에 맞춰 최적의 구동 성능을 확보하는 것이 노타가 가진 핵심 경쟁력입니다.

마무리: 피지컬 AI 시대, 경쟁의 축은 '배포'로 이동한다

"노타는 누구보다 빠르게 AI를 실제 현장에 적용해 왔습니다. AI 시대의 경쟁력은 결국 현장에서 성능과 비용을 동시에 만족시키며 고객 가치를 증명하고, 이를 지속적으로 확장해 나가는 데 있습니다. 노타는 이러한 과정을 꾸준히 실현해 온 기업입니다."

김태호, 노타 CTO (패널 참석 발언 中)

AI 산업의 경쟁 축은 이미 옮겨가고 있습니다. '누가 더 거대하고 똑똑한 모델을 만드느냐'의 질문은, '누가 그 모델을 전력도 메모리도 빠듯한 실제 현장에서 끝까지 구동해 내느냐'로 바뀌고 있습니다.

피지컬 AI가 확산될수록 이 과제는 더욱 무거워질 것입니다. 공장의 로봇 한 대, 도시의 카메라 한 대가 늘어날 때마다 무거운 모델을 작은 자리에 욱여넣어야 하는 병목 현상도 함께 늘어나기 때문입니다. 아무리 뛰어난 AI 모델이라도 현장의 칩 위에서 실시간으로 돌지 못한다면, 결국 잘 짜인 시연 영상 속에만 머물게 됩니다. 엔비디아가 아태 파트너 데이의 핵심 패널로 노타를 초청한 이유 역시 여기에 있습니다.

클라우드의 한계 앞에서 멈췄던 프로젝트, 무거운 모델 탓에 현장 도입을 주저했던 산업계의 오랜 고민. 노타는 그 간극을 메우는 최적화 기술로, 피지컬 AI가 연구실의 데모를 넘어 현실 산업에 안착하기 위한 '마지막 퍼즐'을 맞춰가고 있습니다.

노타 AI의 최신 인사이트, 이제 LinkedIn에서도 만나보세요. 엣지 AI 트렌드부터 기술 업데이트까지 — Edge Insights 뉴스레터를 구독하고 가장 먼저 받아보세요. 👉 구독하기

노타는 왜 엔비디아 아태 파트너데이 ‘한국 유일’ 패널이 되었나: 피지컬 AI의 마지막 퍼즐

엔비디아의 청사진: 물리 세계로 진입한 피지컬 AI

엣지 AI가 필수적인 이유: 클라우드 컴퓨팅의 4가지 한계

피지컬 AI 상용화의 장벽: 거대 모델과 엣지 하드웨어의 충돌

하드웨어 맞춤형 AI 모델 최적화: 피지컬 AI 배포를 위한 핵심 열쇠

마무리: 피지컬 AI 시대, 경쟁의 축은 '배포'로 이동한다

모델 설계부터 최적화까지: 풀스택으로 해결한 Jetson Orin NX 저조도 400 ms → 28 ms