엔비디아가 실시간 응답 시장인 '추론' 분야로 전선을 넓히며 하드웨어 패러다임 전환을 선포했다. 다만, 천문학적 전망치의 실현 가능성을 두고 시장의 계산기는 복잡해지고 있다.
엔비디아 젠슨 황 CEO는 16일(현지시간) 미국 산호세 GTC 2026에서 2027년까지 자사 제품이 공략 가능한 시장 규모(TAM)를 최소 1조 달러로 상향 조정한다고 밝혔다.
이번 발표는 단순 칩 판매를 넘어 CPU와 외부 설계 자산을 결합한 '통합 시스템' 공급자로의 체질 개선을 공식화한 지점이다.
엔비디아는 이날 추론 연산의 병목 현상을 해결할 '베라(Vera)' CPU와 '베라 루빈(Vera Rubin)' 시스템을 공개했다. 핵심은 170억 달러에 라이선스를 확보한 '그록(Groq)'의 기술력이다.
그록은 구글에서 AI 전용 칩인 TPU를 설계했던 조나단 로스가 2016년 설립한 반도체 기업이다. GPU 대신 LPU(Language Processing Unit)라는 독자 노선을 걸으며 대규모 언어모델(LLM)의 '추론' 속도를 극대화하는 칩을 양산하고 있다.
젠슨 황 CEO는 질문을 토큰으로 변환하는 '프리필(Prefill)' 단계는 베라 루빈이, 답변을 생성하는 '디코드(Decode)' 단계는 그록 기반 칩이 분담하는 이원화 체계를 제시했다. 추론 효율을 극대화해 구글과 아마존의 자체 칩 추격을 따돌리겠다는 복안이다.
시장은 엔비디아의 생태계 확장 능력에 높은 점수를 준다.
테크널리시스 리서치의 밥 오도넬 사장은 "엔비디아가 단일 칩 공급업체에서 수천 개의 장비가 결합된 인프라 시스템 기업으로 완전히 탈바꿈했다"고 평했다.
5조 달러 시가총액을 정당화하기 위한 공격적 로드맵이라는 평가도 따른다.
그러나 숫자를 뜯어보면 의문부호가 남는다.
지난 2월 발표한 2026년 전망치 5,000억 달러를 단 한 달 만에 두 배로 늘린 배경에는 '페인만(Feynman)' 아키텍처와 2028년 로드맵에 대한 과도한 자신감이 깔려 있다.
경쟁사들이 저가형 추론 칩으로 시장을 잠식하는 상황에서, 엔비디아가 제시한 고가의 통합 시스템이 데이터센터 운영사들의 비용 부담을 얼마나 상쇄할지는 미지수다.
나비효과는 가계 경제와 고용 시장까지 번질 전망이다.
엔비디아가 함께 선보인 자율형 AI 에이전트 '네모클로(NemoClaw)'는 인간의 개입 없이 업무를 수행한다.
기업들이 이 시스템을 대거 채택할 경우 데이터센터 수요는 폭증하며 엔비디아의 매출은 늘겠지만, 사무직 고용 시장은 피할 수 없는 구조조정 압력에 직면한다.
AI 인프라 비용 상승이 구독료 인상으로 이어져 가계의 디지털 지출 부담을 키우는 결과도 예견된다.
반도체 업계 관계자는 "엔비디아의 1조 달러 선언은 하드웨어와 소프트웨어의 완전한 결합을 전제로 한다"며 "그록 기술의 성공적인 이식 여부가 향후 2년의 성패를 가를 것"이라고 분석했다.