토론토의 Taalas, 모델을 실리콘에 직접 내장하는 하드와이어드 AI 칩 공개
뉴스 요약
토론토 기반 AI 칩 스타트업 Taalas가 목요일, 2026년 2월 19일(EST 오전 11시 02분)에 베일을 벗고 데뷔 제품을 공개했습니다. 이 회사는 1억 6,900만 달러의 펀딩 라운드를 발표하고 첫 번째 하드와이어드 AI 칩인 HC1을 출시했습니다.
엔비디아의 AI 지배력에 도전하는 새로운 경쟁자
토론토 기반 AI 칩 스타트업 Taalas가 목요일(EST)에 획기적인 첫 제품의 베일을 공식적으로 벗고, 1억 6,900만 달러의 펀딩 라운드를 발표하는 동시에 Meta의 오픈 소스 Llama 3.1 8B 언어 모델을 실행하기 위해 특별히 제작된 혁신적인 "하드와이어드" AI 프로세서인 HC1을 공개했습니다. 이번 공개로 Taalas의 총 외부 자금 조달액은 약 2억 1,900만 달러에 달하며, 투자자로는 Quiet Capital, Fidelity, 그리고 베테랑 반도체 투자자 Pierre Lamond가 참여했습니다.
이번 발표는 엔비디아가 AI 추론 경쟁사인 Groq로부터 지적 재산권을 라이선스하는 200억 달러 규모의 랜드마크 계약을 마무리한 지 불과 몇 주 만에 이루어졌으며, 이는 전문 AI 실리콘 스타트업에 대한 투자자들의 열정을 다시 불러일으켰습니다.
HC1 칩: 실리콘에 지능을 하드와이어링
Taalas 기술의 핵심은 AI 모델이 하드웨어에서 실행되는 방식에 대한 근본적인 재고입니다. AI 컴퓨팅의 주력인 기존 GPU는 연산과 메모리를 물리적으로 분리하는 "명령어 집합 아키텍처"(ISA)에 의존합니다. 대규모 언어 모델이 쿼리를 처리할 때마다 칩은 모델 가중치를 고대역폭 메모리(HBM)에서 처리 코어로 반복적으로 이동시켜야 합니다. Taalas는 이를 "메모리 벽"이라고 부르며, 이 데이터 이동 비용이 최신 AI 데이터 센터의 **전력 소비의 거의 90%**를 차지한다고 추정합니다.
Taalas의 해결책은 메모리 가져오기 주기를 완전히 제거하는 것입니다. Taalas는 칩 위에서 모델을 실행하는 대신, 사실상 모델을 칩 안으로 구워냅니다. 즉, AI 모델의 가중치와 아키텍처를 실리콘의 금속 레이어에 직접 물리적으로 인쇄합니다. 그 결과 모델 자체가 하드웨어가 되는 프로세서가 탄생합니다.
TSMC의 6나노미터(N6) 공정 노드로 제작된 HC1은 Llama 3.1 8B에만 최적화되어 있습니다. Taalas에 따르면, 이 칩은 사용자당 초당 17,000개 이상의 출력 토큰을 달성하며, 이는 엔비디아의 주력 H200 GPU보다 약 73배 빠르면서도 전력 소비는 10분의 1에 불과합니다. 또한, 이 칩은 엔비디아, Groq, SambaNova, Cerebras의 유사한 솔루션보다 제작 비용이 20배 저렴하다고 주장합니다.
두 달 만에 가중치에서 실리콘으로
Taalas의 가장 설득력 있는 기술적 주장 중 하나는 생산 속도입니다. 전통적인 맞춤형 AI 칩 개발은 6개월 이상 걸릴 수 있습니다. 반면 Taalas는 TSMC와의 파트너십을 통해 약 두 달 만에 모든 AI 모델의 가중치를 배포 가능한 실리콘으로 변환할 수 있다고 말합니다.
비결은 설계 경제성에 있습니다. 각 모델에 대해 전체 칩을 재설계하는 대신, Taalas는 칩을 구성하는 약 100개의 금속 레이어 중 단 두 개만 수정합니다. 이는 제작 시간과 비용을 대폭 줄여, 이전에 맞춤형 하드웨어를 감당할 수 없었던 조직도 맞춤형 AI 실리콘에 접근할 수 있게 합니다.
이러한 빠른 반복은 Taalas가 "계절별" 하드웨어 주기를 가능하게 합니다. 즉, 회사는 봄에 최첨단 모델을 미세 조정하고 여름까지 수천 개의 전문 추론 칩을 배포할 수 있습니다.
적은 팀, 대담한 비전
Taalas 이야기에서 가장 놀라운 측면은 효율성일 것입니다. HC1은 24명의 엔지니어로 구성된 팀이 총 3000만 달러의 개발 비용으로 시장에 출시되었습니다. 이는 맞춤형 실리콘 벤처에 일반적으로 필요한 수억 달러의 극히 일부입니다.
이 회사는 AI 칩 회사 Tenstorrent의 공동 창립자이자 AMD 및 Nvidia의 전 아키텍트였던 Ljubisa Bajic와 엔지니어 Drago Ignjatovic, Lejla Bajic가 2023년 8월에 설립했습니다. Taalas는 이후 AMD, Apple, Google, Nvidia, Tenstorrent 출신의 인재를 영입하며 25명의 직원으로 성장했습니다. 가장 최근에는 Google Cloud의 AI 인프라 제품 관리 이사로서 GPU 및 TPU 하드웨어를 감독했던 Paresh Kharya가 제품 부사장으로 합류했습니다.
로드맵: HC2 및 그 이상
Taalas는 Llama 3.1 8B에서 멈추지 않습니다. 이 회사는 이미 200억 개의 매개변수를 가진 Llama 3.1 모델을 대상으로 하는 HC2 칩을 개발 중입니다. 연말까지 Taalas는 GPT-5.2와 같은 최첨단 프론티어 모델을 실행할 수 있는 칩을 생산하는 것을 목표로 합니다. 또한, 이 회사는 30개의 HC1 칩 클러스터 기반 구성을 사용하여 사용자당 초당 12,000개의 토큰으로 DeepSeek의 R1 모델을 실행하는 것을 시연했습니다.
HC1은 현재 챗봇 데모와 추론 API 서비스로 모두 제공되며, 2026년 전반에 걸쳐 더 광범위한 상업적 배포가 예상됩니다.
시장 맥락: 추론 시대의 시작
Taalas의 등장은 AI 하드웨어 전략의 광범위한 변화를 시사합니다. 업계가 GPU 유연성이 가장 중요한 훈련 단계에서 추론 배포 단계로 전환함에 따라, 토큰당 비용이 지배적인 지표가 되었습니다. Taalas의 접근 방식이 확장 가능함이 입증된다면, AI 컴퓨팅 시장은 두 계층으로 양분될 수 있습니다. Nvidia와 AMD가 주도하는 범용 훈련과 Taalas와 같은 모델별 실리콘 파운드리가 주도하는 전문 추론입니다.
총 2억 1,900만 달러의 자금 조달, 작동하는 첫 칩, 야심찬 로드맵을 통해 Taalas는 AI 하드웨어의 현 상태에 대한 가장 신뢰할 수 있는 도전 과제 중 하나로 자리매김했으며, 업계는 이를 면밀히 주시하고 있습니다.