多倫多的 Taalas 揭露一款將模型直接燒錄到晶片中的硬體線路AI晶片

February 24, 2026
Taalas
6 min

新聞摘要

多倫多人工智能晶片初創公司 Taalas 於 2026 年 2 月 19 日星期四(美國東部時間上午 11:02)正式從隱匿狀態中脫穎而出,並發布了其首款產品,宣布獲得 1.69 億美元的融資,並推出了其首款硬體式人工智能晶片 HC1。

英偉達人工智能主導地位的新挑戰者

多倫多人工智能晶片初創公司 Taalas 於週四(美國東部時間)正式揭開了其開創性首款產品的面紗,宣布獲得 1.69 億美元的融資,同時推出了 HC1 — 一款革命性的「硬體式」人工智能處理器,專為運行 Meta 的開源 Llama 3.1 8B 語言模型而設計。此次披露使 Taalas 的總外部融資達到約 2.19 億美元,投資者包括 Quiet Capital、Fidelity 和資深半導體投資者 Pierre Lamond。

此公告在人工智能硬體界引起了漣漪,距離英偉達最終確定與人工智能推理競爭對手 Groq 達成 200 億美元的知識產權授權協議僅幾週時間——此舉重新點燃了投資者對專用人工智能矽初創公司的熱情。


HC1 晶片:將智能硬體化到矽中

Taalas 技術的核心是對人工智能模型如何在硬體上運行進行了根本性的重新思考。傳統的 GPU — 人工智能計算的主力軍 — 依賴於「指令集架構」(ISA),該架構在物理上將計算與記憶體分開。每次大型語言模型處理查詢時,晶片都必須將模型權重從高頻寬記憶體 (HBM) 反覆傳輸到處理核心。Taalas 將此稱為「記憶體牆」,並估計這種數據移動開銷佔現代人工智能數據中心近 90% 的功耗

Taalas 的解決方案是完全消除記憶體提取週期。Taalas 並非在晶片上運行模型,而是有效地將模型「烘焙」到晶片中 — 將人工智能模型的權重和架構直接物理地印製到矽的金屬層中。結果是產生了一個模型本身成為硬體的處理器。

HC1 由台積電在其 6 奈米 (N6) 製程節點上製造,專門針對 Llama 3.1 8B 進行了優化。據 Taalas 稱,它實現了每秒每位用戶超過 17,000 個輸出 token — 比英偉達的旗艦 H200 GPU 快約 73 倍 — 同時僅消耗十分之一的功耗。該公司還聲稱,該晶片的製造成本比英偉達、Groq、SambaNova 和 Cerebras 的同類解決方案低 20 倍


從權重到矽,僅需兩個月

Taalas 最引人注目的技術聲明之一是生產速度。傳統的定制人工智能晶片開發可能需要六個月或更長時間。相比之下,Taalas 表示,與台積電合作,它可以在大約兩個月內將任何人工智能模型的權重轉化為可部署的矽。

秘訣在於設計經濟性:Taalas 並非為每個模型重新設計整個晶片,而是僅修改組成晶片的大約 100 個金屬層中的兩個。這大大縮短了製造時間和成本,使得以前無法負擔專用硬體的組織也能夠獲得定制人工智能矽。

這種快速迭代實現了 Taalas 所描述的「季節性」硬體週期 — 一家公司可以在春季微調一個前沿模型,並在夏季部署數千個專用推理晶片。


精簡的團隊,大膽的願景

也許 Taalas 故事中最引人注目的方面是其效率。HC1 由僅 24 名工程師組成的團隊以總計 3000 萬美元的開發成本推向市場 — 這僅是定制矽項目通常所需的數億美元的一小部分。

該公司由人工智能晶片公司 Tenstorrent 的聯合創始人、前 AMD 和英偉達架構師 Ljubisa Bajic 以及工程師 Drago IgnjatovicLejla Bajic 於 2023 年 8 月創立。此後,Taalas 已發展到 25 名員工,吸引了來自 AMD、Apple、Google、Nvidia 和 Tenstorrent 的人才。最近,Paresh Kharya — 前 Google Cloud 人工智能基礎設施產品管理總監,負責 GPU 和 TPU 硬體 — 加入公司擔任產品副總裁。


路線圖:HC2 及以後

Taalas 並不止步於 Llama 3.1 8B。該公司已經在開發其 HC2 晶片,目標是 Llama 3.1 模型,擁有 200 億個參數。到年底,Taalas 旨在生產一款能夠運行如 GPT-5.2 等尖端前沿模型的晶片。該公司還展示了一個由 30 個 HC1 晶片組成的集群配置,以每秒每位用戶 12,000 個 token 的速度運行 DeepSeek 的 R1 模型。

HC1 目前可作為聊天機器人演示推理 API 服務提供,預計將在 2026 年全年進行更廣泛的商業部署。


市場背景:推理時代的開啟

Taalas 的出現標誌著人工智能硬體策略的更廣泛轉變。隨著行業從訓練階段(GPU 的靈活性至關重要)轉向推理部署階段,每 token 的成本已成為主導指標。如果 Taalas 的方法被證明是可擴展的,人工智能計算市場可能會分為兩個層級:由英偉達和 AMD 引領的通用訓練,以及由 Taalas 等模型專用矽晶圓廠引領的專用推理。

憑藉 2.19 億美元的總融資、功能齊全的首款晶片和雄心勃勃的路線圖,Taalas 已將自己定位為人工智能硬體現狀最可信的挑戰者之一 — 行業正密切關注。