多伦多 Taalas 推出硬连线 AI 芯片,将模型直接集成到硅片中

2026-02-24
Taalas
6 min

新闻摘要

多伦多人工智能芯片初创公司 Taalas 于 2 月 19 日星期四(美国东部时间上午 11:02)正式亮相,并发布了其首款产品,宣布完成 1.69 亿美元融资,并推出其首款硬连线人工智能芯片 HC1。

英伟达人工智能霸主地位的新挑战者

多伦多人工智能芯片初创公司 Taalas 于周四(美国东部时间)正式揭开了其突破性首款产品的面纱,宣布完成 1.69 亿美元融资,并推出了 HC1——一款革命性的“硬连线”人工智能处理器,专为运行 Meta 的开源 Llama 3.1 8B 语言模型而设计。此次披露使 Taalas 的外部融资总额达到约 2.19 亿美元,投资者包括 Quiet Capital、Fidelity 和资深半导体投资者 Pierre Lamond。

此次公告在人工智能硬件界引起了震动,此前几周英伟达刚刚完成了一项价值 200 亿美元的里程碑式交易,以授权人工智能推理竞争对手 Groq 的知识产权——此举重新点燃了投资者对专业人工智能硅初创公司的热情。


HC1 芯片:将智能硬连线到硅片

Taalas 技术的核心是对人工智能模型如何在硬件上运行进行了根本性的重新思考。传统的 GPU——人工智能计算的主力军——依赖于“指令集架构”(ISA),该架构将计算与内存物理分离。每次大型语言模型处理查询时,芯片都必须反复将模型权重从高带宽内存(HBM)传输到处理核心。Taalas 将此称为“内存墙”,并估计这种数据移动开销占现代人工智能数据中心近 90% 的功耗

Taalas 的解决方案是完全消除内存获取周期。Taalas 没有在芯片上运行模型,而是有效地将模型“烘焙”到芯片中——将人工智能模型的权重和架构直接物理地打印到硅片的金属层中。结果是,模型本身成为了硬件的处理器。

HC1 由台积电在其 6 纳米(N6)工艺节点上制造,专门针对 Llama 3.1 8B 进行优化。据 Taalas 称,它每秒可实现超过 17,000 个输出 token/用户——比英伟达的旗舰 H200 GPU 快约 73 倍——同时仅消耗十分之一的功耗。该公司还声称,该芯片的制造成本比英伟达、Groq、SambaNova 和 Cerebras 的同类解决方案低 20 倍


从权重到硅片,仅需两个月

Taalas 最引人注目的技术声明之一是生产速度。传统的定制人工智能芯片开发可能需要六个月或更长时间。相比之下,Taalas 表示,通过与台积电合作,它可以在大约 两个月内将任何人工智能模型的权重转化为可部署的硅片。

秘诀在于设计的经济性:Taalas 不需要为每个模型重新设计整个芯片,而只需修改构成芯片的约 100 个金属层中的两个。这大大缩短了制造时间和成本,使得那些以前负担不起定制硬件的组织也能获得定制人工智能硅片。

这种快速迭代使得 Taalas 所描述的“季节性”硬件周期成为可能——一家公司可以在春天微调一个前沿模型,并在夏天部署数千个专用推理芯片。


精干的团队,宏大的愿景

也许 Taalas 故事中最引人注目的方面是其效率。HC1 由一支仅有 24 名工程师的团队以总计 3000 万美元的开发成本推向市场——这只是定制硅片项目通常所需数亿美元的一小部分。

该公司由人工智能芯片公司 Tenstorrent 的联合创始人、前 AMD 和英伟达架构师 Ljubisa Bajic 以及工程师 Drago IgnjatovicLejla Bajic 于 2023 年 8 月创立。此后,Taalas 已发展到 25 名员工,吸引了来自 AMD、苹果、谷歌、英伟达和 Tenstorrent 的人才。最近,Paresh Kharya——前谷歌云人工智能基础设施产品管理总监,负责 GPU 和 TPU 硬件——加入公司担任产品副总裁。


路线图:HC2 及以后

Taalas 并未止步于 Llama 3.1 8B。该公司已在开发其 HC2 芯片,目标是支持拥有 200 亿参数的 Llama 3.1 模型。到年底,Taalas 计划生产一款能够运行 GPT-5.2 等前沿模型的芯片。该公司还展示了一个由 30 个 HC1 芯片组成的集群配置,能够以每秒 12,000 个 token/用户的速度运行 DeepSeek 的 R1 模型。

HC1 目前提供聊天机器人演示推理 API 服务,预计将在 2026 年全年进行更广泛的商业部署。


市场背景:推理时代来临

Taalas 的出现标志着人工智能硬件策略的更广泛转变。随着行业从对 GPU 灵活性要求最高的训练阶段转向推理部署阶段,每 token 成本已成为主导指标。如果 Taalas 的方法被证明是可扩展的,人工智能计算市场可能会分为两个层面:由英伟达和 AMD 主导的通用训练,以及由 Taalas 等模型特定硅片代工厂主导的专用推理。

凭借 2.19 亿美元的总融资、功能齐全的首款芯片以及雄心勃勃的路线图,Taalas 已成为人工智能硬件领域现状的最可信挑战者之一——整个行业都在密切关注。