Taalas de Toronto sort de l'ombre avec une puce IA câblée qui intègre directement les modèles dans le silicium

February 24, 2026

Taalas

6 min

Résumé des nouvelles

La startup torontoise de puces IA Taalas est officiellement sortie de l'ombre et a dévoilé son premier produit le jeudi 19 février 2026 (11h02 EST), annonçant une levée de fonds de 169 millions de dollars et le lancement de sa première puce IA câblée, la HC1.

Un nouveau challenger à la domination de Nvidia dans l'IA

La startup torontoise de puces IA Taalas a officiellement levé le voile sur son premier produit révolutionnaire jeudi (EST), annonçant une levée de fonds de 169 millions de dollars tout en dévoilant la HC1 — un processeur IA "câblé" révolutionnaire spécialement conçu pour exécuter le modèle linguistique open-source Llama 3.1 8B de Meta. Cette annonce porte le financement extérieur total de Taalas à environ 219 millions de dollars, avec des investisseurs tels que Quiet Capital, Fidelity et le vétéran de l'investissement dans les semi-conducteurs Pierre Lamond.

L'annonce a fait des vagues dans la communauté du matériel IA, arrivant quelques semaines seulement après que Nvidia a finalisé un accord historique de 20 milliards de dollars pour licencier la propriété intellectuelle du rival de l'inférence IA Groq — une décision qui a ravivé l'enthousiasme des investisseurs pour les startups de silicium IA spécialisées.

La puce HC1 : Câbler l'intelligence dans le silicium

Au cœur de la technologie de Taalas se trouve une remise en question radicale de la manière dont les modèles IA s'exécutent sur le matériel. Les GPU traditionnels — les chevaux de bataille du calcul IA — s'appuient sur une "Architecture de jeu d'instructions" (ISA) qui sépare physiquement le calcul de la mémoire. Chaque fois qu'un grand modèle linguistique traite une requête, la puce doit transporter à plusieurs reprises les poids du modèle de la mémoire à large bande passante (HBM) vers les cœurs de traitement. Taalas appelle cela le "mur de la mémoire" et estime que cette taxe sur le mouvement des données représente près de 90 % de la consommation d'énergie dans les centres de données IA modernes.

La solution de Taalas consiste à éliminer complètement le cycle de récupération de la mémoire. Au lieu d'exécuter un modèle sur une puce, Taalas intègre effectivement le modèle dans la puce — en imprimant physiquement les poids et l'architecture du modèle IA directement dans les couches métalliques du silicium. Le résultat est un processeur où le modèle lui-même devient le matériel.

La HC1, fabriquée par TSMC sur son nœud de processus 6 nanomètres (N6), est optimisée exclusivement pour Llama 3.1 8B. Selon Taalas, elle atteint plus de 17 000 tokens de sortie par seconde par utilisateur — environ 73 fois plus rapide que le GPU phare H200 de Nvidia — tout en consommant seulement un dixième de la puissance. L'entreprise affirme également que le coût de fabrication de la puce est 20 fois inférieur à celui des solutions comparables de Nvidia, Groq, SambaNova et Cerebras.

Des poids au silicium en deux mois

L'une des affirmations techniques les plus convaincantes de Taalas est la vitesse de production. Le développement traditionnel de puces IA personnalisées peut prendre six mois ou plus. Taalas, en revanche, affirme pouvoir transformer les poids de n'importe quel modèle IA en silicium déployable en environ deux mois, en partenariat avec TSMC.

Le secret réside dans l'économie de conception : au lieu de redessiner une puce entière pour chaque modèle, Taalas ne modifie que deux des quelque 100 couches métalliques qui composent la puce. Cela réduit considérablement le temps et le coût de fabrication, rendant le silicium IA personnalisé accessible aux organisations qui n'auraient jamais pu se permettre auparavant du matériel sur mesure.

Cette itération rapide permet ce que Taalas décrit comme un cycle matériel "saisonnier" — une entreprise pourrait affiner un modèle de pointe au printemps et avoir des milliers de puces d'inférence spécialisées déployées à l'été.

Une équipe réduite avec une vision audacieuse

L'aspect peut-être le plus frappant de l'histoire de Taalas est son efficacité. La HC1 a été mise sur le marché par une équipe de seulement 24 ingénieurs pour un coût de développement total de 30 millions de dollars — une fraction des centaines de millions généralement nécessaires pour les projets de silicium personnalisés.

L'entreprise a été fondée en août 2023 par Ljubisa Bajic, co-fondateur de la société de puces IA Tenstorrent et ancien architecte chez AMD et Nvidia, aux côtés des ingénieurs Drago Ignjatovic et Lejla Bajic. Taalas compte depuis 25 employés, attirant des talents d'AMD, Apple, Google, Nvidia et Tenstorrent. Plus récemment, Paresh Kharya — anciennement directeur de la gestion des produits d'infrastructure IA chez Google Cloud, supervisant le matériel GPU et TPU — a rejoint l'entreprise en tant que vice-président des produits.

Feuille de route : HC2 et au-delà

Taalas ne s'arrête pas à Llama 3.1 8B. L'entreprise développe déjà sa puce HC2, ciblant le modèle Llama 3.1 avec 20 milliards de paramètres. D'ici la fin de l'année, Taalas vise à produire une puce capable d'exécuter un modèle de pointe tel que GPT-5.2. L'entreprise a également démontré une configuration basée sur un cluster de 30 puces HC1 exécutant le modèle R1 de DeepSeek à 12 000 tokens par seconde par utilisateur.

La HC1 est actuellement disponible sous forme de démonstration de chatbot et de service API d'inférence, avec des déploiements commerciaux plus larges attendus tout au long de 2026.

Contexte du marché : L'ère de l'inférence commence

L'émergence de Taalas signale un changement plus large dans la stratégie du matériel IA. Alors que l'industrie passe de la phase d'entraînement — où la flexibilité des GPU est primordiale — à la phase de déploiement de l'inférence, le coût par token est devenu la métrique dominante. Si l'approche de Taalas s'avère évolutive, le marché du calcul IA pourrait se bifurquer en deux niveaux : l'entraînement à usage général mené par Nvidia et AMD, et l'inférence spécialisée menée par des fonderies de silicium spécifiques aux modèles comme Taalas.

Avec 219 millions de dollars de financement total, une première puce fonctionnelle et une feuille de route ambitieuse, Taalas s'est positionnée comme l'un des challengers les plus crédibles au statu quo dans le domaine du matériel IA — et l'industrie observe attentivement.