DeepSeek

Suivre

L'entreprise chinoise d'IA DeepSeek expérimente des mécanismes d'attention éparse pour réduire significativement les coûts de traitement des modèles de langage de grande taille. Cette approche concentre les calculs sur les parties clés des données d'entrée, potentiellement en divisant par deux les besoins en ressources. Ce développement pourrait rendre l'IA avancée plus accessible au milieu des préoccupations croissantes liées à l'énergie.

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser