Le traitement de l’IA se déplace vers les appareils pour la vitesse et la confidentialité

Les développeurs technologiques délocalisent l’intelligence artificielle des centres de données distants dans le nuage vers des appareils personnels comme les téléphones et ordinateurs portables pour obtenir un traitement plus rapide, une meilleure confidentialité et des coûts réduits. Cette IA sur appareil permet des tâches nécessitant des réponses rapides et garde les données sensibles locales. Les experts prédisent des avancées significatives dans les années à venir avec l’amélioration du matériel et des modèles.

La dépendance à l’IA basée sur le cloud, comme Claude d’Anthropic, implique l’envoi de prompts vers des centres de données distants, ce qui peut introduire des délais de plusieurs secondes—inacceptables pour des tâches urgentes comme alerter un utilisateur d’un obstacle sur son chemin. La confidentialité est une autre préoccupation, car les informations sensibles comme les données de santé ou financières transitent par de multiples systèmes non fiables. Pour résoudre ces problèmes, les entreprises traitent de plus en plus l’IA directement sur les appareils, éliminant le besoin de connexion internet et réduisant les coûts en évitant les paiements aux opérateurs de centres de données.

Ce changement est en cours depuis des années. Dès 2017, les iPhone utilisaient l’IA sur appareil pour la reconnaissance faciale via un moteur neuronal. Les implémentations modernes, comme Apple Intelligence d’Apple avec environ 3 milliards de paramètres, gèrent des tâches spécifiques telles que résumer des messages ou la reconnaissance visuelle à partir de captures d’écran. Les téléphones Pixel de Google emploient le modèle Gemini Nano sur la puce Tensor G5 pour alimenter des fonctionnalités comme Magic Cue, qui extrait des informations pertinentes des e-mails et messages sans recherche manuelle.

Les experts soulignent les défis et avantages. Mahadev Satyanarayanan, professeur à Carnegie Mellon, compare le calcul idéal sur appareil au cerveau humain, notant que si la nature l’a évolué sur un milliard d’années, les humains visent une efficacité similaire en cinq à dix ans grâce à du matériel avancé et des modèles spécialisés. Vinesh Sukumar, responsable de l’IA générative chez Qualcomm, pointe les différences système pour les appareils compacts comme les montres connectées, qui nécessitent souvent un déchargement vers le cloud—mais avec des garde-fous comme l’autorisation utilisateur et un traitement sécurisé pour protéger les données.

Private Cloud Compute d’Apple illustre les mesures de confidentialité : il traite les données déchargées uniquement sur les serveurs de l’entreprise, envoie un minimum d’informations et n’en stocke aucune. Pour les développeurs, l’IA sur appareil réduit les coûts récurrents ; Charlie Chapman de l’app Dark Noise l’utilise pour mixer des sons sans frais cloud, permettant une scalabilité sans risque financier.

À l’avenir, l’IA sur appareil excelle dans la classification d’objets en 100 millisecondes mais décharge encore pour la détection, la segmentation, la reconnaissance d’activités et le suivi. Satyanarayanan anticipe des progrès passionnants dans cinq ans, permettant des fonctionnalités comme des alertes de voyage via vision par ordinateur ou rappels contextuels sur des conversations.

Articles connexes

Illustration depicting Apple Siri integrating Google's Gemini AI, with Apple Park backdrop and fading ChatGPT logo.
Image générée par IA

Apple choisit Gemini de Google pour alimenter la prochaine mise à jour de Siri

Rapporté par l'IA Image générée par IA

Apple a sélectionné les modèles d'IA Gemini de Google pour améliorer son assistant virtuel Siri dans une mise à jour à venir. Cette décision, annoncée dans un communiqué commun, marque un virage par rapport aux intégrations précédentes avec ChatGPT d'OpenAI. Ce partenariat pluriannuel vise à offrir des expériences d'IA plus performantes tout en respectant les normes de confidentialité d'Apple.

Des chercheurs de l'Université Purdue et du Georgia Institute of Technology ont proposé une nouvelle architecture informatique pour les modèles d'IA inspirée du cerveau humain. Cette approche vise à résoudre le problème de la 'barrière mémoire' énergivore dans les systèmes actuels. L'étude, publiée dans Frontiers in Science, met en lumière le potentiel d'une IA plus efficace dans les appareils quotidiens.

Rapporté par l'IA

Les experts soutiennent que l’IA physique, impliquant des robots et des machines autonomes interagissant avec le monde réel, pourrait offrir un chemin direct vers l’intelligence artificielle générale. Les commentaires d’Elon Musk sur les robots Optimus de Tesla mettent en lumière ce potentiel, au milieu d’investissements croissants dans les technologies connexes. L’année 2026 est considérée comme un point d’inflexion clé pour le domaine.

Google a lancé Personal Intelligence, une nouvelle fonctionnalité pour son IA Gemini qui intègre des données de Gmail, Photos, Search et YouTube pour fournir des réponses plus personnalisées. Disponible initialement pour les abonnés payants aux États-Unis, cet outil opt-in met l'accent sur les contrôles de confidentialité des utilisateurs et évite l'entraînement direct sur les données personnelles. Le déploiement commence en bêta, avec des plans pour un accès plus large à l'avenir.

Rapporté par l'IA

À la suite des récentes conclusions d'IBM sur l'accélération par l'IA des exploits de vulnérabilités, un rapport de TechRadar met en garde que les hackers se tournent vers des solutions IA accessibles pour des attaques plus rapides, sacrifiant souvent la qualité ou le coût. Les entreprises doivent adapter leurs défenses à ces menaces en évolution.

Les agents de codage IA de sociétés comme OpenAI, Anthropic et Google permettent un travail prolongé sur des projets logiciels, y compris l'écriture d'applications et la correction de bugs sous surveillance humaine. Ces outils reposent sur de grands modèles de langage mais font face à des défis comme un traitement de contexte limité et des coûts computationnels élevés. Comprendre leur fonctionnement aide les développeurs à décider quand les déployer efficacement.

Rapporté par l'IA

Lors de son événement Unpacked de mercredi, Samsung a présenté les modèles Galaxy S26 et Galaxy Buds 4 Pro, avec l'intelligence artificielle au centre de l'attention. Les nouveaux outils incluent une fonctionnalité Ask AI dans le navigateur et des améliorations de Circle to Search pour identifier les articles achetables à partir d'images. L'entreprise a également annoncé l'édition photo IA et diverses mises à jour de Galaxy AI.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser