Desenvolvedores de tecnologia estão transferindo inteligência artificial de centros de dados em nuvem distantes para dispositivos pessoais como telefones e laptops para alcançar processamento mais rápido, melhor privacidade e custos menores. Essa IA no dispositivo permite tarefas que exigem respostas rápidas e mantém dados sensíveis locais. Especialistas preveem avanços significativos nos próximos anos à medida que hardware e modelos melhoram.
A dependência de IA baseada em nuvem, como Claude da Anthropic, envolve enviar prompts para centros de dados remotos, o que pode introduzir atrasos de segundos—inaceitáveis para tarefas urgentes como alertar um usuário sobre um obstáculo em seu caminho. A privacidade é outra preocupação, pois informações sensíveis como dados de saúde ou financeiros viajam por múltiplos sistemas não confiáveis. Para resolver esses problemas, as empresas estão processando IA nos próprios dispositivos cada vez mais, eliminando a necessidade de conectividade à internet e reduzindo custos ao evitar pagamentos a operadores de centros de dados.
Essa mudança está em curso há anos. Desde 2017, iPhones usavam IA no dispositivo para reconhecimento facial via motor neural. Implementações modernas, como Apple Intelligence da Apple com cerca de 3 bilhões de parâmetros, lidam com tarefas específicas como resumir mensagens ou reconhecimento visual de capturas de tela. Telefones Pixel do Google empregam o modelo Gemini Nano no chip Tensor G5 para alimentar recursos como Magic Cue, que extrai informações relevantes de e-mails e mensagens sem busca manual.
Especialistas destacam desafios e benefícios. Mahadev Satyanarayanan, professor de Carnegie Mellon, compara a computação ideal no dispositivo ao cérebro humano, notando que embora a natureza o tenha evoluído por um bilhão de anos, humanos visam eficiência similar em cinco a dez anos por meio de hardware avançado e modelos especializados. Vinesh Sukumar, chefe de IA generativa na Qualcomm, aponta diferenças de sistema para dispositivos compactos como smartwatches, que frequentemente requerem offloading para a nuvem—mas com salvaguardas como permissão do usuário e manuseio seguro para proteger dados.
Private Cloud Compute da Apple exemplifica medidas de privacidade: processa dados offloaded apenas em servidores da empresa, envia informação mínima e armazena nenhuma. Para desenvolvedores, IA no dispositivo corta custos contínuos; Charlie Chapman do app Dark Noise a usa para misturar sons sem taxas de nuvem, permitindo escalabilidade sem risco financeiro.
Olhando adiante, IA no dispositivo se destaca em classificação de objetos em 100 milissegundos mas ainda offloada para detecção, segmentação, reconhecimento de atividade e rastreamento. Satyanarayanan antecipa progresso empolgante em cinco anos, habilitando recursos como alertas de viagem via visão computacional ou lembretes contextuais sobre conversas.