SenseTime bets on multimodal AI to regain its edge

Chinese AI pioneer SenseTime is leveraging its computer vision roots to lead the next phase of AI, shifting towards multimodal systems and embodied intelligence in the physical world. Co-founder and chief scientist Lin Dahua stated that this approach mirrors Google's, starting with vision capabilities as the core and adding language to build true multimodal systems.

SenseTime, a Hong Kong-listed company long regarded as one of the world's leading facial recognition providers, is seeking a new role in the generative AI era that began with ChatGPT's launch three years ago. In an interview with the Post on Wednesday, co-founder and chief scientist Lin Dahua explained that the company's longstanding expertise in vision-based AI positions it strongly to lead in embodied intelligence, robotics, and AI agents operating in real-world environments, amid growing debates on the limits of large language models (LLMs).

"Our strategic approach is somewhat similar to Google’s in the United States, which primarily focuses on multimodal AI including the latest Nano Banana Pro. They also start with vision capabilities as the core, then add language abilities to create real multimodal systems," said Lin, who is also an associate professor of information engineering at the Chinese University of Hong Kong.

Extending the comparison to Google—which has deep capabilities across the AI stack, including its own TPU chips for training models—Lin noted that SenseTime's decision as early as 2018 to build large-scale data centres laid a solid foundation for its ambitions. As of August, the company's total computing power stood at about 25,000 petaflops, up 8.7 per cent since the start of the year, after surging 92 per cent over the whole of 2024.

This pivot signals SenseTime's shift from hype to more hardware-focused investments, aiming to regain its edge in multimodal, real-world AI.

Articles connexes

Korean tech firms Samsung, LG, and Hyundai showcase AI robots, laptops, and 'Physical AI' innovations at bustling CES 2026 in Las Vegas.
Image générée par IA

Korean firms highlight AI innovations at CES 2026

Rapporté par l'IA Image générée par IA

Ahead of CES 2026 in Las Vegas, major Korean tech firms including LG Electronics, Hyundai Motor Group, and Samsung Electronics unveiled AI-centric products and visions. They presented strategies like 'AI in Action' and 'Physical AI,' showcasing advances in robotics, laptops, memory, and more across daily life and industry. The events emphasized AI extending beyond screens into real-world applications.

Les experts prévoient 2026 comme l’année charnière pour les modèles du monde, systèmes d’IA conçus pour appréhender le monde physique plus profondément que les grands modèles de langage. Ces modèles visent à ancrer l’IA dans la réalité, favorisant des avancées en robotique et véhicules autonomes. Des leaders de l’industrie comme Yann LeCun et Fei-Fei Li soulignent leur potentiel à révolutionner l’intelligence spatiale.

Rapporté par l'IA

Hangzhou-based startup DeepSeek has not announced plans for its next major AI model release, but its technical papers suggest potential advances. The papers highlight how AI infrastructure innovations could drive efficiency and scale up model performance.

Alors que les plateformes d'IA passent à une monétisation basée sur la publicité, des chercheurs mettent en garde contre le fait que cette technologie pourrait façonner le comportement, les croyances et les choix des utilisateurs de manière invisible. Cela marque un revirement pour OpenAI, dont le PDG Sam Altman a jugé un jour le mélange de publicités et d'IA « troublant », mais qui assure désormais que les publicités dans les apps IA peuvent préserver la confiance.

Rapporté par l'IA

Alors que le boom de l’IA se poursuit, les chatbots comme GPT-5 voient leur prominence s’estomper rapidement. Les observateurs de l’industrie prédisent que 2026 appartiendra à Qwen. Ce changement est mis en lumière par les innovations de la startup chinoise Rokid.

Malgré les inquiétudes sur une bulle d'investissement en IA, les investisseurs à Taïwan restent engagés dans la technologie. La nation insulaire ne montre aucun signe d'inquiétude quant à une éventuelle surévaluation du secteur.

Rapporté par l'IA

Au Consumer Electronics Show de Las Vegas, des entreprises comme Nvidia, Razer et HyperX ont présenté des technologies gaming améliorées par l'IA visant à optimiser les performances et l'expérience utilisateur. Ces révélations soulignent l'intégration croissante de l'intelligence artificielle dans les périphériques et logiciels gaming. Certaines sont des mises à jour immédiates, d'autres restent des prototypes conceptuels.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser