SenseTime apuesta por la IA multimodal para recuperar su ventaja

La pionera china en IA SenseTime aprovecha sus raíces en visión por computador para liderar la siguiente fase de la IA, desplazándose hacia sistemas multimodales e inteligencia encarnada en el mundo físico. El cofundador y director científico Lin Dahua afirmó que este enfoque es similar al de Google, comenzando con capacidades de visión como núcleo y añadiendo lenguaje para construir sistemas multimodales verdaderos.

SenseTime, una empresa cotizada en Hong Kong considerada durante mucho tiempo uno de los principales proveedores mundiales de reconocimiento facial, busca un nuevo rol en la era de la IA generativa que comenzó con el lanzamiento de ChatGPT hace tres años. En una entrevista con el Post el miércoles, el cofundador y director científico Lin Dahua explicó que la experiencia duradera de la compañía en IA basada en visión la posiciona fuertemente para liderar en inteligencia encarnada, robótica y agentes de IA que operan en entornos del mundo real, en medio de crecientes debates sobre los límites de los modelos de lenguaje grandes (LLM).

«Nuestro enfoque estratégico es algo similar al de Google en Estados Unidos, que se centra principalmente en IA multimodal, incluyendo el último Nano Banana Pro. Ellos también comienzan con capacidades de visión como núcleo y luego añaden habilidades lingüísticas para crear sistemas multimodales reales», dijo Lin, quien también es profesor asociado de ingeniería de la información en la Universidad China de Hong Kong.

Extendiendo la comparación a Google —que tiene profundas capacidades en toda la pila de IA, incluyendo sus propios chips TPU para entrenar modelos—, Lin señaló que la decisión de SenseTime de construir centros de datos a gran escala tan temprano como en 2018 sentó una base sólida para sus ambiciones. A agosto, la capacidad de cómputo total de la compañía alcanzaba unos 25.000 petaflops, un 8,7% más desde el inicio del año, tras dispararse un 92% durante todo 2024.

Este giro señala el paso de SenseTime de la hype a inversiones más enfocadas en hardware, con el objetivo de recuperar su ventaja en IA multimodal y del mundo real.

Artículos relacionados

Korean tech firms Samsung, LG, and Hyundai showcase AI robots, laptops, and 'Physical AI' innovations at bustling CES 2026 in Las Vegas.
Imagen generada por IA

Korean firms highlight AI innovations at CES 2026

Reportado por IA Imagen generada por IA

Ahead of CES 2026 in Las Vegas, major Korean tech firms including LG Electronics, Hyundai Motor Group, and Samsung Electronics unveiled AI-centric products and visions. They presented strategies like 'AI in Action' and 'Physical AI,' showcasing advances in robotics, laptops, memory, and more across daily life and industry. The events emphasized AI extending beyond screens into real-world applications.

Expertos prevén 2026 como el año clave para los modelos del mundo, sistemas de IA diseñados para comprender el mundo físico más profundamente que los grandes modelos de lenguaje. Estos modelos buscan anclar la IA en la realidad, permitiendo avances en robótica y vehículos autónomos. Líderes de la industria como Yann LeCun y Fei-Fei Li destacan su potencial para revolucionar la inteligencia espacial.

Reportado por IA

La startup con sede en Hangzhou, DeepSeek, no ha anunciado planes para su próximo lanzamiento de un modelo de IA principal, pero sus trabajos técnicos sugieren avances potenciales. Los papeles destacan cómo las innovaciones en infraestructura de IA podrían impulsar la eficiencia y escalar el rendimiento de los modelos.

A medida que las plataformas de IA viran hacia la monetización basada en anuncios, investigadores advierten de que la tecnología podría moldear el comportamiento, creencias y elecciones de los usuarios de formas invisibles. Esto supone un cambio de rumbo para OpenAI, cuyo CEO Sam Altman consideró en su día la mezcla de anuncios e IA 'inquietante', pero ahora asegura que los anuncios en apps de IA pueden mantener la confianza.

Reportado por IA

A medida que continúa el auge de la IA, los chatbots como GPT-5 ven desvanecerse rápidamente su prominencia. Observadores de la industria predicen que 2026 pertenecerá a Qwen. Este cambio se destaca por innovaciones en la startup china Rokid.

Pese a las preocupaciones sobre una burbuja de inversión en IA, los inversores en Taiwán siguen comprometidos con la tecnología. La nación insular no muestra signos de preocupación por una posible sobrevaloración en el sector.

Reportado por IA

En el Consumer Electronics Show de Las Vegas, empresas como Nvidia, Razer y HyperX presentaron tecnologías de gaming mejoradas con IA destinadas a mejorar el rendimiento y la experiencia del usuario. Estas revelaciones destacan la creciente integración de la inteligencia artificial en periféricos y software de gaming. Mientras algunas son actualizaciones inmediatas, otras permanecen como prototipos conceptuales.

 

 

 

Este sitio web utiliza cookies

Utilizamos cookies para análisis con el fin de mejorar nuestro sitio. Lee nuestra política de privacidad para más información.
Rechazar