lynx   »   [go: up one dir, main page]

IA física

NVIDIA Cosmos

Desarrolle modelos fundacionales mundiales para avanzar en la IA física.

Descripción

¿Qué es NVIDIA Cosmos?

NVIDIA Cosmos™ es una plataforma de modelos básicos de mundo (WFM) generativos de vanguardia, tokenizadores avanzados, barreras de protección y un canal de selección y procesamiento de datos acelerados. Está diseñada para potenciar el entrenamiento de modelos mundiales y acelerar el desarrollo de la IA física para vehículos autónomos (VA) y robots.

NVIDIA abre portales al mundo de la robótica con nuevos modelos de IA física de Cosmos

Descubra cómo las nuevas versiones de los modelos de NVIDIA Cosmos, como Cosmos Transfer y Reason, facilitan la generación de mundos y el razonamiento para vehículos autónomos, robots y agentes de IA de análisis de vídeo.

Los pioneros del sector están creando agentes más inteligentes con modelos de razonamiento de NVIDIA Nemotron y Cosmos

Los modelos de razonamiento abierto proporcionan un pensamiento más rápido y amplio para generar resultados más inteligentes para los agentes de IA en el servicio de atención al cliente, la fabricación, la logística y la robótica.

Ventajas

Acelere la generación de mundos virtuales para la IA física

Cosmos proporciona a los desarrolladores fácil acceso a modelos fundacionales mundiales de alto rendimiento, canalizaciones de datos y herramientas para generar datos sintéticos, además del entrenamiento posterior para la robótica y las aplicaciones de conducción autónoma.

Primeros datos de la física

Modelos multimodales preentrenados en 20 millones de horas de robótica y datos de conducción para generar estados de mundo basados en la física.

Abiertos

Los WFM, las barreras y los tokenizadores de Cosmos tienen licencia en virtud de la licencia del modelo abierto de NVIDIA, lo que permite el acceso a todos los desarrolladores de IA física.

Mejorar continuamente los sistemas autónomos

Genere fácilmente la curación de datos, el aumento de datos, la evaluación y la simulación con modelos y herramientas creadas para el desarrollo de modelos de IA física personalizados.

Escalar rápidamente

Implemente rápidamente los WFM de Cosmos utilizando los microservicios NIM y escale los flujos de trabajo de IA agentica y generación de datos sintéticos.

Modelos abiertos

Modelos de Cosmos para la IA física

Modelos generativos multimodales previamente entrenados que los desarrolladores pueden utilizar de forma inmediata para la generación de mundos o el razonamiento o que pueden entrenar posteriormente para desarrollar modelos de IA física especializados.

Cosmos Predict

Un modelo de predicción del estado del mundo de última generación que puede generar hasta 30 segundos de vídeo continuo a partir de entradas multimodales con una velocidad, fidelidad y adherencia superiores.

Cosmos Transfer

Modelo multicontrol para escalar una sola simulación o vídeo espacial rápidamente en varios entornos y condiciones de iluminación.

Acelere las entradas 3D de marcos de simulación de IA física, como CARLA o NVIDIA Isaac Sim™, para permitir un aumento de los datos y las canalizaciones de generación de datos sintéticos totalmente controlables.

Cosmos Reason

Modelo de lenguaje de visión (VLM) totalmente personalizable que destaca por su capacidad para comprender el mundo físico como las personas mediante el razonamiento estructurado en vídeos e imágenes.

Se ha diseñado para impulsar agentes de IA de análisis de vídeo en tiempo de ejecución con una comprensión espaciotemporal de las operaciones urbanas e industriales, organizar datos de entrenamiento para robótica y vehículos autónomos (AV), y tomar decisiones relacionadas con robots.

Organización de datos

NVIDIA Cosmos Curator es un marco que permite a los desarrolladores filtrar, anotar y deduplicar rápidamente grandes cantidades de datos de sensores necesarios para el desarrollo de IA física, ya que crea conjuntos de datos personalizados para satisfacer las necesidades de los modelos.

Acelere el procesamiento y la generación de conjuntos de datos de forma eficiente.

Herramientas

Modelos básicos de mundo de Cosmos posentrenamiento

Cosmos proporciona a los desarrolladores canales de curación de datos abiertos y de alto rendimiento, tokenizadores, un marco de entrenamiento y scripts de posteriores al entrenamiento para crear de forma rápida y sencilla modelos mundiales especializados, como los modelos de políticas y los modelos de acción de lenguaje visual (VLA) para la IA integrada.

Tokenice de forma eficiente datos de vídeo

Utilice los tokenizadores de Cosmos para generar tokens de imagen o vídeo a tasas de compresión más altas, para un desarrollo escalable, robusto y eficiente de modelos mundiales de gran tamaño. Elija variantes de alta o baja resolución para posentrenar WFM de Cosmos en modelos de IA especializados.

Acelere la selección de datos

Acelere 20 veces la selección de datos con la canalización NVIDIA NeMo™ Curator de CUDA-X™ y las herramientas aceleradas por NVIDIA AI para procesar más de 100 PB de datos. Proporciona optimizaciones listas para usar, que minimizan el coste total de propiedad (TCO, por sus siglas en inglés) y aceleran el tiempo de comercialización.

Script posterior al entrenamiento

Personalice los WFM de Cosmos para aplicaciones de IA física en etapas posteriores utilizando los scripts de PyTorch. Posentrenamiento de modelos para generar acciones o texto, o modificar la longitud, la precisión, la vista y los controles de cámara para adaptarse a los escenarios y requisitos del mundo real.

Hardware

Obtenga el óptimo rendimiento con NVIDIA AI

Los WFM de Cosmos están completamente optimizados para las GPU NVIDIA de primer nivel, incluidas las basadas en la última arquitectura Blackwell.

Ejecutar sobre NVIDIA Blackwell

Para las empresas que ejecutan modelos multimodales masivos y personalizados, como los modelos fundamentales mundiales de Cosmos, GB200 de NVIDIA ofrece una velocidad y una escalabilidad líderes en el sector para cargas de trabajo de más de mil millones de parámetros. Acceder a NVIDIA DGX Cloud para desarrollar super clústeres de IA de próxima generación y aplicaciones de IA física a gran escala.

Los desarrolladores de IA física pueden aprovechar las plataformas de servidores y estaciones de trabajo con las GPU NVIDIA RTX PRO 6000 Blackwell y DGX Cloud para acelerar la generación de datos sintéticos utilizando Omniverse y Cosmos. Esta combinación le permite generar rápidamente datos sintéticos basados en la física. Esto ayuda con la robótica avanzada, los coches autónomos y los flujos de trabajo de simulación.


Casos de uso

Cómo Cosmos acelera la IA en todos los sectores

Utilice los modelos básicos de mundo de Cosmos para simular, razonar y generar datos para canalizaciones descendientes en robótica, vehículos autónomos y sistemas de visión industrial.

Aprendizaje de robots

Los robots necesitan datos de entrenamiento amplios y diversos para percibir sus entornos e interactuar con ellos. Con los WFM de Cosmos, los desarrolladores pueden generar datos sintéticos controlables y de alta fidelidad para entrenar modelos de percepción y políticas de robots.

Entrenamiento de vehículos autónomos

Los datos de sensores diversos y de alta fidelidad son fundamentales para entrenar, probar y validar vehículos autónomos de forma segura. Con los WFM de Cosmos entrenados posteriormente con los datos de vehículos, los desarrolladores pueden amplificar la diversidad de datos existentes con nuevas condiciones meteorológicas, niveles de iluminación y geolocalizaciones, o bien expandirse a vistas multisensor, lo que ahorra tiempo y costes significativos.

Agentes de IA de análisis de vídeo

Estos agentes de IA pueden analizar, resumir e interactuar con flujos de vídeo en tiempo real o grabados para mejorar la automatización, la seguridad y la eficiencia operativa en entornos industriales y urbanos.

Cosmos Reason es un modelo de lenguaje de visión (VLM) personalizable que potencia los agentes de IA de análisis de vídeo con una comprensión visual avanzada y un razonamiento espaciotemporal del mundo físico. Estos agentes de IA ofrecen respuestas a preguntas en tiempo real, alertas rápidas e información contextual enriquecida, lo que potencia sistemas más inteligentes y receptivos en implementaciones perimetrales y en la nube.

IA fiable

Apoyar a la comunidad de la IA física

Los modelos, límites y tokenizadores de Cosmos están disponibles en Hugging Face y GitHub, con recursos para abordar la escasez de datos en el entrenamiento de modelos de IA físicos.

Infraestructura de IA

Disfrute del mejor rendimiento con NVIDIA Blackwell

Los servidores NVIDIA RTX PRO 6000 de la serie Blackwell aceleran el desarrollo de IA física para robots, vehículos autónomos y agentes de IA en el entrenamiento, la generación de datos sintéticos, la simulación y la inferencia.

Acceda al máximo rendimiento de los modelos básicos de mundo de Cosmos en NVIDIA Blackwell GB200 para cargas de trabajo industriales de inferencia y posteriores al entrenamiento.

Ecosistema

Adoptado por los principales innovadores en el campo de la IA física

Los desarrolladores de modelos de los sectores de la robótica, los vehículos autónomos y la visión artificial utilizan Cosmos para acelerar el desarrollo de la IA física.

Próximos pasos

¿Tiene todo listo para empezar?

Pruebe un modelo fundamental mundiales en el catálogo de API de NVIDIA o empiece a crear sus propios modelos mundiales utilizando Cosmos.

Posentrenamiento de WFM

Los WFM de Cosmos están diseñados específicamente para aplicaciones de entrenamiento posteriores, que desbloquean potentes modelos mundiales en etapas posteriores para acelerar el desarrollo de la IA física.

Selección de datos de vídeo para modelos mundiales

Aproveche un canal acelerado de procesamiento y selección de datos con la tecnología de NVIDIA NeMo Curator optimizada para las GPU de centro de datos de NVIDIA.

Recursos

Últimas novedades de los desarrolladores de Cosmos

Preguntas frecuentes

Empiece con la documentación. Los modelos fundamentales mundiales de Cosmos están disponibles de forma abierta en Hugging Face con scripts de inferencia y entrenamiento posterior en GitHub. Los desarrolladores también pueden utilizar el tokenizador de Cosmos de /NVIDIA/cosmos-tokenizer en GitHub y Hugging Face.

Los modelos básicos de mundo de Cosmos están disponibles con licencia de modelo abierto de NVIDIA para todos.

Los scripts de PyTorch están disponibles de forma abierta para todos los modelos de Cosmos para el entrenamiento posterior. Lea la documentación para obtener una guía paso a paso sobre el entrenamiento posterior.

Sí, puede aprovechar Cosmos para crear desde cero con su modelo o arquitectura de modelos preferidos. Puede empezar utilizando NeMo Curator para el preprocesamiento de datos de vídeo. Luego comprima y descodifique sus datos con el tokenizador Cosmos. Una vez que haya procesado los datos, puede entrenar o ajustar su modelo utilizando NVIDIA NeMo.

Utilizando los microservicios NVIDIA NIM™, puede integrar fácilmente sus modelos de IA física en sus aplicaciones en la nube, los centros de datos y las estaciones de trabajo.

También puede utilizar NVIDIA DGX Cloud para entrenar modelos de IA e implementarlos en cualquier lugar a escala.

Los tres son WFM con roles distintos:

  • Cosmos Predict genera diversas escenas de vídeo a partir de texto, imágenes o mensajes de vídeo, ideal para ajustar con precisión temas como robots o coches autónomos.
  • Cosmos Transfer aplica la transferencia de estilo multicontrol, cambiando la iluminación y los entornos, en vídeos basados en la física, a menudo creados en simuladores como NVIDIA Omniverse.
  • Cosmos Reason responde a las consultas de texto razonando sobre las entradas de vídeo e imagen.

Cosmos Reason puede generar nuevos y diversos mensajes de texto a partir de un solo vídeo de inicio para Cosmos Predict, o analizar y anotar datos sintéticos de Predict y Transfer.

Omniverse crea simulaciones 3D realistas de tareas del mundo real utilizando diferentes API generativas, SDK y la tecnología de renderizado NVIDIA RTX.

Los desarrolladores pueden introducir simulaciones de Omniverse como vídeos instructivos en modelos de Cosmos Transfer para generar datos sintéticos fotorrealistas controlables.

Juntos, Omniverse proporciona el entorno de simulación antes y después del entrenamiento, mientras que Cosmos proporciona los modelos fundacionales para generar datos de vídeo y entrenar modelos de IA física.

Más información sobre NVIDIA Omniverse.

Лучший частный хостинг