Changelog #0234 – Week of September 23, 2025

Real-Time Metrics: Live updates of training metrics during rollouts
Progress Tracking: Visual progress indicators for rollout phases
Enhanced Visualization: Improved charts and graphs for monitoring
Interactive Interface: User-friendly interface for exploring rollout data

TL;DR

Rollout Viewer: Enhanced visualization and monitoring interface for training rollouts
B200 & H200 GPU Support: Added support for NVIDIA’s latest flagship GPUs
Faster Inference: Optimized inference pipeline with improved throughput
GSPO Support: Integrated Group Sequence Policy Optimization algorithm

Enhanced visualization and monitoring interface for training rollouts with real-time metrics and progress tracking.

Added support for NVIDIA’s latest flagship GPUs (B200, H200) for both training and inference workloads.

Optimized inference pipeline with improved throughput and reduced latency across all model sizes.

Integrated Group Sequence Policy Optimization (GSPO) algorithm for advanced reinforcement learning training.

Real-Time Monitoring: Monitor training rollouts in real-time with enhanced viewer
Latest Hardware: Take advantage of B200 and H200 GPUs for training and inference
Faster Responses: Improved inference performance for production workloads
Advanced RL: Use GSPO for complex reinforcement learning scenarios