Red Hat lance sa plateforme AI Enterprise
Red Hat veut clairement avoir une offre IA distincte avec AI Enterprise. L'éditeur propose déjà Red Hat AI Inference Server, Red Hat OpenShift AI et Red Hat Enterprise Linux AI. Le tout est rassemblé dans Red Hat AI.
"Le paysage de l’IA d’entreprise évolue à toute vitesse, passant de simples interfaces de chat, à des workflows autonomes à haute densité qui nécessitent une intégration plus poussée sur l’ensemble de la pile technologique. Cependant, beaucoup d’organisations ne vont pas plus loin que la « phase pilote » à cause d’outils fragmentés et d’infrastructures incohérentes. Red Hat AI Enterprise résout ce problème en unifiant les cycles de vie des modèles et des applications. Résultat, les équipes informatiques peuvent gérer l’IA comme un système d’entreprise standardisé plutôt qu’un projet cloisonné, ce qui permet de la déployer de manière aussi fiable et reproductible que des logiciels d’entreprise traditionnels." explique l'éditeur.
La plateforme propose :
- Inférence d’IA plus rapide, plus économique et plus évolutive grâce au moteur d’inférence vLLM et au framework d’inférence distribuée llm-d pour optimiser les déploiements des modèles d’IA générative dans les environnements matériels hybrides.
- Observabilité et gestion des cycles de vie intégrées pour faciliter la gouvernance du cycle de vie de l’IA et réduire les risques grâce à une pile IA intégrée, éprouvée et interopérable, prête pour l’entreprise.
- Flexibilité dans le cloud hybride en donnant aux organisations la possibilité de déployer et de gérer des modèles, des agents et des applications d’IA avec une plus grande cohérence, partout où elles doivent mener leurs activités en s’appuyant sur les plateformes Red Hat de confiance.
La solution repose sur OpenShift. Pour l’infrastructure IA de NVIDIA, NVIDIA et Red Hat ont co-développé Red Hat AI Factory with NVIDIA, une nouvelle plateforme associant les capacités de Red Hat AI Enterprise et de NVIDIA AI Enterprise pour accélérer et faciliter le déploiement à grande échelle de l’IA de production pour les entreprises.