Nvidia, Blackwell AI çiplerinde aşırı ısınma sorunuyla karşı karşıya
Aşırı ısınma ve performansı kaybı
Blackwell GPU’ları, özellikle 72 işlemcili yüksek kapasiteli sunucu raflarında ciddi ısınma sorunlarıyla karşılaşıyor. Bu sunucuların tek bir rafında 120 kW’a kadar enerji tüketimi olması bekleniyor. Isınma problemi, hem işlemci performansını sınırlıyor hem de bileşenlerde hasar riski yaratıyor. Nvidia’nın bu sorunların çözümü için sunucu raflarının tasarımını defalarca gözden geçirmek zorunda kaldığı belirtiliyor.
Nvidia’nın, aşırı ısınmayı önlemek amacıyla tedarikçilerine birçok tasarım değişikliği talimatı verdiği bildirildi. Soğutma sistemlerinin geliştirilmesi için mühendislik revizyonları yapılırken, bu süreç aynı zamanda sevkiyat tarihlerinin de ertelenmesine yol açtı. Nvidia, bu tür değişikliklerin teknoloji dünyasında büyük ölçekli lansmanlarda normal olduğunu belirtse de, müşteriler üretim ve dağıtım takvimlerinde yaşanan aksamalardan endişeli.
Yapay zeka çalışmaları etkilenebilir
Nvidia’nın geciken sevkiyatları Google, Meta ve Microsoft gibi büyük teknoloji şirketlerinin planlarını etkileyebilir. Bu şirketler, büyük dil modelleri gibi gelişmiş yapay zeka sistemlerini eğitmek için Nvidia’nın GPU’larını kullanıyor. Blackwell işlemcilerinin gecikmesi, bu sistemlerin geliştirme ve uygulama süreçlerini de aksatabilir.
Gecikmeler ve aşırı ısınma sorunlarına yanıt olarak bir Nvidia sözcüsü Reuters’e bulut sağlayıcılarla yapılan ortak çalışmaları hatırlattı ve tasarım değişikliklerini normal geliştirme sürecinin bir parçası olarak tanımladı. Sonuç itibarıyla, Blackwell GPU’ların son revizyonu ancak Ekim ayı sonunda seri üretime girebildi; bu da Nvidia’nın bu işlemcileri Ocak ayı sonundan itibaren sevk edebileceği anlamına geliyor. Orijinal planlar ise 2024’ün ikinci çeyreğini hedefliyordu.