NVIDIA виправляє Blackwell: Швидка реакція на проблему з графічними процесорами
13:14, 24.10.2024
Генеральний директор NVIDIA Дженсен Хуанг визнав помилку в дизайні графічного процесора серії Blackwell, що призвело до затримок у постачанні чипів для штучного інтелекту. Проблема полягала у функціональному дефекті, який викликав низький вихід робочих чипів. За словами Хуанга, це було повністю на совісті NVIDIA, а не їхнього виробничого партнера TSMC, як припускали деякі джерела. Він підкреслив, що TSMC не тільки не була причетна до проблеми, але й активно допомогла її виправити.
Вдосконалення чипів і роль TSMC
Проблему вдалося вирішити шляхом модифікації верхніх шарів металу та нерівностей кремнію в GPU, що покращило продуктивність. Виправлення вимагало значних зусиль, враховуючи необхідність одночасного виробництва семи різних типів чипів з нуля. Основні труднощі були пов'язані з технологією упаковки CoWoS-L, яка використовує кремнієві мости LSI, інтерпозер RDL і чиплети GPU. Проблеми виникали через теплове розширення компонентів, що призводило деформації системи. Зазвичай такі виправлення займають близько 10 циклів, але NVIDIA та TSMC змогли вирішити проблему в рекордні терміни.
Масове виробництво оновлених чипів
Оновлені графічні процесори Blackwell B100 і B200 планується запустити у масове виробництво до кінця жовтня, а їх постачання має розпочатися на початку наступного року. Хоча виробництво вдосконалених чипів вже налагоджується, NVIDIA все ж очікує певний дефіцит високопродуктивних GPU у 2024 році, особливо для великих хмарних провайдерів, таких як AWS, Google і Microsoft.