Dentro de los módulos de alimentación bifásicos de Infineon para el suministro de energía de IA
[ad_1]
Estos aceleradores de IA aumentan los requisitos de energía del centro de datos en más de tres veces. El consumo de energía de una sola columna de servidor aumenta de los 15 a 30 kW actuales a más de 90 kW.
El desafío para los diseñadores de chips de IA es escalar también para procesar nodos de hasta 5 y 3 nm. Por lo tanto, estos chips funcionan con voltajes de suministro relativamente bajos a pesar de que consumen mucha energía. Los voltajes operativos centrales en estos nodos de proceso se encuentran actualmente entre 0,75 y 0,85 V. Y dado que la ley de Ohm establece que la potencia es igual a la corriente multiplicada por el voltaje (P = I × V), cada uno de estos chips de IA puede tener varios miles de amperios necesarios. de electricidad que debe ser alimentada al POL.
Durante años, el voltaje del bus de CC estándar para alimentar servidores en un rack era de 12 V. Sin embargo, las empresas de tecnología están actualizando a 48 V para minimizar las pérdidas en PDN. Esto hace que las corrientes entre la placa y la última etapa del convertidor CC-CC disminuyan en un factor de cuatro. Entonces, refiriéndose a la ley de Ohm, reducir la corriente reduce las pérdidas de resistencia 16 veces.
El último paso antes de suministrar energía al procesador es un regulador de voltaje, que regula el voltaje del bus de CC de 12 o 48 V hasta los voltajes específicos que requiere el núcleo del procesador y al mismo tiempo aumenta la corriente a los niveles requeridos. Aunque el regulador de voltaje solo necesita suministrar energía a una distancia corta al chip AI, el PDN todavía está sujeto a pérdidas (I2R) se deben a la resistencia del embarrado, lo que puede provocar problemas térmicos. Además de estas pérdidas, existen pérdidas debidas a inductancia y capacitancia parásitas.
A medida que aumenta la diferencia entre los altos voltajes utilizados para alimentar el servidor y los muy bajos voltajes utilizados para hacer funcionar el procesador, surgen otros problemas. Dado que 48 V (en lugar de 12 V) en el núcleo del procesador se reducen a voltajes inferiores a 1 V, el regulador de voltaje inevitablemente pierde más energía. La alternativa es colocar más de una etapa del convertidor DC-DC delante del POL.
Debido a que solo puede reducir voltajes de entrada de 4,25 a 16 V a voltajes de salida de 0,225 a 3 V, el módulo de potencia de Infineon puede actuar como un convertidor CC-CC de segunda etapa después de que una primera etapa reduzca el voltaje de 48 a 12 V.
Regulador de voltaje: lo más cerca posible del POL
El factor más importante en el suministro de energía de la IA es la ubicación de los reguladores de voltaje en la PCB, lo que afecta la resistencia de los rieles de alimentación que alimentan los pines del procesador.
Sin embargo, dado que una sola GPU requiere más de 1000 A de corriente, determinar la ubicación óptima en la PCB no es una tarea fácil. Si el VRM en sí no está ubicado físicamente cerca de los pines del procesador, la corriente tiene que viajar una distancia más larga en la placa de circuito, lo que resulta en mayores pérdidas parásitas. El sustrato sobre el que se coloca el procesador también puede aumentar la impedancia lo suficiente como para provocar más pérdidas de PDN.
Sin embargo, colocar el regulador de voltaje demasiado cerca del chip AI puede causar otros problemas. Las E/S de gran ancho de banda utilizadas para conectar los chips de IA en grupos grandes son susceptibles al ruido de conmutación resultante de los reguladores reductores que cambian bruscamente. Los reguladores de voltaje suministran grandes cantidades de corriente, lo que a su vez interrumpe el enrutamiento de la señal al procesador, lo que reduce la integridad de la señal (SI). El problema también ocurre con las tarjetas aceleradoras que combinan CPU y GPU, como el superchip Grace Hopper de NVIDIA.
La disposición más común es la entrega de energía lateral (LPD), en la que una serie de reguladores de voltaje flanquean los lados norte y sur o este y oeste del procesador, suministrando energía desde ambos lados para distribuirla de manera más uniforme. Sin embargo, a medida que la GPU y otros tipos de silicio de IA consumen cada vez más energía, resulta cada vez más impráctico colocar todos los componentes electrónicos de potencia en el espacio limitado disponible en una placa de circuito.
[ad_2]
Deja una respuesta