[ad_1]
//php echo do_shortcode(‘[responsivevoice_button voice=»US English Male» buttontext=»Listen to Post»]’) ?>
SANTA CLARA, CALIFORNIA – La nueva startup de Raja Koduri, Mihira AI, construirá arquitecturas de centros de datos heterogéneas para atender las cargas de trabajo de IA y gráficos de los clientes, incluida una capa de software para orquestar las cargas de trabajo del centro de datos que serán parte de la salsa secreta de la compañía, dijo a EE Times en una entrevista exclusiva. Mihira también está abriendo un estudio de creación de contenidos que proporcionará a la empresa sus primeras cargas de trabajo para probar y recibir comentarios sobre su hardware y software durante el desarrollo. Tanto el primer centro de datos comercial como el estudio de creación de contenidos de Mihira tendrán su sede en India.
Koduri, ex vicepresidente ejecutivo y arquitecto jefe de Intel, dejó Intel en marzo para iniciar su propia empresa, después de cinco años liderando el negocio de gráficos y computación acelerada de Intel. Allí fue responsable de la arquitectura de GPU Intel Xe, las líneas de GPU del centro de datos y las GPU de gráficos de consumo Arc.
Koduri le dijo al EE Times que planea tres niveles de servicio para Mihira.
El nivel más bajo será una arquitectura de centro de datos heterogénea que cubrirá tres clases principales de cargas de trabajo: computación general de CPU para renderizado, aceleradores heterogéneos para IA y cargas de trabajo de GPU para juegos. Dijo que un futuro cuarto grupo podría optimizarse para la inferencia de IA de baja potencia.
Koduri, miembro de la junta directiva de la empresa de chips AI e IP Tenstorrent, también planea introducir algunas máquinas Tenstorrent como parte del clúster, aunque el equipo aún está averiguando las proporciones exactas de los diferentes tipos de hardware, dijo.
Mihira ha creado un pequeño grupo de desarrollo en Silicon Valley, pero su primer centro de datos se está construyendo en India.
«Estamos buscando una ubicación de forma proactiva», dijo Koduri. “Actualmente existen atractivos incentivos para los centros de datos en la India, incluidos kilovatios hora muy bajos. [power supply] Precios.»
Por encima del hardware estará el secreto de la empresa: un software de orquestación del centro de datos que distribuye de manera óptima la carga de trabajo del usuario entre diferentes tipos de computación. Mihira obtuvo la licencia del software del Proyecto Endgame de Intel, una capa de servicios de juegos unificados para computadoras en la nube, perimetrales y domésticas que Intel dejó de desarrollar recientemente. El software con licencia Intel formará la base de la capa de orquestación de Mihira, pero la compañía construirá su propia propiedad intelectual sobre ella, dijo Koduri. Intel también contribuyó con parte del hardware de desarrollo de Project Endgame para la configuración de desarrollo de Mihira.
“Es un buen punto de partida: hay algunas cosas muy interesantes que hemos construido allí. [at Intel]», dijo. «La planificación en tiempo real tuvo que realizarse bajo ciertas limitaciones, lo que nos brinda algunas ventajas interesantes para implementar modelos de IA».
Mihira ofrecerá a sus clientes dos puntos de acceso a sus centros de datos.
«Tendremos clientes para nuestro procesamiento de datos sin procesar, y tendremos clientes sentados encima de nuestra infraestructura de software y simplemente planificando el trabajo en ella», dijo Koduri. «Muchos de nuestros clientes requieren una infraestructura informática y una infraestructura de datos dedicadas y, por lo tanto, no pueden pasar a la nube pública».
Si bien la pila de software de Mihira no reemplazará inicialmente las pilas de proveedores de hardware como CUDA y ROCm, Mihira está explorando activamente alternativas más dinámicas a estas pilas para una posible implementación futura.
«Nuestro costo total de propiedad será muy beneficioso si podemos ejecutar algunas de las cargas de trabajo en hardware que no sea CUDA», afirmó. “El código Python nos llega en un contenedor y, si bien sabemos que funciona cuando habilitamos la extensión PyTorch de Intel o la ruta ROCm de AMD, actualmente alguien necesita realizar cambios en la pila para que esto sea posible. Nuestra capa de orquestación se encarga de estas cosas de forma dinámica. Nuestro objetivo es que no sea problema del usuario”.
El nivel más alto de la oferta de Mihira es un estudio de creación de contenido con sede en India que creará contenido digital para una variedad de industrias, incluido el entretenimiento, y también trabajará en proyectos gráficos como gemelos digitales.
«En lugar de construir infraestructura y esperar comentarios, hay un equipo interno cuya carga de trabajo incluye renderizado, juegos y cantidades cada vez mayores de IA», dijo Koduri. «Esto me coloca en una posición única para comprender una variedad de cargas de trabajo en un nivel íntimo y comenzar a generar algunos ingresos al mismo tiempo».
La visión de Koduri es que la IA beneficie a los usuarios cerrando la brecha de habilidades y permitiendo a los artistas y creadores de contenido trabajar con las habilidades que tienen. Los creadores de contenido en partes remotas de la India no necesariamente tienen las habilidades y la experiencia con herramientas que son fácilmente accesibles en otras partes del mundo, en parte porque carecen de recursos informáticos, dice Koduri.
«La infraestructura de Mihira les dará acceso a GPU de trazado de rayos de última generación para que no estén limitados por la potencia de procesamiento», dijo. “También tendrán a su disposición modelos de IA. Si podemos dar a todos acceso a computadoras y herramientas, hay mucho talento que podemos aprovechar”.
Hoy en día, el estudio de Mihira emplea a 170 personas en la India, y alrededor de 150 de ellas trabajan de forma remota, a menudo en ciudades pequeñas y lugares remotos.
Dada la larga trayectoria de Koduri como arquitecto de GPU, ¿finalmente Mihira fabricará su propio silicio?
«A largo plazo, ¿existe una arquitectura alternativa que haga que todo sea mucho más fácil de planificar y al mismo tiempo aumente la eficiencia?», dijo. “El lado del silicio de mi cerebro está trabajando a toda velocidad. Tenía un grupo pequeño (un arquitecto de GPU, un arquitecto de compiladores y un arquitecto de modelos de IA) de cuatro en un rincón, jugueteando con ideas. … No seremos una empresa de chips, pero podemos construir una parte [hardware] IP que podríamos licenciar”.
Mientras tanto, Mihira se centra en trabajar con proveedores de software de IA para comprender por qué es tan difícil ejecutar modelos de IA en diferentes tipos de hardware.
«Queríamos adoptar un enfoque de arriba hacia abajo: comprendamos realmente qué está pasando, cuál es el problema de última milla que tienen AMD o Habana», dijo. “Escuchamos muchas cosas diferentes de diferentes personas. …Olvídate de superar a Nvidia en rendimiento; Eso es importante, pero parece que muchas empresas todavía están intentando que la IA funcione”.
Koduri planea tener versiones iniciales del hardware y software de Mihira en funcionamiento para fin de año, y planea comenzar a trabajar con clientes externos en el primer trimestre del próximo año.
[ad_2]