RDNA 4 está en camino y ya está empezando a aparecer información sobre los nuevos GPUs que permiten especular un poco sobre el funcionamiento y posibles ventajas y desventajas de los nuevos diseños. Les dejo este artículo al respecto.
Ojalá Nvidia fuera un poco más así.
Hablando del post, entendí como la mitad jajaja
Y eso que me siento semi-familiarizado con programar GPUs, porque en su momento me tocó desarrollar en OpenCL.
Con respecto del hype de instrucciones “tensoriales” (no sé por qué se llaman así, según yo son matrices de toda la vida), espero que también se mueva más la aguja a correr LLMs localmente, y no depender del proveedor gigante que literalmente roba data de internet sin entregar nada a cambio. Y no me refiero a que la gente corra LLaMA en su casa, si no que las empresas que se suban al hype, corran las cosas en su infra y lo adapten al uso que le quieran dar. En vez de entregarle información confidencial a OpenAI.
Sería bacán, Nvidia siempre funciona con mucho software propietario entremedio y me carga eso porque nunca me funciona decente. AMD en este caso se ponen más con el software abierto, lo que en teoría debería hacer funcionar sus productos con mayor facilidad para el resto.
Ahora sobre el artículo en si, no soy experto para nada en ISAs, pero me interesa leer la especulación porque me gusta intentar entender qué cambios ocurren o por qué toman decisiones para cambiar sus diseños. La creación de nuevas instrucciones para ordenar y mantener ocupado el GPU son cosas que me llaman la atención.
La dependencia en OpenAI pareciera un retroceso para las empresas. Como se ha vuelto costumbre tomar confiar datos/información de las personas en empresas, pareciera que organizacionalmente está llevando a las empresas a confiar sus datos en otros. Ni idea qué tan confiable sea algo así, o cuánto se ha analizado el impacto, ventajas y desventajas de aquellas cosas. Estoy de acuerdo contigo en todo caso, prefiero implementaciones más descentralizadas.