Un sistema de inteligencia artificial (IA) creado por ingenieras de Google diseña chips tan buenos como los creados por los humanos, pero en una fracción del tiempo de lo que estos tardan en diseñarlos. Este nuevo método de aprendizaje automático está basado en un sistema de premios y castigos inspirado en la psicología conductista. El planeamiento de los microchips era el último gran reducto que se resistía a la automatización. Google ya lo está usando en la creación de sus futuros sistemas de IA.
Antes de que las máquinas fabriquen los chips como rosquillas y los pinchen en placas de silicio, un humano ha tenido que diseñarlos. Como un arquitecto cuando planea una casa, el ingeniero de hardware planifica la distribución más óptima posible de las distintas partes del microchip sobre una plantilla. En inglés se llama floorplanning (algo así como planeamiento de base). La catedrática de tecnología electrónica de la Universidad Politécnica de Madrid (UPM) Marisa López-Vallejo lo compara con las piezas a colocar en el Tetris, “pero un Tetris muy complejo”. No es solo que sean millones de piezas a colocar, es que son muy variables en forma y tamaño. Además, hay que ponerlas en el menor espacio posible e interconectarlas. Todo ello con la premisa de que todo el sistema sea lo más rápido y potente usando la menor energía y longitud de cable que se pueda. El profesor de arquitectura y tecnología de computadores de la Universidad Autónoma de Madrid (UAM) Eduardo Boemo lo tiene claro: “Esto lo hacen mejor los humanos que las máquinas”.
Ahora, la revista Nature publica una investigación que indica que las máquinas lo pueden hacer igual o mejor que los humanos y mucho más rápido. El trabajo, liderado por las ingenieras de Google Research Azalia Mirhoseini y Anna Goldie, muestra cómo un método de aprendizaje automático (machine learning en inglés) ideado por ellas ha diseñado chips en menos de seis horas igualando o superando en los parámetros más importantes para los humanos.
“Nuestro enfoque puede generar automáticamente planos de base que son comparables o superiores a los diseños humanos en prestaciones, rendimiento y área”, dice Goldie. “Está completamente automatizado y converge en unas pocas horas, mientras que los expertos humanos pueden tardar meses en ofrecer resultados”, añade. En este caso, lograron un diseño en menos de seis horas que superaba a los creados por humanos en varias semanas.
Para lograrlo, usaron un sistema de inteligencia artificial denominado aprendizaje por refuerzo que toma prestados elementos de la psicología de la conducta. “En esencia, le enseñamos a una IA a jugar a colocar fichas”, comenta Mirhoseini, ingeniera de software de Google Research. “En términos un poco más técnicos, desarrollamos un método de aprendizaje por refuerzo (AR) capaz de aprender de experiencias pasadas para sea cada vez mejor y más rápido en la colocación de nuevos chips”. Alimentado con información sobre los componentes del chip, las dimensiones de la plantilla, las restricciones que tiene o aspectos a optimizar, como la longitud de cable, congestión de enrutamiento o el consumo de energía, el sistema va probando distintas combinaciones, siendo reforzado con cada mejora.
José Miguel Hernández-Lobato es profesor de aprendizaje automático en la Universidad de Cambridge. En la actualidad usa el aprendizaje por refuerzo para generar moléculas en 3D que pudieran usarse en nuevos fármacos o antivirales. “Está superando a los humanos”, dice, allí donde la secuencia de posibles combinaciones es muy grande. “Como en un videojuego, nadie te dice lo que tienes que hacer en cada momento, solo recibes una puntuación al final de la partida”, compara. Lo que hace este sistema de IA es encontrar la secuencia de acciones con la mayor puntuación, que aquí sería dónde colocar el siguiente elemento del chip. “Los ingenieros hacen esto manualmente, pero si creen que la solución no es la óptima, para mejorar el chip necesitan otras dos o tres semanas”, destaca.
La tarea no es fácil, en un chip hay millones de componentes, como puertas lógicas o bloques de memoria. Los segundos son varias órdenes de magnitud mayores (todo siempre a escala nanométrica), lo que complica el despliegue. Además hay restricciones básicas, como que las conexiones entre los distintos componentes no pueden cruzarse. José L. Ayala es profesor de la facultad de informática de la Universidad Complutense de Madrid (UCM). “Cuando yo estudiaba, el floorplanning era un arte y los que lo hacían eran mitad ingenieros, mitad artistas”, recuerda. Hoy, el planeamiento de los chips sería imposible sin la ayuda de sistemas de diseño asistido apoyados en algoritmos. Pero son humanos los que los operan y los que tienen la última palabra. “Además, estos algoritmos no aprenden”, recuerda Ayala. El sistema creado por Google sí aprende y mejora con cada repetición.
Para López-Vallejo, “con este método están consiguiendo algo mejor e infinitamente más rápido”. Y el ahorro de tiempo no solo significa hacer lo mismo en menos horas. “Los humanos, cuando ya tienen un plano de base que les parece bueno ya no lo cambian, ya que sería muy costoso. Con este sistema lo puedes deshacer y volver a iterar. Esto es muy valioso”, añade. Las autoras también dicen que su investigación puede tener aplicaciones más allá del diseño de chips, como el planeamiento urbano, ingeniería ambiental o la propia distribución de vacunas. En general, se podría usar en la toma de decisiones ante problemas con gran cantidad de opciones y un número reducido de recompensas.
Pero los expertos consultados ven también bastante propaganda en esta investigación. Ayala, de la UCM, por ejemplo, dice que “una cosa es probarlo en una cajita cuadrada y otra bien distinta ponerlo en una familia de procesadores como los de Intel”. Los ordenadores domésticos llevan unidades de procesamiento de propósito general: no destacan en nada, pero son medianamente buenos para hacer muchas cosas. “Los procesadores de Google en los que pretenden aplicar este método están muy optimizados para aprendizaje automático, por lo que son muy homogéneos en su arquitectura”, recuerda Ayala. Y esto le pone las cosas más fáciles a la inteligencia artificial.