Inicialmente, para resolver tareas básicas de ML se usaban arquitecturas neuronales sencillas como las redes neuronales multicapa.

Posteriormente, las arquitecturas se fueron adaptando a la naturaleza de los datos.

Redes Recurrentes

En el caso del texto, como es secuencial el orden importa. Es decir, es importante tener en cuenta datos (palabras/frases) anteriores porque influyen sobre el contexto del texto.

A diferencia de las redes neuronales multicapa donde únicamente hay conexiones hacia adelante, las RNN solucionan este problema teniendo conexiones también hacia atrás.

Untitled

Se le pasa a la red la primera palabra, que se procesa multiplicándose capa tras capa y el output resultante se añade al siguiente input (la siguiente palabra) hasta que toda la información sea procesada y almacenada en la salida del último paso: