Qué es una Red Neuronal

Las redes neuronales artificiales (ANN), habitualmente conocidas como redes neuronales (NN), son sistemas informáticos inspirados en las redes neuronales biológicas que constituyen el cerebro humano.

 

Historia de las redes neuronales

 

Las redes neuronales pueden parecer recientes, pero los cierto es que el campo en sí no lo es en absoluto. Frank Rosenblatt, un psicólogo estadounidense, conceptualizó e intentó construir una máquina que respondiera como la mente humana el año 1958 y la bautizó como «Perceptron».

Para tener en consideración, y esto es sumamente importante, las redes neuronales artificiales aprenden con el ejemplo, de manera similar a sus contrapartes biológicas. Las entradas externas se reciben, procesan y activan de manera retalivamente similar (tampoco se emocionen tanto) a que lo hace el cerebro humano.

La estructura en capas de las redes neuronales

 

Sabemos que diferentes secciones del cerebro humano están conectadas para procesar varios tipos de información. Estas partes del cerebro están dispuestas jerárquicamente en niveles. A medida que la información ingresa al cerebro, cada capa, o nivel, de neuronas hace su trabajo particular de procesar la información entrante, obtener información y pasarla a la siguiente capa superior. Por ejemplo, cuando pasas frente a una panadería, tu cerebro responderá al aroma del pan recién horneado por etapas:

Entrada de datos: el olor del pan recién horneado.

Pensamiento: eso me recuerda a mi infancia.

Toma de decisiones: creo que compraré un poco de ese pan.

Recuerdo: pero almorcé hace sólo 1 hora.

Razonamiento: tal vez podría tomar un refrigerio. Sí, eso haré: algo más saludable.

Acción: ¿podría darme una hogaza de ese pan, por favor?

Así es como funciona el cerebro por etapas. Las redes neuronales artificiales funcionan bajo un principio similar. Las redes neuronales intentan simular este enfoque de múltiples capas para procesar varias entradas de información y basar las decisiones en ellas.

A nivel celular o de neuronas individuales, las funciones están diferenciadas. Las células nerviosas tienen finas prolongaciones protoplasmáticas ramificadas conocidas como dendritas. Éstas tienen como misión principal recepcionar señales bioeléctricas y luego las transmiten al soma o cuerpo celular. El soma procesa los estímulos y toma la decisión de enviar señales a otras neuronas de la red. Si la célula decide hacerlo, la extensión del cuerpo celular conocida como axón conducirá la señal por su vaina de mielina, llegará a los terminales, y hará la entrega a otras células a través de la transmisión química. El funcionamiento de las redes neuronales está inspirado en el funcionamiento de las neuronas de nuestro cerebro, aunque el mecanismo de acción tecnológico es diferente al biológico.

 

Estructura de una red neuronal

Una red neuronal artificial en su forma más elemental posee tres capas de neuronas. La información fluye de una a otra, tal como lo hace en el cerebro humano:

La capa de entrada o input: la información del mundo exterior entra en la red neuronal artificial desde aquí. Los nodos de entrada procesan los datos, los analizan o los clasifican y los pasan a la siguiente capa.

La capa oculta o hidden layer: toman (pueden ser varias) su entrada de la capa de entrada o de otras capas ocultas. Las redes neuronales artificiales pueden tener una gran cantidad de capas ocultas. Cada capa oculta analiza la salida de la capa anterior, la procesa aún más y la pasa a la siguiente capa.

La capa de salida u output: proporciona el resultado final de todo el procesamiento de datos que realiza la red neuronal artificial. Puede tener uno o varios nodos, de hecho. Por ejemplo, si tenemos un problema de clasificación binaria (sí/no), la capa de salida tendrá un nodo de salida que dará como resultado 1 o 0. Sin embargo, si tenemos un problema de clasificación multiclase, la capa de salida puede estar formada por más de un nodo de salida.

Obviamente, las redes neuronales artificiales más complejas tendrán múltiples capas ocultas.

 

Funcionamiento de una red neuronal artificial

Pensemos en una red neuronal básica. Las neuronas de la capa input se vinculan con las distintas neuronas de la capa hidden mediante conexiones (correspondientes al enlace terminal-dendrita), los cuales se grafican como flechas y en donde cada uno posee un peso (que más adelante veremos que es un parámetro a descubrir).

Lo mismo ocurre entre la capa hidden y la output: cada conexión posee un peso. Este peso en buena medida describe la influencia de una neurona sobre la siguiente.

Cada neurona además posee una llamada función de activación (análogo a lo que ocurre en el soma de la neurona biológica), la cual a partir de su señal de entrada, genera una señal de salida. Actualmente, la función de activación de uso más habitual es la ReLU, pero también están la tangente hiperbólicasigmoídea, etc.

La señal de entrada a una neurona específica se calcula a partir las neuronas que estrictamente le preceden: cada una de las precedentes aporta con su valor de salida (propio de esa neurona) y el peso de su conexión (propio del enlace de esas dos neuronas). Cada salida multiplicada por el peso de su conexión da como resultado un número. Y la suma de todos estos números que llegan a determinada neurona, más otra variable llamada «sesgo», dan como resultado la señal de entrada.

Luego, estas señales de entrada pasan por sus funciones de activación, y salen de las neuronas de la capa hacia la capa siguiente mediante los bordes que conectan sus neuronas.

El juego consiste en que gracias un proceso de optimización, la red determine en primera instancia los valores de los pesos de las conexiones y los sesgos. Esto se logra «entrenando» la red neuronal pasándole un gran volumen de datos de entrada y de salida conocidos.

Habiendo encontrado estas incógnitas, ya la red estará lista para en segunda instancia resolver el mismo problema pero aplicado ahora a nuevos datos de entrada, y generando por lo tanto nuevas

 

Compartir:

Facebook
Twitter
LinkedIn

Últimos Artículos