Lección 1, Tema 7
En Progreso

Aprendizaje profundo (1)

Progreso Lección
0% Completado

Como ya hemos visto antes, aprendizaje profundo y red neuronal son términos usados casi indistintamente en IA. Son técnicas eficaces en el aprendizaje automático pero los medios de comunicación nos han transmitido como un halo de magia y misterio sobre ellas que es totalmente irreal.

En este apartado intentaremos desmitificar un poco para que entiendas bien qué son el aprendizaje profundo y las redes neuronales.

Veamos un ejemplo sobre la base de la predicción de demanda de un determinado producto. Supongamos que tienes un sitio web que vende camisetas y quieres saber, según el precio de las camisetas, cuántas unidades podrás vender. Si vas anotando observaciones reales, seguramente se te genere un conjunto de datos como el que ves más abajo, en el que cuanto más cara sea la camiseta, menor será la demanda.

Podrías tener una línea recta con datos que muestre que al subir el precio, la demanda baja. Ahora, la demanda nunca puede bajar de cero; puedes decir que la demanda se estabiliza en cero, y más allá de cierto punto se prevee que nadie compre camisetas. Esta línea azul quizá sea la red neuronal más simple posible. Tienes como entrada el precio A y como resultado la demanda estimada B. En forma de red neuronal lo dibujarías así: el precio se introduce en el círculo pequeño y de allí da como resultado la demanda estimada. En la terminología de la IA este círculo pequeño se llama neurona, o a veces neurona artificial, y lo que hace es calcular la curva azul de la izquierda.

Ésta quizá sea la red neuronal más simple posible con una sola neurona artificial: introduce el precio y da como resultado la demanda estimada.


Si el círculo naranja o neurona artificial fuera un pequeño ladrillo de Lego, la red neuronal consiste en muchos de estos ladrillos de Lego apilados uno sobre otro hasta lograr una gran potencia, una gran red de neuronas.

Veamos un ejemplo más complejo. Supón que además del precio de las camisetas, incluyes los gastos de envió que los clientes pagarán para recibir las camisetas. Quizá gastes en marketing más o menos en una semana dada; tal vez fabriques la camiseta con un algodón grueso, pesado y caro o con un material mucho más barato y endeble. Son algunos factores que razonablemente puedes creer que afectarán a la demanda de tus camisetas.

A la izquierda los factores que afectarán a la demanda de camisetas.

Veamos cómo podría ser una red neuronal más compleja. Sabes que a tus consumidores les importa mucho la asequibilidad, palabro con el que denomino al precio más los gastos de envío, o sea, el coste total. Digamos que tienes una neurona, que dibujo en azul, cuyo tarea es estimar la asequibilidad de las camisetas. La asequibilidad es principalmente una función del precio de las camisetas y de los gastos de envío.

El precio y los gastos de envío son el coste total, es decir, la asequibilidad de tu producto.

Un segundo factor que influye en la demanda de las camisetas es que se conozcan. Si los consumidores no te conocen ni te saludarán por la calle (esto quizá no te moleste demasiado), ni te comprarán camisetas (esto ya es más triste). ¿Saben los consumidores que vendes camisetas? Lo que más influye en ese conocimiento es el marketing. Pues bien, dibujemos una segunda neurona artificial en la que se introduce el presupuesto de marketing, lo que gastas en marketing y el grado de conocimiento del consumidor de tu camiseta.

Lo que gastes en marketing influye en el conocimiento que tengan los consumidores de tu producto, de su popularidad.

Por último, la calidad percibida del producto también influye en la demanda, y el marketing influye en cómo se percibe la calidad, ya que intenta convencer a la gente de que la camiseta es de alta calidad, y a veces el precio también afecta a la calidad percibida (y si no, que se lo digan a quienes tienen un iPhone). Entonces, podemos dibujar una tercera neurona artificial en la que se introduce el precio, el marketing y el material, e intenta calcular la calidad percibida de tus camisetas.

Ahora que gracias a estas tres neuronas azules se sabe el grado de asequibilidad y conocimiento del consumidor y la calidad percibida, puedes usar una neurona más que toma como entrada estos tres factores y da como salida la demanda estimada.

Esta es una red neuronal y su trabajo es aprender asignaciones entre estas cuatro entradas, de la entrada A a la salida B, a la demanda. Aprende la asignación de entrada y salida, o de A a B. Esta es una red neuronal pequeña, con solo cuatro neuronas artificiales. En la práctica, las redes neuronales actuales son mucho más grandes, con miles, decenas de miles de neuronas o incluso millones.

Por último, es importante aclarar un detalle final en esta descripción. En la forma en que se ha descrito la red neuronal, parece que tienes que averiguar que los factores clave son la asequibilidad, la popularidad y la calidad percibida. Una de las cosas maravillosas de usar redes neuronales es que para entrenar una red neuronal o crear un sistema de aprendizaje automático con una red neuronal todo lo que debes hacer es darle la entrada A (los conceptos a la izquierda en las figuras anteriores) y la salida B (demanda observada). El resto del cálculo lo realiza ella misma. Para crear una red neuronal, debes alimentarla con muchos datos, o la entrada A, y crear una red neuronal similar a esta, con varias neuronas azules que alimentan a una neurona amarilla, y luego debes dar datos con la demanda B. El software se encarga de la computación de estas neuronas azules de modo que aprende de forma completamente automática la mejor asignación de “cálculos” o “previsiones” que desde la entrada A producen la salida B. En la práctica se ha visto que si le das suficientes datos y entrenas una red neuronal lo suficientemente grande, se logra un resultado muy bueno de asignaciones de entradas A a salidas B.

Esto es una red neuronal: un grupo de neuronas artificiales en el que cada una computa una función relativamente simple. Cuando se apilan las suficientes, como ladrillos de Lego, pueden calcular funciones complicadas que producen asignaciones muy precisas de la entrada A a la salida B.

Curso Discussion