Lección 1, Tema 4
En Progreso

Terminología de la IA

Progreso Lección
0% Completado

Es posible que hayas escuchado términos como aprendizaje automático, ciencia de datos, redes neuronales, o aprendizaje profundo, y sabes que todos ellos están relacionados con la IA. Pero ¿qué significan exactamente? En este tema, lo veremos.

Empecemos. Supongamos que tienes un conjunto de datos de viviendas como tamaño de la casa, número de dormitorios, número de baños, si la casa está recién renovada, y precio de venta. Si quieres crear una app para ayudar a la gente a calcular el precio de las casas, en la tabla siguiente tenemos marcado lo que sería A y lo que sería B.

Entonces, esto sería un sistema de aprendizaje automático, y en particular sería uno de esos sistemas de aprendizaje automático que aprende de las entradas a las salidas, o de A a B. Por lo tanto, el aprendizaje automático puede ayudarnos a construir un sistema de IA funcional y útil. Es un software que en cualquier momento, le introduces A (tamaño casa, nº dormitorios, nº baños, recientemente reformado) y obtener B (precio de la casa).

Como regla sencilla de recordar, cuando tienes un sistema IA que pueda dar servicio a muchos usuarios (incluso miles, o millones) por lo general es un sistema de aprendizaje automático.

Pero hay otras cosas que se pueden hacer con esos datos. Por ejemplo, un equipo de expertos podría analizarlo y obtener conclusiones como estas: “Si se tienen dos casas de un tamaño similar, la que tiene tres dormitorios cuesta más dinero que la de dos dormitorios, aunque el tamaño total sea el mismo”. O, “Las casas recién reformadas tienen una prima del 15%, y esto puede ayudar a tomar decisiones como, dados unos metros cuadrados similares, ¿construir una de dos dormitorios o una de tres para maximizar el precio de venta? ” O, “¿Merece la pena invertir en reformar una casa con la seguridad de que la reforma aumente el precio al que se puede vender?”. Estos serían ejemplos de proyectos de ciencia de datos, en los que el resultado es un conjunto de conocimientos que pueden ayudar a tomar decisiones empresariales, como qué tipo de casa construir o si invertir o no en reformas.

Los límites entre estos dos términos, aprendizaje automático y ciencia de datos, son en realidad algo difusos, pero con los ejemplos anteriores ya puedes tener cierta noción de sus diferencias.

Para formalizar un poco más estas dos nociones: “El aprendizaje automático es el campo de estudio que confiere a los ordenadores la capacidad de aprender sin ser programados explícitamente“. Esta es una definición que dio el investigador Arthur Samuel hace varias décadas. Arthur Samuel fue uno de los pioneros del aprendizaje automático, famoso por construir un programa para jugar a las damas, que podía jugar a las damas, incluso mejor que él mismo. Por lo tanto, un proyecto de aprendizaje automático suele dar como resultado un software que se ejecuta y que produce B a partir de A.

En cambio, la ciencia de datos es la ciencia que extrae conocimientos e ideas de los datos. Por lo tanto, el resultado de un proyecto de ciencia de datos suele ser un informe, o una presentación audiovisual que contiene ideas y conclusiones que ayuden a que los directivos empresariales tomen decisiones en relación a cómo incrementar ventas, o mejorar un sitio web, o cualquier otro tipo de actividad.

Vamos a poner un ejemplo de aprendizaje automático frente a ciencia de datos en el sector de la publicidad por Internet. Hoy en día, las grandes plataformas publicitarias como Facebook, o Instagram, o Google, tienen un sistema de IA que calcula para cada usuario, también para ti, cuál es el anuncio en el que es más probable que hagas clic, y ése es justamente el anuncio que te presentan para que hagas clic, ellos ganen dinero y el sistema capitalista continúe. Pues bien, eso es un sistema de aprendizaje automático. Obviamente un software como ése genera una cantidad ingente de dinero y los grupos publicitarios los tienen funcionando continuamente, 24 horas al día, 7 días a la semana.

En cambio, también hay proyectos de ciencia de datos para el sector de publicidad en línea. Si el análisis de los datos te dice, por ejemplo, que el sector de agencias de viaje no está comprando muchos anuncios, pero que si envías más vendedores a visitar (o televisitar, mundo postpandemia ya sabes) a estas empresas, podrías convencerles de que gasten más en publicidad. Pues bien, esto sería un proyecto de ciencia de datos cuyo resultado, como dijimos antes, son ideas y conclusiones que permite a los directivos tomar la decisión de incrementar el esfuerzo comercial en el sector de agencias de viaje, porque será rentable para el negocio.

Así que, incluso como hemos visto, en una misma empresa pueden coexistir proyectos de aprendizaje automático y ciencia de datos, y ambos enfoques pueden resultar muy convenientes.

También habrás oído hablar del aprendizaje profundo, incluso a veces se usa el original en inglés deep learning. ¿Qué es el aprendizaje profundo? Supongamos que quieres que quieres predecir el precio de viviendas. Entonces, tendrás una serie de datos de entrada incluyendo el tamaño de la casa, el número de dormitorios, el número de baños y si está recién renovada. Una de las maneras más efectivas de calcular el precio de las casas, dada esta entrada A, sería alimentar esa cosa rara que hemos dibujando en medio del gráfico para que calcule el precio. Esa cosa se llama una red neuronal, o red neuronal artificial, para distinguirla de la red neuronal que está en tu cerebro, y quizá en el mío también, aunque no estoy muy seguro.

El cerebro humano está formado por neuronas. Por eso, cuando decimos red neuronal artificial, es para reclacar que no nos referimos a ningún cerebro biológico, sino a un programa informático. Lo que hace una red neuronal, o una red neuronal artificial es tomar una entrada A, que en el ejemplo anterior son los cuatro datos sombreados en amarillo, y luego calcular la salida B, sombreada en verde, que es el precio estimado de la casa.

Hasta donde sabemos, la mente humana, los procesos cognitivos, se basan en las neuronas del cerebro pasando impulsos eléctricos, que son pequeños mensajes. Cuando dibujamos una red neuronal artificial, hay una analogía muy vaga con el cerebro. Estos pequeños círculos se llaman neuronas artificiales, o simplemente neuronas para abreviar, y también se pasan mensajes entre si. Esta gran red neuronal artificial obviamente no está compuesta de neuronas biológicas sino que en realidad es una gran ecuación matemática que calcula, dadas las entradas A, el precio B.

Lo importante que debes recordar es que una red neuronal es una técnica muy eficaz para el aprendizaje de A a B o mapeos de entrada-salida. Hoy en día, los términos red neuronal y aprendizaje profundo se utilizan casi indistintamente, porque significan esencialmente lo mismo. Hace algún tiempo, este tipo de software se denominaba red neuronal. Pero en los últimos años, nos hemos dado cuenta de que el término aprendizaje profundo es más adecuado y descriptivo, por lo que se usará cada vez más.

Entonces, ¿qué tienen que ver las redes neuronales o las redes neuronales artificiales con el cerebro? Pues para tu sorpresa, seguramente, resulta que casi nada. Las redes neuronales se inspiraron originalmente en el cerebro, pero a día de hoy los detalles de su funcionamiento no tienen casi nada que ver con el funcionamiento de los cerebros biológicos. Por lo tanto, hoy en día no es adecuado hacer analogías entre redes neuronales artificiales y cerebros biológico, aunque en su origen hubiera cierta inspiración.

También puede que oigas en los medios de comunicación otras palabras de moda como aprendizaje no supervisado, aprendizaje por refuerzo, modelos gráficos, planificación, grafo de conocimiento, etcétera. No hace falta que sepas qué significan todos estos otros términos, sólo recuerda que no son más que otras herramientas para conseguir que los sistemas de IA actúen de forma inteligente.

Intentaré darte una idea de lo que significan algunos de estos términos en temas (o cursos) posteriores. Pero las herramientas más importantes que espero que conozcas son el aprendizaje automático y la ciencia de datos, así como el aprendizaje profundo y las redes neuronales, que son una forma muy potente de hacer aprendizaje automático y, a veces, ciencia de datos.

Si tuviéramos que dibujar un diagrama de Venn que mostrara cómo se unen todos estos conceptos, saldría algo como lo que ves más abajo. La IA es este enorme conjunto de herramientas para hacer que los ordenadores se comporten de forma inteligente. De la IA, el mayor subconjunto son las herramientas que hemos llamado aprendizaje automático, o machine learning.

La parte del aprendizaje automático que es más importante a día de hoy son las redes neuronales o aprendizaje profundo, que es un conjunto muy potente de herramientas para llevar a cabo el aprendizaje supervisado o mapeos de A a B, así como algunas otras cosas.

Pero también hay otras herramientas de aprendizaje automático, además del aprendizaje profundo, como se intenta representar en la figura de arriba.

¿Cómo encaja la ciencia de datos en este panorama? Hay discrepancias en el uso de la terminología. Hay quien dice que la ciencia de datos es un subconjunto de la IA. Otros sostienen que la IA es un subconjunto de la ciencia de datos. Depende de a quién preguntes. Quizá lo más correcto sería decir que la ciencia de datos es un subconjunto transversal de todas estas herramientas que utiliza muchas herramientas de aprendizaje automático de IA y aprendizaje profundo, pero tiene algunas otras herramientas separadas, y con todo ello resuelve un conjunto muy importante de problemas en el ámbito empresarial.

Curso Discussion