Lección 1, Tema 2
En Progreso

Aprendizaje automático, o Deep learning

Progreso Lección
0% Completado

El desarrollo de la IA, y la popularidad que tiene a día de hoy la IA se debe en en gran parte a una herramienta específica de IA llamada aprendizaje automático o deep learning. En este tema te explicaremos qué es el aprendizaje automático y esperamos que se te ocurran ideas para que fundes la siguiente y exitosa empresa de IA.

El tipo de aprendizaje automático más usado es un tipo de IA que aprende de A a B, o asignación de datos de entrada a salida. Este tipo se llama aprendizaje supervisado.

Lo de que “aprende de A a B” quiere decir que si le damos el dato A a nuestro sistema de IA, él nos responderá con B. Lo veremos mucho más claro con ejemplos.

Si la entrada A es un correo electrónico y la salida B es determinar si es correo basura (spam) o no, tenemos utilización del aprendizaje automático para crear un filtro de correo basura. O cuando la entrada es un clip de audio y la tarea de la IA es convertirlo en una salida de transcripción de texto, se trata del reconocimiento de voz. Más ejemplos, si quieres introducir inglés y darle salida en un idioma distinto, como chino, español o algún otro, se trata de traducción automática. O la forma más lucrativa de aprendizaje supervisado, de este tipo de aprendizaje automático, podría ser la publicidad en internet. Todas las grandes plataformas publicitarias (google, facebook, twitter…) tienen un componente IA que recibe información sobre un anuncio e información sobre ti, e intenta evaluar si es probable que hagas clic en el anuncio o no. De este modo los anunciantes te presentan los tipos de anuncio que es más fácil que tú pulses. Quizá no sea el tipo de aplicación más beneficiosa para la humanidad, pero está claro que tiene impacto económico. O si quieres crear un vehículo autónomo, construyes un sistema IA que toma imágenes y otros datos del entorno del vehículo y genera una salida que incluye la posición y distancia de los vehículos colindantes de forma que el vehículo autónomo pueda evitar chocar con los demás, lo cual es bastante conveniente. O en fábricas, donde tomas como entrada una imagen de algo que acabas de fabricar, como la foto de un teléfono móvil producido en una línea de montaje. Hablo de una foto del teléfono, no una foto tomada con el teléfono, y lo que quieres como salida es saber si presenta alguna ralladura, muesca o o algún otro defecto el artículo que acabas de fabricar. Se trata de una inspección visual que ayuda a los fabricantes a reducir o evitar defectos en los artículos que producen.

Esta técnica de IA se llama aprendizaje supervisado porque aprende de asignaciones de datos de entrada a salida, o de A a B. que le vienen dadas, de ahí lo de “supervisado”. Por una parte, podría parecer que si sólo hay entrada y salida, A y B, pues que sus posibilidades sean limitadas, pero cuando se encuentra la aplicación adecuada, puede ser increíblemente valioso.

Pongo otro ejemplo, algo exagerado, de cómo funciona la I.A. tipo aprendizaje automático por aprendizaje supervisado. Supongamos que tengo mil millones de fotos de animales de los cuales quinientos millones son gatos. Si yo etiqueto cada foto con “es un gato” ó “no es un gato” (eso tengo que hacerlo yo, por eso es aprendizaje “supervisado”) y alimento con esos datos (imágenes etiquetadas) a un sistema de IA, dicho sistema “aprenderá” a distinguir gatos en fotos, de modo que si le mostramos 100 fotos de animales, en un porcentaje muy alto (99% posiblemente) nos dirá correctamente si es un gato o no. Esto que acabamos de explicar es un sistema “deep learning” o “aprendizaje automatico”.

La noción de aprendizaje supervisado lleva décadas existiendo, pero sólo ha despegado de verdad los últimos años. ¿Por qué ahora? Porque ahora hay disponibles mucho más datos.

Dibujemos un gráfico en el que en el que en el eje horizontal se dibuja la cantidad de datos que tienes de una tarea. Para el reconocimiento de voz, podría ser la cantidad de datos de audio (A) y de transcripciones (B) que tienes. En muchos sectores, la cantidad de datos a los que se tiene acceso ha crecido mucho durante el último par de décadas, gracias al auge de Internet, al desarrollo de los ordenadores… Mucho de lo que antes se apuntaba en papel, ahora se graba digitalmente en un ordenador. Y así hemos ido obteniendo cada vez más datos. Digamos ahora que en el eje vertical se representa el funcionamiento de un sistema de IA. Resulta que si se utiliza un sistema tradicional de IA, el funcionamiento crecería de la forma indicada en la figura de más abajo. Si se aportan más datos, su funcionamiento mejora un poco. Pero más allá de un cierto punto no mejora mucho más. Parece que el sistema de reconocimiento de voz no pueda llegar a ser más preciso, o que el sistema de publicidad en línea solo pudiera mostrar con una determinada precisión los anuncios más relevantes, aunque añadas más datos. La IA ha despegado de verdad recientemente gracias al auge de las redes neuronales y del aprendizaje profundo. Definiremos estos términos con más precisión en temas posteriores. Por ahora no te preocupes mucho por su significado. Con la IA moderna, con las redes neuronales y el aprendizaje profundo, hemos visto que si entrenas una pequeña red neuronal, obtienes un funcionamiento mejor que al anterior (ver gráfico), de forma que si añades más datos, el funcionamiento mejora durante mucho más tiempo. Si entrenas una red neuronal ligeramente mayor, digamos una red de tamaño medio, obtienes un funcionamiento todavía mejor. Si entrenas una gran red neuronal, el funcionamiento va mejorando cada vez más. Para aplicaciones como reconocimiento del habla, publicidad en línea, vehículos autónomos, en las que es importante obtener un buen resultado, muy preciso, se utilizan redes neuronales muy grandes.

Veamos ahora un par de conclusiones de esta imagen. Si quieres alcanzar un nivel de resultados máximo, necesitas dos cosas: una, contar con muchos datos. Por eso a veces se oye hablar de macrodatos (big data). Disponer de muchos datos casi siempre ayuda. La segunda es que necesitamos una red neuronal muy grande. El auge de los ordenadores rápidos, la ley de Moore, y también el auge de los procesadores especializados como las unidades de procesamiento gráfico o GPU, sobre los que te hablaremos más adelante, han permitido a muchas empresas, no solo a las grandes empresas tecnológicas, sino a muchas otras empresas, entrenar grandes redes neuronales con gran cantidad de datos para obtener resultados muy buenos. Entonces, se entiende que afirmemos que la base más importante de la IA actual ha sido el aprendizaje automático, básicamente el aprendizaje supervisado, que significa de aprendeizaje de A a B, o asignación de datos de entrada a salida. Lo que les permite trabajar realmente bien son los datos.

Tener más datos siempre ayuda a subir el rendimiento, pero para una cantidad dada de datos cuanto mayor es la red neuronal mejor es el rendimiento.

Curso Discussion