¿Parque o pájaro? Analizando imagenes

Hace unos días un pequeño comic de xkcd explicaba lo que sufrimos todos en sistemas, los pedidos pelotudos, creo que ya hice como veinte posts al respecto pero este resumía otra de las variables, el diferencial de costo entre una idea y el "agregame esta boludez a la idea":



Ahora bien, imaginen que salen del caso general y van al caso particular que explicaba la imagen, si, te puedo detectar donde se sacó la foto y saber si fue en un parque nacional, buena idea, pero ¿Detectar que hay un pajarito en la imagen? Bueno, aunque no lo crean, la gente de Flickr lo hizo :D

El equipo de Flickr Vision estaba trabajando justo en esta misma idea, es algo que ya se conoce hace bastante y cuesta un poco hacer, pero no es imposible, Google lo viene haciendo y hace poco presentaron su versión de la idea, que en el caso de ellos tiene mucho sentido a la hora de asistir las búsquedas más relevantes, claro, tienen una base de datos de imagenes gigante.

De hecho, hay todo un concurso para esto, el Large Scale Visual Recognition Challenge, y esta año tuvo muy interesantes resultados.

En el caso de Flickr también tiene mucho sentido ya que muchos fotógrafos podrían vender mejor sus imagenes si la búsqueda fuese más eficiente, los tags suenan bien siempre y cuando la gente cargue realmente en los tags lo que tiene la imagen, pero son falseables, muchos fotógrafos de cuarta harían "SEO de imagenes" con los tags, en cambio a partir del contenido mentir es imposible.

Para poder entender una imagen hay que adentrarse en el "deep convolutional neural network", oh si, malditas redes neuronales, el Deep Learning no es para cualquiera, son algoritmos complejos que "aprenden", la teoría es interesante, la aplicación difícil, el resultado fantástico, pero no me voy a poner a aprender esto ahora, ya estoy viejo :D



En resumen se toma la imagen, se la descompone en pequeñas porciones reconocibles, cada capa es analizada y catalogada por un algoritmo y así va descubriendo qué hay allí, luego de hacer lo mismo a millones de imagenes el algoritmo va aprendiendo y comparando, mejorando cada vez su capacidad de interpretar las siguientes imagenes. Aquí tienen un paper de Matt Zeiler y Rob Fergus al respecto.

Para resumir esto los de Flickr crearon, en honor a xkcd, Park or Bird, un site donde uno puede probar si detecta de cada foto qué cuernos es, un parque nacional o un ave. Es decir, los cinco años y el equipo de desarrollo dieron sus resultados :D

Si te gustó esta nota podés...
Invitame un café en cafecito.app


Otros posts que podrían llegar a gustarte...

Comentarios

  • eduqlm     22/10/2014 - 12:26:56

    Para mi algo así debe hacer JDownloader...

  • Damian     22/10/2014 - 13:38:23

    Probé la aplicación de Flickr y solo funciona con fotos con buena resolución, le tire 3 fotos de pájaros sacadas por mi y nada.
    Están lejos los muchachos aún.

  • Roberto     22/10/2014 - 14:47:59

    Pasa en muchos ámbitos, yo laburo como perito y los jueces pasan de pedir pavadas a pedir boludeces imposibles (gracias csi)

  • Cattel     22/10/2014 - 15:56:31

    Me recordó la inteligencia artificial de Google que después de meses de analizar internet salió con la imagen un poco tenebrosa de un gatito. Skynet va a ser mucho más raro de lo que imaginamos!

    Esto es un servicio útil para detectar las fotos hot y hacerlas públicas antes de que venga cualquiera y las hackee.

  • Den     25/10/2014 - 13:45:12

    Damian dijo:

    Probé la aplicación de Flickr y solo funciona con fotos con buena resolución, le tire 3 fotos de pájaros sacadas por mi y nada.
    Están lejos los muchachos aún.


    O podrías dejar de usar una papa para sacar fotos.

Deje su comentario:

Tranquilo, su email nunca será revelado.
La gente de bien tiene URL, no se olvide del http/https

Negrita Cursiva Imagen Enlace


Comentarios ofensivos o que no hagan al enriquecimiento del post serán borrados/editados por el administrador. Los comentarios son filtrados por ReCaptcha V3.