El problema de elegir una película

Un problema de ver una película de netflix o Blockbuster, es el tiempo perdido que usamos para elegir dicha película y esto se agrava cuando es un grupo de personas  va a disfrutar de una película seleccionada sabiamente.

Preguntando y observando el comportamiento de las personas al momento de elegir, me di cuenta que la mayoría de las veces nos inclinamos por un titulo, por la composición gráfica de la portada, y posteriormente vemos el titulo, reparto, duración año, etc;

De lo anterior podemos conjeturar que la perdida de tiempo se puede explicar en mayor parte por los colores que presentan las portadas de las películas; interesante dato!!

Revisando sitios de Internet, llegue con IMDb que nos ofrece una gran base de datos sobre el mundo de la industria fílmica.

Usando los carteles de las 250 mejores películas de “todos los tiempos” (al 04 marzo 2014), calcule la distancia entre las las imagénes, usando Mathematica y el método EarthMoverDistance que estima las diferencias entre los histogramas de color de dos imágenes, con esto se obtuvo una matriz simétrica que contiene las distancias  entre todos los pares de imágenes:

pel01

La matriz aparece con manchas oscuras que corresponden a grandes similitudes visuales entre las películas

Las distancias entre las imágenes proporcionan información acerca de las similitudes de los carteles de cine. Esta información se puede expresar en un grafo donde los nodos se corresponden con las películas y las aristas corresponden a la fuerte similitud.

peli02

En esta representación, que no se ve mucho más allá del sentido común: un grupo grande de interconectados carteles oscuros, así como un segundo grupo de carteles de colores claros. Algunas películas están  aislados, como The Shawshank Redemption que es de rating alto.

Ya que tenemos lo anterior, aumentamos la información en nuestra grafo con el rating generado por el usuario común. Esto genera una  aplicación para ayudar a los espectadores seleccionar su próxima película,

Sobre la base de lo que acaban de ver, ¿cómo puedo sugerir algunas películas relevantes? Sólo tiene que seleccionar los cinco vértices  similares en el gráfico, suponiendo implícitamente que los aficionados al cine recomiendan o no la película que ven. Por ejemplo, para alguien que acaba de ver la vida de Pi, me gustaría recomendar Toy Story 3, The Killing, The Shawshank Redemption,o navegar por las listas de genero de aventuras y dramas.

El proceso de navegación en un grafo de este tipo ponderado basado en las probabilidades de transición de un vértice a otro se llama una caminata aleatoria. En lugar de utilizar la matriz de adyacencia del grafo  como una matriz de transición, vamos a modificar para que se pueda modelar el aburrimiento por ver una gran permanencia voluntaria de 250 películas . Tarde o temprano, el cinéfilo se cansará de ver películas similares en secuencia, y en busca de aire fresco, cambiará aleatoriamente a otra película. Para tener en cuenta este tipo de comportamiento, usaremos como matriz de transición una combinación lineal de matriz de adyacencia del grafo y una matriz constante de transiciones equiprobables con  la excepción de que las entradas diagonales de esta matriz constante se establecen  en cero, ya que ningún espectador aburrido va para ver la misma película de manera continua.

Finalmente puedo escoger mi película favorita Odisea 2001 y de manera inteligente me da varias sucesiones  de películas y géneros, para que pueda disfrutar del séptimo arte

pel03

Referencias

 Matthias Odisio

Mathematica, Wolfram

WolframAlpha

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s