Skip to main content

Posts

Showing posts with the label ciencia de datos

Las elecciones a pesar del netcenter y las fake news

Como es costumbre, desde hace ya dos elecciones atrás  1,2 , he estado analizando datos sobre la intención de voto en las próximas las elecciones en Guatemala. En esta ocasión obtengo que los tres partidos con mayores probabilidades de pasar a segunda vuelta son UNE, CABAL y VALOR-UNIONISTA. Esto lo consigo analizando datos y utilizando modelos matemáticos para su tratamiento. Esta es una labor difícil dada la poca cantidad de datos disponibles en Guatemala, la múltiple cantidad de candidatos y la veracidad de los datos disponibles, entre otras cosas. A pesar de esto, es posible analizar el proceso electoral y obtener conclusiones que puedan darnos una idea de lo que está pasando. Si bien no es posible  predecir  el futuro, es posible  analizar  el presente con la información disponible. Datos, datos, datos Para realizar cualquier tipo de análisis cuantitativo, es necesario tener acceso a una buena cantidad de datos y que estos sean confiables. Varias de las proyecciones más exitosas d

Más allá de las encuestas: El Análisis de datos

La ciencia de datos es una herramienta que ha venido a revolucionar el mundo actual. Cada vez tenemos acceso a más y más datos, los cuales son generados cada segundo por medio de nuestras interacciones en las redes sociales, así como transacciones en el mundo real. Tradicionalmente las encuestas han sido los principales indicadores de intención de voto para elecciones. Sin embargo, es posible utilizar la ciencia de datos  para obtener y analizar tendencias de la población de una manera complementaria a las encuestas.  Muchas veces las encuestas son objeto de crítica y de incredulidad, debido a que pueden presentar datos inesperados, y a veces hasta inconsistentes. Es necesario recordar que en este aspecto, las encuestas presentan dos funciones: la recolección de datos y la inferencia, a partir de dichos datos, del comportamiento de toda la población. Esto se realiza con cierta significancia estadística, lo cual quiere decir que siempre se está sujeto a un error debido princi

Elecciones en Guatemala y Ciencia de Datos

A mediados de este año tendremos nuevas elecciones en Guatemala. Las elecciones siempre son una excelente oportunidad para realizar investigación. Son sucesos que generan mucha expectativa y atención, y por ende, una buena fuente de datos y un muy buen laboratorio para experimentar modelos. Para las elecciones anteriores, realicé un modelo de proyección  que estimaba los resultados de la primera vuelta. Utilizando datos de las encuestas publicadas, hice un modelo utilizando Cadenas de Markov, el cual arrojó datos, con un mes de anticipación, con un margen de un 3% de los valores obtenidos en la primera vuelta.  Para estas elecciones, he decidido realizar otro análisis, esta vez un poco más a detalle. Para esto, he dividido el proceso en tres partes: Minería de datos Análisis de datos Proyección  Minería de Datos En este artículo describiré un poco de la primer parte del proceso. Antes de pensar en modelos de proyección, es importante considerar los datos que