The number pad

Posts

Características generales de vivienda en Guatemala

Más allá de proveer el número de habitantes en Guatemala, el Censo 2018 es una fuente importante de otros datos a nivel nacional que nos permiten describir, entender, y actuar con base a la realidad del país. Una parte importante de los datos censados la conforman los datos referentes a las condiciones de vivienda en Guatemala. El primer dato que encontramos es que se registraron aproximadamente 3.2 millones de viviendas. Esto nos da un promedio de entre 3 y 4 habitantes por vivienda. El Progreso y Zacapa son los departamentos con menos habitantes por vivienda, mientras Quiché y Alta Verapaz son los que más habitantes por vivienda reportan. Doce municipios presentan un promedio arriba de cinco habitantes por vivienda, siendo Concepción, Sololá el más alto con un promedio arriba de 6 habitantes por vivienda. La mitad de estos municipios con alta densidad por vivienda se encuentran en Alta Verapaz, siendo el municipio de Tamahú el más denso. Por otro lado, 15 municipios tienen u

¿Porqué pierden matemática los alumnos de bachillerato?

Como parte de las actividades de Converciencia , fui parte de un Taller de Datos que buscaba compartir herramientas y métodos de análisis de datos. En el taller que impartí nos enfocamos a dos métodos que a mi gusto son muy útiles a la hora de analizar gran cantidad de datos: Análisis Factorial (PCA) y Análisis Cluster. Como ejemplo de Análisis Factorial, utilizamos los datos de la evaluación de graduandos del Ministerio de Educación de Guatemala. Esta evaluación es administrada a todos los estudiantes que se gradúan de nivel medio. Es una evaluación que mide competencias en matemática y lenguaje. Dentro de los datos tomados por el Ministerio de Educación, se encuentra una serie de variables que miden diversos aspectos de cada uno de los estudiantes. Se tiene al rededor de 200 variables que miden desde el tipo de vivienda, la localidad donde viven, la educación de los padres, y otros factores que pudieran influir en el rendimiento de los alumnos. Con esto realizamos u

Proyección de Presidente con Aprendizaje de Máquinas

El ser humano siempre ha intentado predecir el futuro. El misticismo, la fortuna y la astrología han sido reflejo del deseo del humano de ver el provenir. Hoy en día tenemos otras herramientas para predecir el futuro. La ciencia provee, de alguna manera, una ventana al futuro por medio de utilizar leyes naturales y las leyes de la lógica para realizar inferencias. Por ejemplo, al soltar una piedra a la orilla de un puente, podemos predecir que la piedra caerá, esto debido a la Ley de la Gravedad. Sin embargo, para muchos ámbitos de la vida aún no poseemos leyes naturales que puedan describirlos a cabalidad. Los terremotos, huracanes y la economía son algunos ejemplos de fenómenos que no podemos predecir del todo. Si bien es posible describirlos de una manera más certera, aún no poseemos un entendimiento de dichos fenómenos para poder formular leyes naturales como en la física o química. En el caso de las elecciones, no poseemos una teoría general que nos permita predecir los res

Más allá de las encuestas: El Análisis de datos

La ciencia de datos es una herramienta que ha venido a revolucionar el mundo actual. Cada vez tenemos acceso a más y más datos, los cuales son generados cada segundo por medio de nuestras interacciones en las redes sociales, así como transacciones en el mundo real. Tradicionalmente las encuestas han sido los principales indicadores de intención de voto para elecciones. Sin embargo, es posible utilizar la ciencia de datos para obtener y analizar tendencias de la población de una manera complementaria a las encuestas. Muchas veces las encuestas son objeto de crítica y de incredulidad, debido a que pueden presentar datos inesperados, y a veces hasta inconsistentes. Es necesario recordar que en este aspecto, las encuestas presentan dos funciones: la recolección de datos y la inferencia, a partir de dichos datos, del comportamiento de toda la población. Esto se realiza con cierta significancia estadística, lo cual quiere decir que siempre se está sujeto a un error debido princi

Elecciones en Guatemala y Ciencia de Datos

A mediados de este año tendremos nuevas elecciones en Guatemala. Las elecciones siempre son una excelente oportunidad para realizar investigación. Son sucesos que generan mucha expectativa y atención, y por ende, una buena fuente de datos y un muy buen laboratorio para experimentar modelos. Para las elecciones anteriores, realicé un modelo de proyección que estimaba los resultados de la primera vuelta. Utilizando datos de las encuestas publicadas, hice un modelo utilizando Cadenas de Markov, el cual arrojó datos, con un mes de anticipación, con un margen de un 3% de los valores obtenidos en la primera vuelta. Para estas elecciones, he decidido realizar otro análisis, esta vez un poco más a detalle. Para esto, he dividido el proceso en tres partes: Minería de datos Análisis de datos Proyección Minería de Datos En este artículo describiré un poco de la primer parte del proceso. Antes de pensar en modelos de proyección, es importante considerar los datos que

La matemática que proyecta al Campeón del Mundo

Con el inicio del mundial me dediqué a jugar un poco con datos para realizar modelos de predicción de los encuentros. Ha sido una buena experiencia para pensar más en lo que en realidad significa realizar modelos de predicción, así como para ponerle más entusiasmo al torneo. En primer lugar, es importante hablar sobre lo que significa predecir o proyectar un resultado. Es imposible predecir el futuro como tal, sin embargo, es posible crear modelos que den una tendencia hacia algún resultado. Modelos determinísticos se basan en leyes fundamentales para modelar fenómenos. Por ejemplo, en la física, los modelos de movimiento de los cuerpos ofrecen trayectorias teóricas que describen su movimiento. En la práctica, estos modelos dan resultados aproximados de las trayectorias, debido a errores de medición, incertezas, y demás errores presentes en los parámetros y variables presentes. Por esto, dichos modelos presentan un modelo con cierto margen de error . Con métodos más precisos d

Using math to extract information from social data

Many people say we are in the information era, but it seems that we are passed this. Nowadays, information is within everyone's reach, about everything and as much as we want. Data is not the issue anymore, at least most of the time. The real issue is how to analyze the data. It seems that having information is not the problem now, but actually having too much data. One of the places in which we can find too much data are social networks. The richness of social networks is that they are a continuous flow of interesting data, what I like to call social data . Social data is so rich as you can extract information from it in so many ways. One is to analyze what people express over a specific topic on social media. To this end, I developed a way to identify the most important ideas found on a stream of user comments. Basically an algorithmic summary tool. With a data set of a few tens of user comments, it is easy to grasp the general feelings and thoughts that