Maestría en Ingeniería - Énfasis en Estadística
URI permanente para esta colección
Navegar
Examinando Maestría en Ingeniería - Énfasis en Estadística por Materia "Estadística"
Mostrando 1 - 4 de 4
Resultados por página
Opciones de ordenación
Publicación Acceso abierto Análisis de correspondencias multiples en presencia de datos faltantes: el principio de datos disponibles del algoritmo NIPALS( ACMpdd)(Universidad del Valle, 2018) Ochoa Muñoz, Andrés Felipe; González Rojas, Víctor ManuelEl Análisis de Correspondencias Múltiples (ACM) en presencia de datos faltantes usualmente se trabaja eliminando los registros en donde exista el dato faltante, algunas veces se elimina toda la fila o toda la columna de la matriz de datos, lo cual no es adecuado ya que al realizarlo se pierde información relevante sobre algún individuo o variable del estudio. En algunos otros casos, se asume que el dato faltante es una categoría de la variable cualitativa, trayendo como consecuencia mayor dispersión de varianza en los nuevos ejes. Una solución para esta situación puede ser la imputación del dato faltante o utilizar un algoritmo que permita trabajar con la presencia de ´este tipo de datos. Este trabajo se centra en realizar el método ACM en presencia de datos faltantes sin acudir a técnicas de imputación, para esto se utiliza el principio de datos disponibles del algoritmo NIPALS (Wold et al., 1966). En el caso de ACM los autores Josse et al. (2012) y Audigier et al. (2015) han trabajado con el enfoque de imputación de datos y no se conocen trabajos o ideas que intenten trabajar ACM bajo el principio de datos disponibles; usando NIPALS. Por esta razón, este trabajo de investigación propone una forma de trabajar los datos faltantes con ACM usando el principio de datos disponibles. De tal manera, que se conforman las matrices simétricas en Rp y en Rn, obteniendo los valores y vectores propios; a su vez garantizando las relaciones de transición y las propiedades de ortogonalidad en los ejes factoriales. En una primera instancia se analizó los resultados del ACM en una base de datos completa, luego se generaron aleatoriamente 1000 matrices con el 5%, 10%, 15% y hasta un 50% de datos faltantes. En cada una de las matrices se evaluó el ACM bajo el principio de datos disponibles (ACMpdd) y un método de ACM con el enfoque imputación. Se compararon los planos factoriales, la inercia total y el poder descriptivo con datos completos y faltantes. Se encontró´ que en ACMpdd a medida que aumenta el porcentaje de datos faltantes el poder descriptivo disminuye. Por otro lado, con el método de imputación, se encontró que a medida que aumenta el porcentaje de datos faltantes el poder descriptivo aumenta, situación que no es coherente, por que se espera que a mayor porcentaje de datos faltantes se explique menos variabilidad en los ejes.Publicación Acceso abierto Modelamiento del desempeño de los estudiantes universitarios en el primer curso de estadística(Universidad del Valle, 2019) Peláez García, Ernesto; Tovar Cuevas, Jose RafaelLos estudiantes universitarios que ingresan a un primer curso de estadística, llegan con preconcepciones, temores, y con algunos conocimientos básicos, si han tenido la oportunidad en los colegios de secundaria, de ver algunos temas relacionados con la estadística. En muchas de las universidades de carácter privado, el fracaso de los estudiantes, originado por afrontar los primeros cursos de matemática universitaria y en este caso en particular, por afrontar un primer curso de estadística, es de gran preocupación. En este sentido la presente investigación quiere indagar, especialmente en alguna de las universidades privadas del sur de Cali, los conocimientos previos, antecedentes académicos, temores, entre otros factores que podrían amenazar el rendimiento y resultado de los estudiantes en un primer curso universitario de estadística, teniendo en cuenta carreras con fuerte componente matemático y las que no lo tienenPublicación Acceso abierto Un modelo lineal mixto con covariable funcional aplicado a datos de concentración de clorofila.(2019-05-16) Gómez Escobar, Gustavo Adolfo; Andrade Bejarano, Mercedes; Giraldo Henao, RamónEl presente trabajo de investigación tiene como objetivo modelar la concentración de clorofila en plantas de ají de tabasco a través de un modelo lineal mixto con covariable funcional. Las plantas han sido sometidas a dos fuentes de estrés causados por el tipo de fertilizante y el nivel de riego, también se usa la firma espectral como covariable funcional. Se propone dos alternativas para involucra la firma espectral como covariable funcional en el modelo lineal mixto. Por medio de bandas de confianza se encontró que la firma espectral es significativo para explicar la concentración de clorofilaPublicación Acceso abierto Uso de variables latentes para estimar el origen más probable de un evento sísmico(Universidad del Valle, 2019) Martínez Muñoz, Juan Camilo; Tovar Cuevas, Jose Rafael; Ospina Ostios, Lina MaríaEste trabajo de investigación presenta una propuesta metodológica para resolver el problema conjunto Hipocentro-Modelo de Velocidad considerando la forma probabilística y no lineal del problema inverso. La incertidumbre de los tiempos de arribo y modelos de velocidad es analizada y modelada por variables aleatorias que involucran la subjetividad e información externa de los datos y parámetros del fenómeno físico. El problema hacia adelante es descrito por la solución de la ecuación de onda para medios no homogéneos a través de la ecuación Eikonal o cálculo de tiempos de viaje de rayos sísmicos, considerando la metodología de Monte Carlo para diferentes escenarios de posición inicial y con¿guración de modelos de velocidad. La selección de focos probables considera las variables aleatorias construidas para los tiempos de arribo registrados por estaciones sismológicas y los tiempos de viaje aleatorios calculados. Las estimaciones obtenidas con la propuesta metodológica son validadas empíricamente usando el concepto de convergencia en probabilidad de sucesiones de variables aleatorias. Finalmente, la solución del problema conjunto Hipocentro-Modelo de Velocidad es resumida por los valores esperados de los las sucesiones de variables aleatorias de los parámetros hipocentrales y modelos de velocidad probabilísticos