Bootstrap for estimating prediction intervals using nonparametric functional regression models of solar radiation
Bootstrap para calcular intervalos de previso usando modelos de regresso funcional no paramtricos de radiao solar
Correspondencia: david.zuniga@unach.edu.ec
Ciencias Tcnicas y Aplicadas
Artculo de Investigacin
* Recibido: 12 de junio de 2024 *Aceptado: 18 de julio de 2024 * Publicado: 30 de agosto de 2024
I. Universidad Nacional de Chimborazo, Riobamba, Ecuador.
II. Universidad Nacional de Chimborazo, Riobamba, Ecuador.
Resumen
La presente investigacin tuvo como objetivo el desarrollo de intervalos de prediccin en series de tiempo de radiacin solar, aplicando la metodologa bootstrap con modelos no paramtricos de regresin funcional. Para lo cual se registr por cada segundo la radiacin solar durante el ao 2023, en la estacin meteorolgica de la Facultad de Ingeniera de la Universidad Nacional de Chimborazo. Se realiz la limpieza de valores atpicos, la interpolacin de datos faltantes y se calcul la media horaria mensual. Los modelos de regresin se ajustaron utilizando B-splines, que capturo adecuadamente las caractersticas esenciales de cada serie temporal mensual. Se generaron 5000 rplicas de las series temporales mediante bootstrap, la cuales se usaron para predecir la radiacin solar de diciembre de 2023. La prediccin obtenida fue comparada con los datos reales, que mostraron una alta consistencia. Adems, se suavizaron las predicciones con bases de Fourier y se calcularon intervalos de confianza al 95%. Los resultados demuestran que la metodologa empleada es fiable, ya que proporcion intervalos de prediccin robustos. Este enfoque no solo mejora la comprensin de los patrones de radiacin solar a lo largo del ao, sino que tambin ofrece una herramienta valiosa para futuras aplicaciones en meteorologa.
Palabras clave: radiacin solar; series de tiempo; bootstrap; regresin funcional; modelo no paramtrico; Fourier.
Abstract
The present research aimed to develop prediction intervals in solar radiation time series, applying the bootstrap methodology with non-parametric functional regression models. For this, solar radiation was recorded for every second during the year 2023, at the meteorological station of the Faculty of Engineering of the National University of Chimborazo. Outliers were cleaned, missing data was interpolated, and the monthly hourly average was calculated. The regression models were adjusted using B-splines, which adequately captured the essential characteristics of each monthly time series. 5,000 replicas of the time series were generated using bootstrap, which were used to predict solar radiation for December 2023. The prediction obtained was compared with the real data, which showed high consistency. In addition, the predictions were smoothed with Fourier bases and 95% confidence intervals were calculated. The results demonstrate that the methodology used is reliable, since it provided robust prediction intervals. This approach not only improves the understanding of solar radiation patterns throughout the year, but also offers a valuable tool for future applications in meteorology.
Keywords: solar radiation; time series; bootstrap; functional regression; nonparametric model; Fourier.
Resumo
O objetivo desta investigao foi desenvolver intervalos de previso em sries temporais de radiao solar, aplicando a metodologia bootstrap com modelos de regresso funcional no paramtricos. Para o qual foi registada a radiao solar a cada segundo durante o ano de 2023, na estao meteorolgica da Faculdade de Engenharia da Universidade Nacional de Chimborazo. Foi realizada a limpeza de outliers, interpolao de dados em falta e clculo da mdia horria mensal. Os modelos de regresso foram ajustados atravs de B-splines, que capturaram adequadamente as caractersticas essenciais de cada srie temporal mensal. Foram geradas 5000 rplicas da srie temporal atravs de bootstrap, que foram utilizadas para prever a radiao solar para dezembro de 2023. A previso obtida foi comparada com os dados reais, que apresentaram uma elevada consistncia. Alm disso, as previses foram suavizadas com bases de Fourier e foram calculados intervalos de confiana a 95%. Os resultados demonstram que a metodologia utilizada fivel, uma vez que forneceu intervalos de previso robustos. Esta abordagem no s melhora a compreenso dos padres de radiao solar ao longo do ano, como tambm oferece uma ferramenta valiosa para futuras aplicaes em meteorologia.
Palavras-chave: radiao solar; sries temporais; inicializao; regresso funcional; modelo no paramtrico; Fourier.
Introduccin
El estudio del comportamiento de las variables meteorolgicas han sido un tema de gran importancia, debido a la aleatoriedad de datos influenciada por varios factores externos. Tradicionalmente, se han ajustado modelos de regresin de series de tiempo con resultados satisfactorios, especialmente para predicciones a corto y mediano plazo. Sin embargo, al intentar ampliar el tiempo de anlisis, las predicciones tienden a desviarse significativamente (Chariguamn Maurisaca & Meneses Freire, 2024). En este contexto, la presente investigacin se centra en la aplicacin de un modelo no paramtrico funcional para series de tiempo de radiacin solar, con el objetivo de mejorar la precisin de las predicciones. A travs de la metodologa bootstrap y la utilizacin de modelos B-Spline, se busca generar intervalos de prediccin ms confiables y representativos. Este enfoque no paramtrico adaptado a datos funcionales proporciona una herramienta robusta para el anlisis y prediccin de series temporales.
En esta investigacin se debe definir algunos conceptos importantes que se detallan a continuacin:
Modelos de regresin no paramtrico B-Spline
Los modelos de regresin no paramtricos ofrecen una estimacin adaptable de efectos no lineales, sin imponer restricciones relacionadas con una forma funcional especfica. Cuando se trata de una nica covariable continua x (Toalombo et al., 2022), el modelo estndar para la regresin no paramtrica se describe de la siguiente manera:
En relacin con la variable de error , se asume que la funcin f posee ciertas propiedades de suavidad, como la continuidad o diferenciabilidad, sin que se especifique una forma paramtrica concreta (Horvth & Kokoszka, 2012). Un spline es una funcin que se construye en segmentos a partir de funciones polinomiales, y su nombre se origina del concepto de "listn elstico" (Racine, 2023). Los splines "son curvas polinmicas por secciones que son continuamente diferenciables hasta un orden determinado" (Paluszny et al., 2005). Ejemplos comunes incluyen , un spline lineal por tramos, y , un spline cbico.
Funcin base B-spline
Una funcin B-spline es una funcin base interpolativa con mxima diferenciabilidad, que acta como una extensin de la curva de Bzier. Los B-splines se caracterizan por su orden m y la cantidad de nodos interiores N (existen dos puntos extremos que tambin son nodos, por lo que el total de nodos ser N + 2)(Pea, 2015). El grado del polinomio B-spline corresponde al orden de la spline menos uno, es decir, m-1 (Racine, 2022). Una B-spline de grado n (con un orden de spline m = n+1) es una curva paramtrica formada por una combinacin lineal de B-splines base de grado n (Boor, 2001). Se expresa de la siguiente manera:
La funcin f(x) tiene la siguiente estructura:
Donde:
K: nmeros de bases
parmetros desconocidos
funciones polinomiales
puntos de control o puntos de Boor
La secuencia t se denomina secuencia de nodos, donde cada trmino individual de la secuencia se conoce como un nodo (Racine, 2022). La regresin que utiliza B-splines de orden p se estructura de la siguiente manera:
Donde:
coeficientes a determinar.
El spline f(x) se puede representar como una combinacin lineal en la siguiente forma:
Las funciones que se presentan a continuacin conforman una base de funciones polinmicas para el spline:
La Figura 1 muestra las curvas B-spline de base correspondientes a un grado especfico del polinomio, el nmero de vrtices del polgono de control y los nodos internos.
Figura 1. B-spline de base para un modelo de regresin.
Fuente: (Toalombo et al., 2022)
Metodologa Bootstrap
El mtodo Bootstrap es una tcnica estadstica utilizada para aproximar la distribucin de muestreo, generalmente de un estadstico. Este mtodo se basa en remuestreo, lo que implica generar nuevas muestras de manera aleatoria a partir de la muestra original ((Meneses et al., 2018). Basndose en los principios generales de este mtodo y manteniendo la hiptesis nula, se calcula el intervalo de confianza para la diferencia de medias de dos muestras pareadas.
Modelo no paramtrico de series de tiempo funcionales
Uno de los mtodos ms comunes en el anlisis de series de tiempo es el modelo de regresin no paramtrico. Este modelo puede ampliarse para aplicarse a series de tiempo funcionales de la siguiente manera:
Xi(t) representa el i-simo dato funcional en el instante t, con t variando dentro de un intervalo de tiempo. La ecuacin (8) describe una serie de tiempo para cada instante t, ajustada con un modelo no paramtrico y un trmino de error, (Melo Martnez et al., 2020).
En esta investigacin, se utiliz el estimador de Nadaraya-Watson para m(X), basado en las ideas de (Aneiros-Prez et al., 2011), tal como se muestra en la ecuacin (9).
Donde:
h: ventana de suavizado
N: tamao de la muestra
K: funcin de ncleo
d: semimtrica que mide la distancia entre curvas utilizando el mtodo de anlisis de componentes principales funcionales
El trabajo se centr en el espacio L2 de funciones integrables mdulo al cuadrado como lo sugiere (Beyaztas & Shang, 2020). Para ajustar el modelo, se minimiz el error cuadrtico medio descrito en la ecuacin (11), utilizando una ventana de suavizado estimada obtenida a travs de validacin cruzada (CV), como se muestra en la ecuacin (12).
donde,
Siendo el estimador de Nadaraya-Watson calculado excluyendo la observacin i-sima de los datos (Meneses Freire et al., 2022).
Suavizado mediante bases de Fourier
El suavizado con bases de Fourier es una tcnica utilizada para representar y analizar funciones o seales mediante una combinacin de senos y cosenos de diferentes frecuencias. Esta tcnica es especialmente til para el anlisis de datos peridicos o cclicos. Se usa para descomponer una serie de tiempo en componentes cclicos y eliminar fluctuaciones ruidosas (Prez Gonzlez, 2006).
Metodologa
La investigacin es cuantitativa con diseo experimental, se aplica la metodologa bootstrap para calcular intervalos de prediccin utilizando modelos no paramtricos de regresin funcional en series de tiempo de variables meteorolgicas.
Los datos son obtenidos representan el registro por segundo de la radiacin solar, que han sido obtenidos en la estacin meteorolgica de la Facultad de Ingeniera de la UNACH durante el ao 2023, a los cuales fueron se realiz una limpieza de valores atpicos en Excel y la interpolacin de datos faltantes. Posteriormente, se calcul la media de radiacin solar por horas para cada mes del ao 2023.
El procedimiento en el software estadstico R fue el siguiente:
- Exploracin grfica de los datos procesados de radiacin solar, para identificar patrones, tendencias y posibles anomalas.
- Se emplearon B-splines para el ajuste de modelos de regresin, debido a su capacidad para adaptar curvas suaves y flexibles a los datos observados, asegurando que los modelos capturen adecuadamente las caractersticas esenciales de cada serie temporal mensual de radiacin solar.
- Aplicacin de la metodologa bootstrap, generando 5000 rplicas de las series temporales mensuales de radiacin solar. Cada rplica fue modelada utilizando los B-splines ajustados previamente, proporcionando una base robusta para la prediccin.
- Aplicacin del modelo no paramtrico funcional para predecir la serie temporal correspondiente al mes de diciembre del ao 2023. Esto se realiz para cada una de las rplicas, obteniendo as 5000 predicciones bootstrap. Se incluy tambin una prediccin basada en los datos reales, permitiendo comparar y evaluar la precisin y variabilidad de las predicciones obtenidas a travs del bootstrap.
- Suavizar las irregularidades presentes en las 5000 predicciones y mejorar la precisin mediante bases de Fourier.
- Finalmente, se calcularon bandas de confianza al 99% para las predicciones, proporcionando un intervalo donde se encuentren los valores de radiacin solar para el mes de diciembre del ao 2023.
Resultados y discusin
Grfico exploratorio de los datos:
En la figura 2, se observa las doce series temporales de radiacin solar, cada una representa la media de radiacin solar por hora para cada mes del ao 2023. Cada serie temporal presenta un pico alrededor del medioda. Este patrn es consistente a lo largo de todos los meses.
Figura 2: Curvas medias mensuales de radiacin solar en el ao 2023
Realizado por: Ziga Jorge, 2024
Radiacin solar media en los meses de enero a noviembre
En la figura 3, se observa las series temporales de enero a noviembre de 2023, son semejantes a una forma de campana. Cada serie temporal muestra un aumento gradual de la radiacin solar desde las 6:00 horas alcanzando un pico mximo alrededor del medioda, y luego disminuyendo gradualmente hasta las 18:00 horas.
Figura 3: Perfil diario de radiacin solar media de enero a noviembre en el ao 2023
Realizado por: Ziga Jorge, 2024
Predicciones de radiacin solar con el modelo no paramtrico funcional para el mes de diciembre del ao 2023
En la figura 4, se observa que la prediccin de la serie temporal del mes de diciembre, mediante el modelo no paramtrico funcional, es muy semejante a la serie temporal de los datos reales para este mes.
Figura 4: Medias de radiacin solar mensual con predicciones para diciembre del ao 2023
Realizado por: Ziga Jorge, 2024
Predicciones del modelo no paramtrico de regresin funcional de radiacin solar para el mes de diciembre del ao 2023
En la figura 5, se observa la comparacin grfica entre la prediccin del modelo no paramtrico de la serie temporal del mes de diciembre con los datos reales de este mes.
Figura 5: Serie temporal de radiacin solar y prediccin del modelo no paramtrico de regresin funcional para diciembre de 2023
Realizado por: Ziga Jorge, 2024
Clculo de 5000 simulaciones mediante modelos B-Spline de la serie temporal de radiacin solar de enero a noviembre del ao 2023
En la figura 6, se observa la variacin de las simulaciones de la radiacin solar para cada mes del ao 2023.
Figura 6: 5000 simulaciones mediante modelos B-Spline de la serie temporal de radiacin solar de enero a noviembre del ao 2023
Realizado por: Ziga Jorge, 2024
Metodologa Bootstrap para obtener 5000 rplicas de predicciones de series de tiempo de radiacin solar para diciembre del ao 2023
En la figura 7, se observa las 5000 rplicas formando una banda de predicciones de series de tiempo de radiacin solar para diciembre, ya que son muy semejantes, con una ligera variacin de las cuales se obtendrn los intervalos puntuales de prediccin para cada hora.
Figura 7: Predicciones de series de tiempo de radiacin solar utilizando el modelo no paramtrico funcional
Realizado por: Ziga Jorge, 2024
Aplicacin del modelo no paramtrico funcional para obtener 5000 rplicas Bootstrap de series de tiempo de radiacin solar para diciembre de 2023
En la figura 8, se observa la prediccin del modelo no paramtrico de radiacin solar del mes de diciembre, se encuentra dentro de los lmites de la banda de las 5000 predicciones bootstrap.
Figura 8: 5000 predicciones bootstrap de radiacin solar junto a la prediccin de diciembre 2023
Realizado por: Ziga Jorge, 2024
Suavizado de las 5000 predicciones bootstrap con bases de Fourier
En la figura 9, para mejor representacin de la banda se realiza un suavizado mediante bases de Fourier de las 5000 rplicas Bootstrap, se aprecia que luego de este proceso, la prediccin del modelo no paramtrico de radiacin solar del mes de diciembre, se mantiene dentro de los lmites de la banda de prediccin suavizada.
Figura 9: Suavizado de las 5000 predicciones bootstrap de radiacin solar con bases de Fourier y prediccin para diciembre 2023
Realizado por: Ziga Jorge, 2024
Intervalos de prediccin puntuales bootstrap al 95% de la serie temporal de radiacin solar
En la figura 10, se observan los intervalos de prediccin puntuales de 00:00 horas a 23:00 horas del da. La curva roja corresponde a la serie temporal de prediccin de radiacin solar mediante el mtodo no paramtrico, se encuentra dentro de los intervalos puntuales bootstrap al 95% de confianza.
Figura 10: Intervalos de prediccin puntuales bootstrap al 95% de la serie temporal de radiacin solar.
Realizado por: Ziga Jorge, 2024
Conclusiones
En el presente estudio se observ que los datos de radiacin solar en series de tiempo son muy semejantes en cada mes del ao 2023, presentando un patrn consistente con picos alrededor del medioda. Sin embargo, se identifican ligeras variaciones en los picos mximos de radiacin solar en algunos meses. Estos hallazgos permiten comprender mejor los patrones de radiacin solar a lo largo del ao y pueden ser tiles para futuras investigaciones en meteorologa.
Mediante los modelos de regresin B-Spline se obtuvo rplicas bootstrap muy similares a las series temporales de radiacin solar de cada mes. Estas rplicas se aplicaron mediante un mtodo no paramtrico para generar una banda de prediccin bootstrap, la cual contiene a la prediccin de la serie temporal de radiacin solar del mes de diciembre.
Se obtuvo intervalos de confianza puntuales bootstrap al 95% para la serie temporal de radiacin solar del mes de diciembre de 2023, demostrando que la prediccin se encuentra dentro de estos intervalos. Esto confirma la fiabilidad del modelo en la estimacin de los datos. Este intervalo de confianza proporciona una medida robusta de la variabilidad y la incertidumbre en las predicciones, validando as la efectividad del enfoque bootstrap en la modelizacin de datos de radiacin solar y en futuras predicciones de otras variables meteorolgicas.
Referencias
1. Aneiros-Prez, G., Cao, R., & Vilar-Fernndez, J. M. (2011). Functional methods for time series prediction: A nonparametric approach. Journal of Forecasting, 30(4), 377-392. https://doi.org/10.1002/for.1169
2. Beyaztas, U., & Shang, H. L. (2020). On function-on-function regression: partial least squares approach. Environmental and Ecological Statistics, 27(1), 95-114. https://doi.org/10.1007/S10651-019-00436-1/METRICS
3. Boor, C. de. (2001). A Practical Guide to Splines - Revised Edition. En Springer-Verlag, New York (Vol. 115). Springer. https://link.springer.com/book/9780387953663
4. Chariguamn Maurisaca, N. E., & Meneses Freire, M. A. (2024). Modelos de regresin funcional con respuesta funcional aplicados a las variables meteorolgicas, temperatura, humedad, presin y radiacin. Tesla Revista Cientfica, 4(1), e317. https://doi.org/10.55204/trc.v4i1.e317
5. Horvth, L., & Kokoszka, P. (2012). Inference for Functional Data with Applications. 200. https://doi.org/10.1007/978-1-4614-3655-3
6. Melo Martnez, C. E., Diego, &, Malagn Mrquez, A., David, D., & Forero, R. (2020). Interpoladores determinsticos espacio-temporales, series detiempo y anlisis de datos funcionales para el estudio y prediccinde la precipitacin en Cundinamarca y Bogot D.C. 2017-2020. http://revistas.udistrital.edu.co/ojs/index.php/azimut
7. Meneses, A., Ziga, L., Santos, C., Haro, S., Chariguamn, N., & Vera, L. (2018). Mtodo Bootstrap para hiptesis concernientes a la diferencia de medias para muestras pareadas: aplicaciones. Perfiles, 2(20), 100-106. https://doi.org/10.47187/PERF.V2I20.39
8. Meneses Freire, A., Muoz Cargua, J., Ziga Lema, L., Lara Sinaluisa, J., & Acurio Martnez, W. (2022). Modelo no paramtrico funcional predictivo en series de tiempo funcionales. aplicacin en variables meteorolgicas. Perfiles, 1(28), 83-89. https://doi.org/10.47187/PERF.V1I28.186
9. Paluszny, M., Prautzsch, H., & Boehm, W. (2005). Mtodos de Bzier y B-splines. Universittsverlag Karlsruhe, 303. https://doi.org/10.5445/KSP/1000002481
10. Pea, D. (2015). Anlisis de series temporales (Alianza Editorial). Alianza Editorial. https://www.alianzaeditorial.es/libro/manuales/analisis-de-series-temporales-daniel-pena-9788420669458/
11. Prez Gonzlez, J. (2006). Ecuaciones diferenciales series de fourier transformadas de fourier y laplace. https://www.ugr.es/~fjperez/textos/eedd_laplace_fourier.pdf
12. Racine, J. S. (2022). A primer on regression splines. https://cran.r-project.org/web/packages/crs/vignettes/spline_primer.pdf
13. Racine, J. S. (2023). The crs Package. https://doi.org/https://doi.org/10.32614/CRAN.package.crs
14. Toalombo, B., Meneses, A., Ziga, L., & Espn, R. (2022). Modelos de regresin paramtricos polinomiales y no paramtricos B-splines. una aplicacin en ingeniera. Perfiles, 1(28), 72-82. https://doi.org/10.47187/PERF.V1I28.185
2024 por los autores. Este artculo es de acceso abierto y distribuido segn los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
(https://creativecommons.org/licenses/by-nc-sa/4.0/).
Enlaces de Referencia
- Por el momento, no existen enlaces de referencia
Polo del Conocimiento
Revista Científico-Académica Multidisciplinaria
ISSN: 2550-682X
Casa Editora del Polo
Manta - Ecuador
Dirección: Ciudadela El Palmar, II Etapa, Manta - Manabí - Ecuador.
Código Postal: 130801
Teléfonos: 056051775/0991871420
Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com
URL: https://www.polodelconocimiento.com/