����������������������������������������������������������������������������������
Bootstrap for estimating prediction intervals using nonparametric functional regression models of solar radiation
Bootstrap para calcular intervalos de previs�o usando modelos de regress�o funcional n�o param�tricos de radia��o solar
![]() |
|||
![]() |
Correspondencia: david.zuniga@unach.edu.ec
Ciencias T�cnicas y Aplicadas
Art�culo de Investigaci�n
* Recibido: 12 de junio de 2024 *Aceptado: 18 de julio de 2024 * Publicado: �30 de agosto de 2024
I. Universidad Nacional de Chimborazo, Riobamba, Ecuador.
II. Universidad Nacional de Chimborazo, Riobamba, Ecuador.
Resumen
La presente investigaci�n tuvo como objetivo el desarrollo de intervalos de predicci�n en series de tiempo de radiaci�n solar, aplicando la metodolog�a bootstrap con modelos no param�tricos de regresi�n funcional. Para lo cual se registr� por cada segundo la radiaci�n solar durante el a�o 2023, en la estaci�n meteorol�gica de la Facultad de Ingenier�a de la Universidad Nacional de Chimborazo. Se realiz� la limpieza de valores at�picos, la interpolaci�n de datos faltantes y se calcul� la media horaria mensual. Los modelos de regresi�n se ajustaron utilizando B-splines, que capturo adecuadamente las caracter�sticas esenciales de cada serie temporal mensual. Se generaron 5000 r�plicas de las series temporales mediante bootstrap, la cuales se usaron para predecir la radiaci�n solar de diciembre de 2023. La predicci�n obtenida fue comparada con los datos reales, que mostraron una alta consistencia. Adem�s, se suavizaron las predicciones con bases de Fourier y se calcularon intervalos de confianza al 95%. Los resultados demuestran que la metodolog�a empleada es fiable, ya que proporcion� intervalos de predicci�n robustos. Este enfoque no solo mejora la comprensi�n de los patrones de radiaci�n solar a lo largo del a�o, sino que tambi�n ofrece una herramienta valiosa para futuras aplicaciones en meteorolog�a.
Palabras clave: radiaci�n solar; series de tiempo; bootstrap; regresi�n funcional; modelo no param�trico; Fourier.
Abstract
The present research aimed to develop prediction intervals in solar radiation time series, applying the bootstrap methodology with non-parametric functional regression models. For this, solar radiation was recorded for every second during the year 2023, at the meteorological station of the Faculty of Engineering of the National University of Chimborazo. Outliers were cleaned, missing data was interpolated, and the monthly hourly average was calculated. The regression models were adjusted using B-splines, which adequately captured the essential characteristics of each monthly time series. 5,000 replicas of the time series were generated using bootstrap, which were used to predict solar radiation for December 2023. The prediction obtained was compared with the real data, which showed high consistency. In addition, the predictions were smoothed with Fourier bases and 95% confidence intervals were calculated. The results demonstrate that the methodology used is reliable, since it provided robust prediction intervals. This approach not only improves the understanding of solar radiation patterns throughout the year, but also offers a valuable tool for future applications in meteorology.
Keywords: solar radiation; time series; bootstrap; functional regression; nonparametric model; Fourier.
Resumo
O objetivo desta investiga��o foi desenvolver intervalos de previs�o em s�ries temporais de radia��o solar, aplicando a metodologia bootstrap com modelos de regress�o funcional n�o param�tricos. Para o qual foi registada a radia��o solar a cada segundo durante o ano de 2023, na esta��o meteorol�gica da Faculdade de Engenharia da Universidade Nacional de Chimborazo. Foi realizada a limpeza de outliers, interpola��o de dados em falta e c�lculo da m�dia hor�ria mensal. Os modelos de regress�o foram ajustados atrav�s de B-splines, que capturaram adequadamente as caracter�sticas essenciais de cada s�rie temporal mensal. Foram geradas 5000 r�plicas da s�rie temporal atrav�s de bootstrap, que foram utilizadas para prever a radia��o solar para dezembro de 2023. A previs�o obtida foi comparada com os dados reais, que apresentaram uma elevada consist�ncia. Al�m disso, as previs�es foram suavizadas com bases de Fourier e foram calculados intervalos de confian�a a 95%. Os resultados demonstram que a metodologia utilizada � fi�vel, uma vez que forneceu intervalos de previs�o robustos. Esta abordagem n�o s� melhora a compreens�o dos padr�es de radia��o solar ao longo do ano, como tamb�m oferece uma ferramenta valiosa para futuras aplica��es em meteorologia.
Palavras-chave: radia��o solar; s�ries temporais; inicializa��o; regress�o funcional; modelo n�o param�trico; Fourier.
Introducci�n
El estudio del comportamiento de las variables meteorol�gicas han sido un tema de gran importancia, debido a la aleatoriedad de datos influenciada por varios factores externos. Tradicionalmente, se han ajustado modelos de regresi�n de series de tiempo con resultados satisfactorios, especialmente para predicciones a corto y mediano plazo. Sin embargo, al intentar ampliar el tiempo de an�lisis, las predicciones tienden a desviarse significativamente (Chariguam�n Maurisaca & Meneses Freire, 2024). En este contexto, la presente investigaci�n se centra en la aplicaci�n de un modelo no param�trico funcional para series de tiempo de radiaci�n solar, con el objetivo de mejorar la precisi�n de las predicciones. A trav�s de la metodolog�a bootstrap y la utilizaci�n de modelos B-Spline, se busca generar intervalos de predicci�n m�s confiables y representativos. Este enfoque no param�trico adaptado a datos funcionales proporciona una herramienta robusta para el an�lisis y predicci�n de series temporales.
En esta investigaci�n se debe definir algunos conceptos importantes que se detallan a continuaci�n:
Modelos de regresi�n no param�trico B-Spline
Los modelos de regresi�n no param�tricos ofrecen una estimaci�n adaptable de efectos no lineales, sin imponer restricciones relacionadas con una forma funcional espec�fica. Cuando se trata de una �nica covariable continua �x� (Toalombo et al., 2022), el modelo est�ndar para la regresi�n no param�trica se describe de la siguiente manera:
En
relaci�n con la variable de error ,
se asume que la funci�n f posee ciertas propiedades de suavidad, como la
continuidad o diferenciabilidad, sin que se especifique una forma param�trica
concreta (Horv�th & Kokoszka, 2012). Un spline es una funci�n que se
construye en segmentos a partir de funciones polinomiales, y su nombre se
origina del concepto de "list�n el�stico" (Racine, 2023). Los splines
"son curvas polin�micas por secciones que son continuamente diferenciables
hasta un orden determinado" (Paluszny et al., 2005). Ejemplos comunes
incluyen
�,
un spline lineal por tramos, y
,
un spline c�bico.
Funci�n base B-spline
Una
funci�n B-spline es una funci�n base interpolativa con m�xima
diferenciabilidad, que act�a como una extensi�n de la curva de B�zier. Los
B-splines se caracterizan por su orden m y la cantidad de nodos
interiores N (existen dos puntos extremos que tambi�n son nodos, por lo
que el total de nodos ser� N + 2)(Pe�a, 2015). El grado del polinomio
B-spline corresponde al orden de la spline menos uno, es decir, m-1 (Racine,
2022). Una B-spline de grado n (con un orden de spline m = n+1) es una curva
param�trica formada por una combinaci�n lineal de B-splines base �de
grado n (Boor, 2001). Se expresa de la siguiente manera:
La funci�n f(x) tiene la siguiente estructura:
Donde:
K: n�meros de bases
�par�metros
desconocidos
�funciones
polinomiales
�puntos
de control o puntos de Boor
La secuencia t se denomina secuencia de nodos, donde cada t�rmino individual de la secuencia se conoce como un nodo (Racine, 2022). La regresi�n que utiliza B-splines de orden p se estructura de la siguiente manera:
Donde:
�coeficientes
a determinar.
El spline f(x) se puede representar como una combinaci�n lineal en la siguiente forma:
Las funciones que se presentan a continuaci�n conforman una base de funciones polin�micas para el spline:
La Figura 1 muestra las curvas B-spline de base correspondientes a un grado espec�fico del polinomio, el n�mero de v�rtices del pol�gono de control y los nodos internos.
Figura 1. B-spline de base para un modelo de regresi�n.
Fuente: (Toalombo et al., 2022)
Metodolog�a Bootstrap
El m�todo Bootstrap es una t�cnica estad�stica utilizada para aproximar la distribuci�n de muestreo, generalmente de un estad�stico. Este m�todo se basa en remuestreo, lo que implica generar nuevas muestras de manera aleatoria a partir de la muestra original ((Meneses et al., 2018). Bas�ndose en los principios generales de este m�todo y manteniendo la hip�tesis nula, se calcula el intervalo de confianza para la diferencia de medias de dos muestras pareadas.
Modelo no param�trico de series de tiempo funcionales
Uno de los m�todos m�s comunes en el an�lisis de series de tiempo es el modelo de regresi�n no param�trico. Este modelo puede ampliarse para aplicarse a series de tiempo funcionales de la siguiente manera:
Xi(t)
representa el i-�simo dato funcional en el instante t, con t variando dentro de
un intervalo de tiempo. La ecuaci�n (8) describe una serie de tiempo para cada
instante t, ajustada con un modelo no param�trico y un t�rmino de error, �(Melo
Mart�nez et al., 2020).
En esta investigaci�n, se utiliz� el estimador de Nadaraya-Watson para m(X), basado en las ideas de (Aneiros-P�rez et al., 2011), tal como se muestra en la ecuaci�n (9).
Donde:
h: ventana de suavizado
N: tama�o de la muestra
K: funci�n de n�cleo
d: semim�trica que mide la distancia entre curvas utilizando el m�todo de an�lisis de componentes principales funcionales
El
trabajo se centr� en el espacio L2 de funciones integrables
m�dulo al cuadrado como lo sugiere (Beyaztas & Shang, 2020). Para ajustar
el modelo, se minimiz� el error cuadr�tico medio descrito en la ecuaci�n (11),
utilizando una ventana de suavizado estimada �obtenida
a trav�s de validaci�n cruzada (CV), como se muestra en la ecuaci�n
(12).
donde,
Siendo
�el
estimador de Nadaraya-Watson calculado excluyendo la observaci�n i-�sima de los
datos (Meneses Freire et al., 2022).
Suavizado mediante bases de Fourier
El suavizado con bases de Fourier es una t�cnica utilizada para representar y analizar funciones o se�ales mediante una combinaci�n de senos y cosenos de diferentes frecuencias. Esta t�cnica es especialmente �til para el an�lisis de datos peri�dicos o c�clicos. Se usa para descomponer una serie de tiempo en componentes c�clicos y eliminar fluctuaciones ruidosas (P�rez Gonz�lez, 2006).
Metodolog�a
La investigaci�n es cuantitativa con dise�o experimental, se aplica la metodolog�a bootstrap para calcular intervalos de predicci�n utilizando modelos no param�tricos de regresi�n funcional en series de tiempo de variables meteorol�gicas.
Los datos son obtenidos representan el registro por segundo de la radiaci�n solar, que han sido obtenidos en la estaci�n meteorol�gica de la Facultad de Ingenier�a de la UNACH durante el a�o 2023, a los cuales fueron se realiz� una limpieza de valores at�picos en Excel y la interpolaci�n de datos faltantes. Posteriormente, se calcul� la media de radiaci�n solar por horas para cada mes del a�o 2023.
El procedimiento en el software estad�stico R fue el siguiente:
- Exploraci�n gr�fica de los datos procesados de radiaci�n solar, para identificar patrones, tendencias y posibles anomal�as.
- Se emplearon B-splines para el ajuste de modelos de regresi�n, debido a su capacidad para adaptar curvas suaves y flexibles a los datos observados, asegurando que los modelos capturen adecuadamente las caracter�sticas esenciales de cada serie temporal mensual de radiaci�n solar.
- Aplicaci�n de la metodolog�a bootstrap, generando 5000 r�plicas de las series temporales mensuales de radiaci�n solar. Cada r�plica fue modelada utilizando los B-splines ajustados previamente, proporcionando una base robusta para la predicci�n.
- Aplicaci�n del modelo no param�trico funcional para predecir la serie temporal correspondiente al mes de diciembre del a�o 2023. Esto se realiz� para cada una de las r�plicas, obteniendo as� 5000 predicciones bootstrap. Se incluy� tambi�n una predicci�n basada en los datos reales, permitiendo comparar y evaluar la precisi�n y variabilidad de las predicciones obtenidas a trav�s del bootstrap.
- Suavizar las irregularidades presentes en las 5000 predicciones y mejorar la precisi�n mediante bases de Fourier.
- Finalmente, se calcularon bandas de confianza al 99% para las predicciones, proporcionando un intervalo donde se encuentren los valores de radiaci�n solar para el mes de diciembre del a�o 2023.
Resultados y discusi�n
Gr�fico exploratorio de los datos:
En la figura 2, se observa las doce series temporales de radiaci�n solar, cada una representa la media de radiaci�n solar por hora para cada mes del a�o 2023. Cada serie temporal presenta un pico alrededor del mediod�a. Este patr�n es consistente a lo largo de todos los meses.
Figura 2: Curvas medias mensuales de radiaci�n solar en el a�o 2023
Realizado por: Z��iga Jorge, 2024
Radiaci�n solar media en los meses de enero a noviembre
En la figura 3, se observa las series temporales de enero a noviembre de 2023, son semejantes a una forma de campana. Cada serie temporal muestra un aumento gradual de la radiaci�n solar desde las 6:00 horas alcanzando un pico m�ximo alrededor del mediod�a, y luego disminuyendo gradualmente hasta las 18:00 horas.
Figura 3: Perfil diario de radiaci�n solar media de enero a noviembre en el a�o 2023
Realizado por: Z��iga Jorge, 2024
Predicciones de radiaci�n solar con el modelo no param�trico funcional para el mes de diciembre del a�o 2023
En la figura 4, se observa que la predicci�n de la serie temporal del mes de diciembre, mediante el modelo no param�trico funcional, es muy semejante a la serie temporal de los datos reales para este mes.
Figura 4: Medias de radiaci�n solar mensual con predicciones para diciembre del a�o 2023
Realizado por: Z��iga Jorge, 2024
Predicciones del modelo no param�trico de regresi�n funcional de radiaci�n solar para el mes de diciembre del a�o 2023
En la figura 5, se observa la comparaci�n gr�fica entre la predicci�n del modelo no param�trico de la serie temporal del mes de diciembre con los datos reales de este mes.
Figura 5: Serie temporal de radiaci�n solar y predicci�n del modelo no param�trico de regresi�n funcional para diciembre de 2023
Realizado por: Z��iga Jorge, 2024
C�lculo de 5000 simulaciones mediante modelos B-Spline de la serie temporal de radiaci�n solar de enero a noviembre del a�o 2023
En la figura 6, se observa la variaci�n de las simulaciones de la radiaci�n solar para cada mes del a�o 2023.
Figura 6: 5000 simulaciones mediante modelos B-Spline de la serie temporal de radiaci�n solar de enero a noviembre del a�o 2023
Realizado por: Z��iga Jorge, 2024
Metodolog�a Bootstrap para obtener 5000 r�plicas de predicciones de series de tiempo de radiaci�n solar para diciembre del a�o 2023
En la figura 7, se observa las 5000 r�plicas formando una banda de predicciones de series de tiempo de radiaci�n solar para diciembre, ya que son muy semejantes, con una ligera variaci�n de las cuales se obtendr�n los intervalos puntuales de predicci�n para cada hora.
Figura 7: Predicciones de series de tiempo de radiaci�n solar utilizando el modelo no param�trico funcional
Realizado por: Z��iga Jorge, 2024
Aplicaci�n del modelo no param�trico funcional para obtener 5000 r�plicas Bootstrap de series de tiempo de radiaci�n solar para diciembre de 2023
En la figura 8, se observa la predicci�n del modelo no param�trico de radiaci�n solar del mes de diciembre, se encuentra dentro de los l�mites de la banda de las 5000 predicciones bootstrap.
Figura 8: 5000 predicciones bootstrap de radiaci�n solar junto a la predicci�n de diciembre 2023
Realizado por: Z��iga Jorge, 2024
Suavizado de las 5000 predicciones bootstrap con bases de Fourier
En la figura 9, para mejor representaci�n de la banda se realiza un suavizado mediante bases de Fourier de las 5000 r�plicas Bootstrap, se aprecia que luego de este proceso, la predicci�n del modelo no param�trico de radiaci�n solar del mes de diciembre, se mantiene dentro de los l�mites de la banda de predicci�n suavizada.
Figura 9: Suavizado de las 5000 predicciones bootstrap de radiaci�n solar con bases de Fourier y predicci�n para diciembre 2023
Realizado por: Z��iga Jorge, 2024
Intervalos de predicci�n puntuales bootstrap al 95% de la serie temporal de radiaci�n solar
En la figura 10, se observan los intervalos de predicci�n puntuales de 00:00 horas a 23:00 horas del d�a. La curva roja corresponde a la serie temporal de predicci�n de radiaci�n solar mediante el m�todo no param�trico, se encuentra dentro de los intervalos puntuales bootstrap al 95% de confianza.
Figura 10: Intervalos de predicci�n puntuales bootstrap al 95% de la serie temporal de radiaci�n solar.
Realizado por: Z��iga Jorge, 2024
Conclusiones
En el presente estudio se observ� que los datos de radiaci�n solar en series de tiempo son muy semejantes en cada mes del a�o 2023, presentando un patr�n consistente con picos alrededor del mediod�a. Sin embargo, se identifican ligeras variaciones en los picos m�ximos de radiaci�n solar en algunos meses. Estos hallazgos permiten comprender mejor los patrones de radiaci�n solar a lo largo del a�o y pueden ser �tiles para futuras investigaciones en meteorolog�a.
Mediante los modelos de regresi�n B-Spline se obtuvo r�plicas bootstrap muy similares a las series temporales de radiaci�n solar de cada mes. Estas r�plicas se aplicaron mediante un m�todo no param�trico para generar una banda de predicci�n bootstrap, la cual contiene a la predicci�n de la serie temporal de radiaci�n solar del mes de diciembre.
Se obtuvo intervalos de confianza puntuales bootstrap al 95% para la serie temporal de radiaci�n solar del mes de diciembre de 2023, demostrando que la predicci�n se encuentra dentro de estos intervalos. Esto confirma la fiabilidad del modelo en la estimaci�n de los datos. Este intervalo de confianza proporciona una medida robusta de la variabilidad y la incertidumbre en las predicciones, validando as� la efectividad del enfoque bootstrap en la modelizaci�n de datos de radiaci�n solar y en futuras predicciones de otras variables meteorol�gicas.
Referencias
1. Aneiros-P�rez, G., Cao, R., & Vilar-Fern�ndez, J. M. (2011). Functional methods for time series prediction: A nonparametric approach. Journal of Forecasting, 30(4), 377-392. https://doi.org/10.1002/for.1169
2. Beyaztas, U., & Shang, H. L. (2020). On function-on-function regression: partial least squares approach. Environmental and Ecological Statistics, 27(1), 95-114. https://doi.org/10.1007/S10651-019-00436-1/METRICS
3. Boor, C. de. (2001). A Practical Guide to Splines - Revised Edition. En Springer-Verlag, New York (Vol. 115). Springer. https://link.springer.com/book/9780387953663
4. Chariguam�n Maurisaca, N. E., & Meneses Freire, M. A. (2024). Modelos de regresi�n funcional con respuesta funcional aplicados a las variables meteorol�gicas, temperatura, humedad, presi�n y radiaci�n. Tesla Revista Cient�fica, 4(1), e317. https://doi.org/10.55204/trc.v4i1.e317
5. Horv�th, L., & Kokoszka, P. (2012). Inference for Functional Data with Applications. 200. https://doi.org/10.1007/978-1-4614-3655-3
6. Melo Mart�nez, C. E., Diego, &, Malag�n M�rquez, A., David, D., & Forero, R. (2020). Interpoladores determin�sticos espacio-temporales, series detiempo y an�lisis de datos funcionales para el estudio y predicci�nde la precipitaci�n en Cundinamarca y Bogot� D.C. 2017-2020. http://revistas.udistrital.edu.co/ojs/index.php/azimut
7. Meneses, A., Z��iga, L., Santos, C., Haro, S., Chariguam�n, N., & Vera, L. (2018). M�todo Bootstrap para hip�tesis concernientes a la diferencia de medias para muestras pareadas: aplicaciones. Perfiles, 2(20), 100-106. https://doi.org/10.47187/PERF.V2I20.39
8. Meneses Freire, A., Mu�oz Cargua, J., Z��iga Lema, L., Lara Sinaluisa, J., & Acurio Mart�nez, W. (2022). Modelo no param�trico funcional predictivo en series de tiempo funcionales. aplicaci�n en variables meteorol�gicas. Perfiles, 1(28), 83-89. https://doi.org/10.47187/PERF.V1I28.186
9. Paluszny, M., Prautzsch, H., & Boehm, W. (2005). M�todos de B�zier y B-splines. Universit�tsverlag Karlsruhe, 303. https://doi.org/10.5445/KSP/1000002481
10. Pe�a, D. (2015). An�lisis de series temporales (Alianza Editorial). Alianza Editorial. https://www.alianzaeditorial.es/libro/manuales/analisis-de-series-temporales-daniel-pena-9788420669458/
11. P�rez Gonz�lez, J. (2006). Ecuaciones diferenciales series de fourier transformadas de fourier y laplace. https://www.ugr.es/~fjperez/textos/eedd_laplace_fourier.pdf
12. Racine, J. S. (2022). A primer on regression splines. https://cran.r-project.org/web/packages/crs/vignettes/spline_primer.pdf
13. Racine, J. S. (2023). The crs Package. https://doi.org/https://doi.org/10.32614/CRAN.package.crs
14. Toalombo, B., Meneses, A., Z��iga, L., & Esp�n, R. (2022). Modelos de regresi�n param�tricos polinomiales y no param�tricos B-splines. una aplicaci�n en ingenier�a. Perfiles, 1(28), 72-82. https://doi.org/10.47187/PERF.V1I28.185
� 2024 por los autores. Este art�culo es de acceso abierto y distribuido seg�n los t�rminos y condiciones de la licencia Creative Commons Atribuci�n-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
(https://creativecommons.org/licenses/by-nc-sa/4.0/).
�������������������������������������������������������������������������������������������������������������������������
Enlaces de Referencia
- Por el momento, no existen enlaces de referencia
Polo del Conocimiento
Revista Científico-Académica Multidisciplinaria
ISSN: 2550-682X
Casa Editora del Polo
Manta - Ecuador
Dirección: Ciudadela El Palmar, II Etapa, Manta - Manabí - Ecuador.
Código Postal: 130801
Teléfonos: 056051775/0991871420
Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com
URL: https://www.polodelconocimiento.com/