La respuesta a esta pregunta es NO EXISTE UNA CANTIDAD MÍNIMA O MÁXIMA DE DATOS HISTÓRICOS para ejecutar un proceso de pronósticos.
La cantidad ideal de datos históricos para realizar un proceso de pronósticos puede variar según el tipo de pronóstico a utilizar y la complejidad del fenómeno a analizar. En términos generales, contar con un conjunto de datos extenso y representativo puede mejorar la asertividad del proceso de pronóstico. Sin embargo, la calidad de los datos y la estabilidad de condiciones externas también son factores que determinan el número de datos a analizar.
En algunos casos, modelos predictivos pueden requerir grandes cantidades de datos, mientras que en otros, un conjunto más pequeño pero “bien seleccionado” podría ser suficiente. Es esencial evaluar cada situación de manera específica.
Cuando nos referimos a la complejidad de los fenómenos, hacemos énfasis a fenómenos como: el crecimiento económico, el %PIB, el consumo per cápita, el precio del dólar, el clima, la demanda de un producto, etc.
Por ejemplo, para pronosticar la demanda, es recomendable trabajar por lo menos con 24 periodos mensuales, este número de periodos proporciona una visión más completa de los patrones estacionales, tendenciales y cíclicos, sin embargo, la elección del número de datos dependerá de la naturaleza del producto, la variabilidad de la demanda y la disponibilidad de datos relevantes, además, considerar factores externos como cambios en el mercado o eventos especiales puede ser crucial para ajustar y mejorar la predicción.
Es relevante tener en cuenta los siguientes aspectos para determinar el número de datos históricos:
Tipo de producto
La naturaleza del producto y su ciclo de vida influyen en la cantidad de datos, si se desconoce en qué etapa del ciclo de vida se encuentra y usted toma los datos históricos desde su lanzamiento, el modelo de pronóstico puede incurrir en sesgo debido a que los valores de los datos de la etapa de lanzamiento son menores a los valores de los datos en la etapa de madurez o viceversa.
Factores Estacionales
Cuantos más ciclos estacionales puedas identificar en tus datos, mejor podrás entender la naturaleza y la regularidad de las estacionalidades. Un conjunto de datos más extenso que abarque múltiples ciclos estacionales proporcionará una base más sólida para prever patrones futuros. Si estás tratando con estacionalidades a nivel mensual, anual, trimestral, etc., necesitarás suficientes datos en cada período para capturar la variación estacional de manera efectiva, estacionalidades como: navidad, san Valentín, halloween, vacaciones, escolar, fiestas patronales y nacionales, entre otros, marcan un patrón de comportamiento en un conjunto de datos y para que un modelo de pronóstico identifique ese patrón se requerirán como mínimo 24 datos históricos mensuales.
Variabilidad
Uno de los retos más apremiantes en la planeación de demanda es cuando se enfrenta a una serie de datos con una alta variabilidad con coeficientes de variación por encima del 1.0, en casos muy específicos con coeficientes por encima de 0.5 se vuelve complejo pronosticar, en algunos casos, la variabilidad puede deberse a factores a corto plazo que no afectan las tendencias a largo plazo. Para situaciones de alta variabilidad no se recomienda utilizar menos de 12 datos históricos debido a que el modelo no lograría identificar si la variabilidad de los datos es temporal o es recurrente, para este tipo de series de tiempo es recomendable analizar 36 datos históricos mensuales o más, después ir descartando aquellos datos o periodos que generan la distorsión o variabilidad.
En situaciones con alta variabilidad, puede ser más apropiado proporcionar datos o grupo de datos en forma de rangos o en intervalos de tiempo en lugar de valores puntuales (agregar a nivel de periodo).
Cambios en el Mercado
Eventos económicos, competencia o cambios regulatorios pueden afectar la demanda. En mercados que han experimentado cambios en el pasado, es beneficioso contar con un historial significativo de datos recomendable mayor a 36 registros. Esto permite analizar cómo el mercado ha respondido a situaciones similares en el pasado y puede proporcionar insights valiosos para prever futuros cambios.
En algunos casos, especialmente cuando se anticipan cambios rápidos, la integración de datos en tiempo real puede ser esencial. Esto permite ajustar los pronósticos de manera dinámica a medida que evolucionan las condiciones del mercado, Asegúrese de tener datos que reflejen los aspectos clave del mercado que se verán afectados por los cambios anticipados. Esto podría incluir datos de ventas, comportamiento del consumidor, tendencias económicas, entre otros.
Dependiendo de la velocidad con la que se esperan los cambios, puede ser necesario trabajar con datos más frecuentes (mayor granularidad) para capturar los cambios a corto plazo.
Calidad de los Datos
De nada sirve contar con un extenso conjunto de datos, si los datos no reflejan la realidad de lo ocurrido, es mejor trabajar con pocos datos pero consistentes. Los modelos de pronóstico dependen en gran medida de la calidad de los datos de entrada. Si los datos contienen errores, sesgos o están incompletos, los modelos generarán pronósticos inexactos.
La confiabilidad de los datos se refiere a su consistencia y estabilidad a lo largo del tiempo. Los datos inconsistentes o que varían significativamente pueden afectar la capacidad de los modelos de pronósticos, al igual que la falta de datos o datos incompletos puede llevar a lagunas en la información.
Los datos deben ser íntegros haciendo referencia a su calidad. Los errores en la entrada de datos, duplicaciones o inconsistencias pueden afectar la confiabilidad de los resultados, la implementación de prácticas sólidas de gestión de datos, como la limpieza regular de datos, la validación y la actualización constante.
Intervalos de Tiempo
Este intervalo, también conocido como frecuencia temporal, se refiere a la distancia entre puntos de datos sucesivos, comúnmente conocido como “granularidad”.
La granularidad del tiempo se refiere a cuán detallada es la información temporal. Puedes tener intervalos de tiempo diarios, horarios, mensuales, anuales, etc. La elección de la granularidad debe adaptarse a la naturaleza del problema y a la disponibilidad de datos. La elección del intervalo de tiempo también está vinculada a la capacidad de recopilar y procesar datos. Intervalos de tiempo más cortos pueden requerir más recursos y capacidad de procesamiento.
Dependiendo de la granularidad escogida así mismo seria el número de datos a analizar, por ejemplo realizar la estimación de la frecuencia de la parada del bus, para este caso la granularidad es a nivel de “hora” y en un día obtendrás unos 18 a 20 registros y en el mes obtendrás 600 registros aproximadamente dependiendo de la franja horaria que tenga establecido el sistema de transporte urbano.
Efectos Externos
La cantidad de datos necesarios para realizar un pronóstico cuando existen efectos externos depende de la naturaleza de esos efectos y de la complejidad del sistema que estás tratando de modelar. Comienza identificando y comprendiendo los efectos externos que podrían influir en tus resultados. Esto podría incluir factores como eventos climáticos, cambios en las regulaciones gubernamentales, fluctuaciones económicas, pandemias u otros eventos imprevistos.
Reúne datos históricos que estén directamente relacionados con los efectos externos que podrían afectar tus pronósticos. Estos datos te ayudarán a comprender cómo el sistema ha respondido en el pasado a situaciones similares, recopila datos contextuales que puedan ayudar a explicar y comprender la interacción entre los factores externos y tus variables de interés. Esto puede incluir datos demográficos, datos geográficos, etc.
Dada la incertidumbre asociada con los efectos externos, considera utilizar técnicas de modelado de escenarios. Esto implica desarrollar varios escenarios posibles basados en diferentes condiciones externas y evaluar cómo cada escenario afectaría tus pronósticos, en situaciones donde los efectos externos son complejos y difíciles de modelar, la colaboración con expertos en el campo puede ser valiosa. La experiencia humana puede proporcionar perspectivas que los modelos puramente cuantitativos podrían pasar por alto.
Conclusión
Los modelos de pronóstico desempeñan un papel crucial al analizar y entender patrones pasados, proporcionando una interpretación de lo que ha ocurrido en un determinado conjunto de datos. Sin embargo, es esencial destacar que estos modelos interpretan eventos históricos y patrones pasados, no anticipan de manera directa lo que ocurrirá en el futuro. Su función principal radica en identificar tendencias, estacionalidades y relaciones en datos previos para informar sobre posibles escenarios futuros. La interpretación de datos históricos permite a los modelos ofrecer perspectivas valiosas sobre cómo ciertos factores han influido en el pasado, brindando así una base para realizar proyecciones y pronósticos. No obstante, la incertidumbre inherente a eventos futuros significa que los modelos de pronóstico deben ser utilizados con cautela y considerados como herramientas de apoyo, con la comprensión de que no pueden predecir de manera infalible lo que sucederá en el futuro.
Acerca de JOSÉ ANDRÉS ROSAS
correo electroníco: joserosassoluciones@hotmail.com