Sådan undgår du strømpebukser og sparer penge i efterspørgsel

Foto af Markus Spiske på Unsplash

I efterspørgselsprognoseopgaven bruger vi typisk en periode på at forudsige det næste lagerbeholdning, vi har brug for for at imødekomme kundernes efterspørgsel. Denne periode er en tidslinje, der repræsenterer lager i fortiden (ugentligt, årligt osv.). I forudsigelsesopgaven kan disse punkter, når de opfører sig underligt, have en enorm indflydelse på fremtiden og generere dårlige prognoser og følgelig tabet af penge. Men hvornår forekommer dette, og hvordan kan man undgå det?

I dette indlæg vil jeg præsentere et scenarie med dette problem og en meget nyttig teknik, der kan bruges til at undgå det.

Forespørgsel efter behov

Forespørgsel om efterspørgsel er at forudsige kundeadfærd, foregribe ønsker og behov. Når prognosen er meget nøjagtig, kan der spares en masse penge og bruges til et andet felt, såsom marketing, økonomi, teknologi osv., Men på den anden side kan en dårlig prognose medføre, at en masse penge går tabt.

Når vi nedbryder tidsserierne, der repræsenterer et produkthistorisk salg, kan vi få nogle rig information, som hvordan er produktets salgsadfærd i en generel oversigt (trend) eller hvordan disse produkter opfører sig på nogle datoer (f.eks. Jul) i tid (sæsonbestemmelse).

tidsserier og trend.tidsserier og sæsonbestemmelse.

Lad os antage, at vores tidsserie fortalte os, at et produkt, vi ønsker at forudsige efterspørgsel, solgt 25 enheder i de sidste to juledatoer, antager antagelig, at der er information om sæsonbestemmelser her, og næste jul vil sælge 25 enheder. Men hvornår har vores tidsserier nogle huller, der indikerer, at der ikke er noget lager, selv når der er efterspørgsel? Dette problem kaldes stockout og kan opstå, når nogle planlægning, markedsføring eller andre strategier er mislykkedes. Denne fiasko efterlader dataene vildledende oplysninger, der i sidste ende påvirker modelleringsprocessen, hvilket medfører en enorm indflydelse på fremtidige prognoser.

Genererede stockout-tidsskrifter.

Interpolation

Dette er en matematisk teknik, der bruges til at opdage eller udfylde en eller anden værdi, hvor der ikke er information; Med andre ord opretter det et nyt datasæt fra et kendt datasæt. Der er mange tilgange til denne teknik, og hver er nyttig til nogle formål. I dette indlæg bruger jeg lineære, polynomiske, PAD og nærmeste teknikker til at sammenligne resultaterne. Pandas-biblioteket har et modul, der hjælper os med denne opgave.

Metrics

For at evaluere eksperimenterne blev der anvendt nogle målinger såsom MAPE, MSE, RMSE og BIAS. Jeg forklarer ikke disse beregninger i dette indlæg. For mere information om dem, se dette indlæg.

Eksperimenter og resultater

Til vores eksperimentelle data bruger jeg dette datasæt til at illustrere problemet, hvor nogle tilfældigt valgte punkter i tidsserien blev defineret som stockouts for at sammenligne opførslen ved interpolationsmetoder. Eksperimenterne blev udført ved hjælp af Lorenzo F. Antunes.

tidsserier med genererede lageroplysninger

I dette eksperiment brugte jeg XGBoost med enkle tidsmæssige funktioner.

DataFrame med brugte funktioner.

Hver interpolationsmetode blev anvendt på tidsserier med stockouts for at sammenligne virkningen på prognoser. Resultaterne kan ses nedenfor.

Forudsigelser ved hjælp af reelle data.Forudsigelser uden forbehandling i tidsserier med lager.Lineær interpolering.Interpolering PAD.Interpolation tættest.Interpolationspolynom.

Virkningen af ​​interpolering kan ses i nedenstående tabel. Resultatet af forudsigelser, der bruger interpolering som forarbejdning i dataene, kan generere resultater meget tæt på værdierne fra data med original information.

Når dataene handler om at forudsige efterspørgsel, kan hver meget lille gevinst ved prognose undgå tab af penge, og brug af interpolationsmetoder, når dataene har nogle lager, kan være den bedste løsning.