• Raul Nugis, Author |
4 mins read

Paljukiidetud masinõpe on edumeelne, tänapäevane tööriist, mida andmeanalüütikud kasutavad riskide ja võiduvõimaluste hindamiseks. Andmeanalüütiku tööriistakastis on masinõpe samas üheks keerulisemaks, kapriissemaks ja rohkelt seadistamist nõudvaks. Ebameeldiv on ka see, et andmeanalüütik, kes seda nüüdisaegset prognoosimeetodit kasutada soovib, ei saa olla tulemuses kindel kuni viimasedki seadistused on lõpuni viidud. Alles seejärel selgub asjaolu, kas väljaehitatud mudel on võimeline oodatud tulevikku – nõudlust, pakkumist, hinda – ennustama. Kui vajalikud ettevalmistused on juba tehtud ja aega on kulutatud, mõjub avastus, et mudel ei tööta ja see tuleb ümber ehitada, demotiveerivalt.

Nõudluse ennustamine on siiski võimalik

Üheks paljudest valdkondadest, kus masinõpet kasutatakse, on nõudluse ennustamine. Kui tegemist on ettevõttega, kes sõltub nõudlusest, tarnetest ja peab oma sisendeid planeerima, on masinõpe heaks võimaluseks turu ootustele vastata. Kuid, küsite teie, kas eepool ei väitnud mina, et see tehnika on keeruline? Et keerukusega toime tulla, tulevad appi pilveplatvormide automatiseeritud masinõppe lahendused. Google AI blog toob välja, viitega McKinsey uurimustööle, et majandusvaldkondades, kus nõudluse ennustamine on asjakohane, saab laovarusid ca 5% vähendada ning müüke 2-3% suurendada. Google AI blog toonitab ka seda, et pilveplatvormid on sellise ennustamise paljuski lihtsaks tehtud ennustamise automaatika (Forecasting AutoML) abil.

Et näidata iseendale ja teistele skeptikutele, et jaekauba nõudluse ennustamine on ka päriselt võimalik, tegin ma katseid müügiandmetega. Katsete tulemusi arutasin ma hiljuti KPMG korraldatud e-kaubanduse teemalisel webinaril. Andmeid katseteks sain ma Kagglest. Platvormiks, kus katseid läbi viia, võtsin Microsofti Azure ML ja laadisin sinna üles andmestiku anonüümseks jääda soovinud USA poeketi kauba päevamüükidega. Andmestik kätkeb endas müügiandmete pikka ajalugu ja näeb välja selline:

01.01.2013 – müüdud 33 tk

02.01.2013 – müüdud 37 tk

03.01.2013 – müüdud 46 tk

04.01.2013 – müüdud 51 tk

Ja nii edasi. Nagu Kaggles (see on andmeanalüütikute katsetamisplatvorm) kombeks, on andmed päriselust, kuid andmete omanik, pood, toode, mis ostetakse, kliendid, kes toodet ostavad - kõik see füüsilise maailma teadmine, oli konkreetsel juhul andmetest eemaldatud. Seega ei ole teada, kas toode, mis müüakse on  talveriided, ujumisrõngad, autod, burgerid või midagi muud.

Enne kui hakata müüki ennustama võiks küsida, milleks. Arusaadavalt aitaks nõudluse ennustamine, kui see täppi läheb, tarnida ette piisavalt kaupa, vältida kauba laojäägi tekkimist, tagada, et kliendid on rahul, kuna nendele vastu ei vaata tühi poeriiul, ja et väljaminekud kauba tarnimiseks on heas suhtes müügituluga.

Mudel kui kogenud ostujuht

Kuid kas saab üldse tarnet ennustada ilma, et oleks teada, mis kaubaga tegu on ning millised on klientide ostuharjumused? Kui ma olen jaanuaris müünud sada paari sooje sokke, kas see tähendab, et ma müün ka aprillis sada paari sooje sokke? Me kõik teame, et see nii ei ole, kuid me teame seda tänu sellele, et me mõistame sõnade „jaanuar“ ja „soojad sokid“ tähendust. Sama ülesanne ei oleks sellises püstituses mõeldav, kui meil ei oleks teada kauba nimetust.

Olles andmestiku üles laadinud käivitan ma ennustuse nupust – see on nii lihtne tänu moodsate pilveplatvormide kõrgele andmetöötlusvõimekusele. Mõne minuti järel treeniski pilveplatvorm valmis mudeli. Mudel suutis ennustada järgneva kuu müüki sellise läbinägelikkusega, mida minu arusaamise kohaselt suudab vaid kogenud ostujuht, kes seda kaupa on käes hoidnud. Nutikate algoritmite najal suutis mudel müüki ennustada ilma, et tal olekski üldse teada, mis liiki kaubaga tegu on.

Kuidas seda saavutati? Loomulikult võtsid algoritmid appi trendide tuvastuse. Kuid nad tegid seda suures mastaabis. Dokumentatsiooni kohaselt kontrollib algoritm üksnes kalendriandmete põhjal vähemalt 11 trendi olemasolu.

Milliseid trende mudel kalendriandmetes kontrollib? Mõistagi aastaseid trende, kvartalipõhiseid trende, kuu- ja trende, nädalapäeva põhiseid trende. Samuti riigipühade, aga ka riigipühadele eelnevate päevade trende. Tuleb vaid valida välja vastava riigi, kus meilt kaupa ostavad jaekliendid elavad, kalender. Kui meil oleks andmestik tunni täpsusega, kontrolliks mudel ka ööpäeva – öö versus päev jne - trende.

Konkreetse kauba kohta sain ma teada, et see müüb palju paremini reedest pühapäevani. Ja ei müü üldse talvel. Et müügi esimesel kolmel aastal võis selle kauba osas oodata selle müügi kasvu, kuid hiljem müük stabiliseerub. Et kõige raskem selle müüki – täpsemalt müügi kukkumist - ennustada on detsembris.

Joonis: Jätkuvalt tundmatu kaup müüb hästi reedest (4. päev) pühapäevani (6. päev). Kuna see ei müü üldse talvel, kas see võib olla jäätis või jalgrattakumm? PILT

Kokkuvõtteks

Vaatamata kõigele saate te küsida, et kui poeketil on kogenud ostujuht, saab ta ise teha igasuguseid kõveraid. Ta tunneb kaupa, statistilisi analüüsimeetodeid ja nende najal koostab ta müügiprognoosi ise. Ostujuhid on nutikad küll, kuid müügitegevuses tänapäeval kätkeb endas tihti tuhandeid tooteid korraga. Kas keegi jõuab analüüsida hambaharjade müügitrende, kui analüüsi vajavad veel autolõhnastajad, hiirelõksud, kummikindad ja grillrestid? Pilveplatvormidel on mõistagi siin eelis. Eespool kirjeldatud näites katsetasin ühe tootega, kuid pilveplatvormidel on olemas liidestusvõimalusi ja sinna saab laadida sadu või tuhandeid tooteid, genereerides selle kaudu ennustusi suurele osale, kui mitte kogu kaubasortimendile.