Parašęs paskutinį blogpostą (kuriame demonstravau, kaip padaryta duomenų proceso valdymo klaida gali reikšti visuomenės manipuliavimą pasinaudojant klaidingą informacija ir renkantis politinius dividendus bei menkinant Vyriausybės darbą, nors paanalizavus duomenis pasirodo, jog tokie pareiškimai iš esmės yra be pagrindo), susilaukiau gausios reakcijos. Ir visai ne apie tai kiek šaldytuvuose yra vakcinos dozių ir visai ne apie tai ką kalba Veryga ar kiti politikai, ar ką skelbia žiniasklaida. Todėl šiuo blogpost’u noriu į tai sureaguoti, nes sureaguoti per visus kanalus - Facebook, Linkedin ir el. paštą būtų neefektyvu.

Intro

Mielas Statistikos departamente,

aš nuoširdžiai gailiuosi ir labai apgailestauju, kad paviešinau vieną nedidelę klaidelę, vienoje iš švieslenčių. Labai atsiprašau, kad mano vieša ir nekonstruktyvi kritika tapo tarsi ad hominem trapiai LSD emocinei būklei, ne vietoje ir ne laiku čia aš pasireiškiau… Aš nedelsiant išimsiu minėtą blogpost’ą ir vietoj jo patalpinsiu ką nors mielo ir gražaus, va pvz., tokį pūkuotą kačiuką!

Juokauju!

Su visa pagarba visiems komentatoriams: aš rašiau apie manipuliacija pilnais vakcinų šaldytuvais, bet ne… konstruktyvios kritikos priimti nemokame, viskas yra gerai, Mundeikis kabinėjasi prie detalių… Aš neketinau plėstis šioje tematikoje, nes man ji asmeniškai neįdomi, bet kad jau taip visi gausiai ir uoliai komentuojate, negaliu tylėti ir aš.

Perspėjimas jautrių nervų žmonėms - toliau neskaitykite, nervinimasis yra nesveika. Geriau eikite pasivaikščioti gryname ore.

Kritika LSD nebuvo esmė

Visa blogpost’o esmė buvo, kad Verygos pasisakymas apie vakcinas šaldytuve ir kuriamas manipuliatyvus naratyvas apie neva prastai dirbančią SAM yra nepagrįstas.LSD blog’e nusipelnė mano dėmesio dėl to, kad per klaidą pateikiami duomenys įgalina politikus manipuliuoti skaičiais. Yra tokie duomenys kaip vidutinė temperatūra ir yra tokie duomenys kaip COVID, jų politinė ir emocinė įkrova yra skirtinga ir atitinkamai reikalaujanti kitokio dėmesio. Šabloninis pasakymas à la “Kur obliuojama ten krenta drožlės” nelabai dera COVID kontekste. Kam COVID statistika yra eilinė laiko eilutė, tam patartina pažiūrėti, kokiomis nuotaikomis gyvename realybėje.

Šiaip man atrodo, turėtų pakati šito pararagrafo ir visiems viskas turėtų būti aišku… bet iš sulaukto dėmesio, abejoju kad bus…

Tad dabar papunkčiui…

LinkedIn: LSD generalinė direktorė komentavo:

Į ką aš atrašiau:

Priešingai, siūlau dar daugiau skelbti. Kartu šiandien parašytame laiške Laimai, kartu nurodžiau ir kaip būtų galima išvengti tokių klaidų.

Nesuprantu, prie ko čia skelbti ar neskelbti? “Būti ar nebūti, štai kur klausimas” - gal mažiau Hamleto, daugiau konstruktyvumo?

LinkedIn: Statistikos sklaidos ir komunikacijos skyriaus dirketorė komentavo:

į kurį atrašiau:

Ego? <– nekomentuosiu… Ištaisytas bug duomenų valdymo procese? Super! Tam ir blogpost’as, jog Stat depas taisytų klaidas, o visuomenė taptų atsparesnė manipuliacijoms. O kad LSD pateikiamais skaičiais nebus bandoma manipuliuoti, eskaluojant politiniuose kuluaruose ir ne tik, apie tai kaip SAM nesusitvarko su vakcinavimu („vakcina šaldytuve imuniteto niekam nesukurs“) … būtų naivu.

Nežinau, man regis LSD nekaltinau skaičių manipuliavimu, o aiškiai tekste parašiau:

“Ir niekam nesvarbu, SAM paskubėjo ar ne. Jūs esate atsakingi už duomenų kokybę. Kitaip Jūs prisidedate prie to, jog būtų pradėta manipuliuoti skaičių neatitikimais”.

Dabar tai išversti į tai, kad aš kaltinu LSD skaičių manipuliavimu yra - įdomu. Įdomu, ar kas nors ramiai skaitė blogpost’ą, ar tiesiog LSD kilo emocinė bangą? Pradėjo visi pūsti vuvuzelomis? Nes atsirito ji ir per emailus.

Dabar prieš pradedant kam nors dėl ko nors piktintis, mano darbinis el pašto adresas yra justas.mundeikis@lithuanian-economy.net, mano susirašinėjimas, kurį cituoju, yra tik su adresatais, susirašinėjant oficialiais LSD el. pašto adresais, nėra jokių asmeninių emailų, asmeninių bendravimo kanalų ar panašiai.

LSD darbuotojo emailas

Nematau nieko neatsakingo, negarbingo ar neetiško.

Aš kreipiausi dėl galimos klaidos, Jūs klaidą patvirtinote, aš aprašiau kokia buvo klaida, bei KODĖL ji buvo kilusi. Neprikūriau jokių istorijų, neiškreipiau realybės, o pateikiau faktus.

Dėl “asmeninio” rašymo

2020-03-29 dieną ar kreipiausi į LSD dviem emailais: covid@stat.gov.lt ir Jūsų (viename emaile), nes būtent Jūs anksčiau man atrašėte po kreipimosi į tą patį covid@ emailą ir kaip suprantau, esate atsakingas už COVID statistiką. Turint omenyje, kaip dažnai LSD el. pašto serveris klaidingai klasifikuoja mano emailus į SPAM, aš stengiuosi įtraukti kelis gavėjus, nes LSD neturi autoresponse funkcijos, kad “Gavome, dėkui, atsakysime”.

Po 2021-03-29 laiško Jūs man atrašėte prisegant ir kitą darbuotoją, kuris atsakė kiek vėliau į kitą užklausos dalį. Tad susirašinėjimas COVID vakcinacijos tema ir vyko su Jumis abiem. Atitinkamai el. laiškas, parašytas 2021-03-31 dėl galimos LSD klaidos su prašymu “Gal galite patikslinti, ar abu rodikliai (stulpelių diagramos ir suminis skaičiukas) yra iš to paties duomenų šaltinio, ar nėra švieslentėje įsivėlusi klaida?” buvo išsiųstas Jums abiems. Kadangi tematika tebebuvo ta pati, vakcinacijos skaičiai - nemačiau objetyvių priežasčių rašyti į covid@stat.gov.lt.

Kaip Jūs valdote žmonių užklausas aš nežinau ir man nuoširdžiai nerūpi. Galiu tik pasakyti, kad nuėjus į LSD duomenų bazę ir pasirinkus bet kurį rodiklį, jam “i”nfo paskyroje yra nurodytas konkretus darbuotojas, į kurį reikia kreiptis, kilus klausimams, pvz.,:

Tokia metų metais turėta praktiką formuoja įpročius, kad kreiptis reikia tiesiogiai. Jeigu tai nebuvo LSD siekis, tada taisykite info skiltį ir nurodykite tik bendrinius kontaktinius duomenimis, nustokite atrašinėti į gyventojų užklausas tiesiogiai, įsidėkite duomenų / užklausų valdymo sistemą ar kad ir ką, ir valdykite informaciją, kaip Jums atrodo tinkama.

Aš kreipiuosi į LSD su užklausomis liečiančiomis LSD pavestą funkciją platinti statistinę informaciją. Jums asmeniškai į Jūsų privatų el. paštą niekad nieko nerašiau, jokios asmeninės pagalbos ar paslaugų irgi neprašiau, juo labiau Jūsų laisvu laiku!!! Jeigu gyventojų užklausų COVID statistikos tematika aptarnavimas nėra įtrauktos į Jūsų darbo aprašą, bet Jus jas vykdote, kreipkitės į vadovybę. Aš nesu teisingas adresatas lieti šias nuoskaudas.

Kitas LSD darbuotojo emailas

Aš aprašiau, kokia buvo klaida ir kaip ji atsirado. Politinių diskusijų ir manipuliacijų fone, paryškinau, jog tokios klaidos prisideda prie to, kad politikai gali dar labiau išnaudoti klaidingai pateiktus skaičius, ypač tokia svarbia tema, kaip COVID, kur emocijos jau tampa svarbesnės, nei faktai.

Susitvarkėte klaidą? Labai gerai, bet ar dingo pats faktas? Juo labiau, ar dingo politikų pasisakymai, apie vakcinas gulinčias šaldytuvuose, ar žmonių galvojimas, prisiklausius tokių pasisakymų, jog pas mus stringa vakcinavimo procesas? Man atrodo, kad ne.

Operatyvumas ir tikslumas… Aš nesuprantu, prie ko čia operatyvumas ir tikslumas? Yra duomenys, kuriuos galite teisiškai viešinti. Toliau yra paprasčiausias klausimas, ar yra padaromos kokios nors klaidos pačiame duomenų apdorojimo ir viešinimo procese (švieslentėje). Turint omenyje, kokia yra svarbi ir jautri COVID tema, tikiu, kad LSD kuo puikiausiai suvokia savo atsakomybę ir kelis kartus tikrina visus skaičiavimus. Ir taip, nepaisant to, klaidų pasitaiko. Bet ne apie tai buvo blogpost’o esmė, o apie tai, kaip pasitaikant tokioms klaidoms galima manipuliuoti kuriant realybę iškreipiančius naratyvus.

Na ir atsakant į klausimą, kam naudingas anas blogpost’as? Taip, aš manau, kad blogpost’as yra naudingas daug kam:

  1. Politikams, kad jie matytų, kad kartais net LSD atsiranda klaidų, todėl visą statistiką reikia vertinti atsargiai ir neskubėti daryti išvadų iš vieno skaičiuko.
  2. Žmonėms, parodant, kad Verygos pasisakymai apie vakcinas šaldytuvuose iš esmės yra klaidingi.
  3. Studentams, kurie pamato, kokia yra svarbi politinio ir emocinio konteksto įkrova ir koks kartais turi būti atsakingas darbas.
  4. Man - mažiausiai naudinga. Aš sugaišau n-valandų laiko sužiūrėdamas duomenis, pateikdamas duomenis kitu rakursu, kuriuo šie duomenys nėra pateikiami LSD švieslentėje ir dar daugiau laiko, atrašinėdamas į LSD darbuotojų komentarus ir emocines iškrovas.

Atsakymas Vaidotui Zemliui-Balevičiui

Esmė klaidų dažnis

Ne Vaidotai, esmė ne klaidų dažnis, o klaidingų politinių išvadų darymas, remiantis klaidingais duomenimis.

Man toks jausmas, kad kai kuriems duomenų mokslininkams, duomenys ir jų aprodojimo procesas atrodo kaip savaiminis tikslas, holy grail, nekritikuotinas, nekvestionuotinas, šventas… Fuck it, duomenis renkami ir publikuojami ne per se, o tam, kad daryti išvadas. Man rūpi klaidos tik tiek, kokį jos turi poveikį politiniam turiniui.

Atsistot best į vieną klaidą ir šaukt, kad viskas blogai irgi nėra visiškai etiška.

Nesakau, kad viskas blogai, aprašiau konkrečią problemą.

Turint omenyje, kad duomenys buvo prieinami ir buvo juos galima parsisiųsti o ne nusirašinėti

Galbūt nepamačiau, bet kur LSD tinklapyje yra gautų / perskirstytų vakcinų srautų statistika?

Būtų gražu iš jūsų pusės dabar porą savaičių stebėti situaciją ir paskelbti kiek klaidų pasitaikė per tas pora savaičių

Gražu Jums? Gražu LSD? Gražu kam? Grožis yra skonio reikalas. Kam aš čia turėčiau įtikti? Išpirkti savo kritikavimo nuodėmes, ar ką?

Su visa pagarba, Jums viskas gerai? Ar Jūs įsivaizduojate, kad Verygos ir co irgi sėdės ir stebės LSD klaidingumą ir skaičiuos kokius tai afigienus išvestinius klaidingumo rodiklius ir paskui gamins gražius grafikus? Kokių priešvelykinių margučių Jūs čia užvalgėtė? :D

Va kas dieną atnaujinamas failas su vakcinų pristatymais: https://github.com/mpiktas/covid19lt/blob/master/data/lt-covid19-vaccine-deliveries.csv.

Vaidotai, su Jūsų pateikiamais agreguotais duomenimis viskas yra super, bet kaip pats rašote savo about.md:

Tai nėra oficialūs duomenys, kuriuos aš paimčiau iš LSD. Aš nežinau ar Jūs suvokiate skirtumą tarp šaltinių: “fainas bičas pasharino skaičius” vs oficialūs LSD duomenys?

Jeigu naudočiau trečiųjų šalių duomenis, tada ir turėčiau arba verifikuoti visą duomenų parsiuntimo procesą, arba nurodyti, kad duomenys nėra LSD, o Vaido. Tam kad išvengti klaidų, aš remiuosi tik tais duomenis, kurie yra viešai skelbiami.

Epilogas

Gal apsieisiu be epilogo, nes visa diskusija ir taip gavosi emocinės iškrovos krūva. Neproduktyvi ir tiesiog eilinis “myliu-nemyliu”, na arba “būti ar nebūti”. Mano nuomone, aš sureagavau į pakankamą kiekį išsakytos viešos kritikos ir į tolimesnius visų išgyvenimus ir sielavartus reaguoti neketinu.

Smagių visiems švenčių.