Πολλές επιχειρήσεις προσπαθούν να γίνουν περισσότερο προσανατολισμένες στα δεδομένα. Εξάλλου, με περισσότερα δεδομένα στη διάθεσή τους, οι επιχειρήσεις θα πρέπει να μπορούν να λαμβάνουν πιο τεκμηριωμένες αποφάσεις. Οι επιχειρήσεις επενδύουν ακόμη και μεγάλα χρηματικά ποσά στην τεχνολογία συλλογής και ανάλυσης δεδομένων – αλλά αξίζει τον κόπο;

Αυτό το άρθρο εξετάζει προσεκτικά την πρόσφατη διαφημιστική εκστρατεία που έχουν οι επιχειρήσεις σχετικά με την καθοδήγηση δεδομένων. Θα εξετάσουμε επίσης γιατί αυτό αποτελεί πρόκληση για πολλές επιχειρήσεις. Παρά την επένδυση και τη χρήση των κατάλληλων εργαλείων, όπως web scrapers και οικιακούς περιστρεφόμενους proxies από έναν πάροχο όπως smartproxy, τα κακά δεδομένα μπορούν να επηρεάσουν αρνητικά την απόδοση της επιχείρησής σας.

Θα καλύψουμε τα ακόλουθα θέματα που σχετίζονται με κακά δεδομένα:

  • Γιατί η διαφημιστική εκστρατεία για το να γίνουμε βασισμένοι στα δεδομένα;
  • Τι είναι τα κακά δεδομένα;
  • Τι προκαλεί τα κακά δεδομένα;

Γιατί η διαφημιστική εκστρατεία για το να γίνουμε βασισμένοι στα δεδομένα;

Ο στόχος πολλών εταιρειών τα τελευταία χρόνια ήταν να γίνουν βασισμένες στα δεδομένα. Η τεχνολογία και οι επιχειρήσεις εξελίσσονται συνεχώς και οι βιομηχανίες γίνονται πιο ανταγωνιστικές. Είναι λογικό ότι εάν έχετε περισσότερες πληροφορίες στη διάθεσή σας, μπορείτε να πάρετε καλύτερες αποφάσεις από τους ανταγωνιστές σας. Όχι μόνο θα μπορέσετε να ξεπεράσετε τον ανταγωνισμό, αλλά θα μπορείτε να κάνετε καλύτερες επενδύσεις, να εισχωρήσετε σε νέες αγορές και να δοκιμάσετε καινοτομίες πιο γρήγορα.

Αυτό το σκεπτικό είναι λογικό, επομένως οι επιχειρήσεις λαμβάνουν ενεργά βήματα για να κατευθύνονται περισσότερο στα δεδομένα. Από την επένδυση εκατομμυρίων στη συλλογή και την ανάλυση δεδομένων έως τον διορισμό ομάδων διαχείρισης δεδομένων, οι επιχειρήσεις ξοδεύουν πολύ χρόνο, χρήμα και ενέργεια για τη λήψη δεδομένων που μπορούν να χρησιμοποιήσουν για να βελτιώσουν την απόδοσή τους.

Δυστυχώς, ορισμένες προκλήσεις εμποδίζουν αυτήν την πρόοδο με τη μορφή κακών δεδομένων. Η χρήση ξύστρων ιστού μαζί με περιστρεφόμενους μεσολάβησης κατοικιών είναι καλή για τη συλλογή δεδομένων. Δυστυχώς, τα δεδομένα που συλλέχθηκαν αρχικά γράφτηκαν, υποβλήθηκαν σε επεξεργασία και ανέβηκαν από ένα άτομο. Αυτό σημαίνει ότι μπορεί να υπάρχουν πολλά λάθη, από τυπογραφικά και γραμματικά μέχρι πιο σοβαρά παραπλανητικά στατιστικά στοιχεία και γεγονότα. Σε μια πρόσφατη έρευνα, πολλοί οργανισμοί πίστευαν ότι η κακή ποιότητα των πληροφοριών κοστίζει στις εταιρείες 15 εκατομμύρια δολάρια ετησίως σε ζημίες, αν και το 60% δεν ήταν σίγουρο πόσο ακριβώς έχανε.

Τι είναι τα κακά δεδομένα;

Τα κακά δεδομένα είναι εσφαλμένες, ψευδείς ή ανακριβείς πληροφορίες.

Πραγματικά παραδείγματα κακών δεδομένων σε δράση

Τα τελευταία χρόνια, υπήρξαν πολλές καταστάσεις όπου χρησιμοποιήθηκαν κακά δεδομένα και οι υπεύθυνοι οργανισμοί κλήθηκαν γι' αυτό. Μερικές από τις πιο αξιοσημείωτες σημειώθηκαν κατά τη διάρκεια της πρόσφατης πανδημίας Covid-19, όπου η διάδοση της παραπληροφόρησης πήρε επικές διαστάσεις.

Ένα παράδειγμα τέτοιας κατάστασης συνέβη στη Φλόριντα. Ο γερουσιαστής της Πολιτείας, Steve Glazer, απαιτούσε από την πολιτεία του να επιστρέψει σε αυστηρό lockdown λόγω ανησυχιών για αυξανόμενα κρούσματα Covid στην περιοχή. Κατά τη διάρκεια αυτής της περιόδου, το κράτος αύξησε τις δοκιμές σε υγιείς ανθρώπους (είτε ασυμπτωματικούς είτε αρνητικούς). Εκείνη την εποχή, ανέφεραν ότι είχαν κάνει 6,778,304 τεστ. Από αυτούς, μόνο 425,616 βρέθηκαν θετικοί. Ωστόσο, ο Γερουσιαστής χρησιμοποίησε αυτόν τον αριθμό ως βάση για το σκεπτικό του. Αυτό συνέβη παρά το γεγονός ότι πολλοί γιατροί, επιδημιολόγοι, ιολόγοι και ανοσολόγοι δήλωσαν ότι ο πιο σημαντικός παράγοντας ήταν το ποσοστό θνησιμότητας – όχι ο αριθμός των θετικών κρουσμάτων.

Ομοίως, η κομητεία της Γεωργίας δημοσίευσε ένα γράφημα στον ιστότοπό της για να δείξει τις πέντε κομητείες με το ο μεγαλύτερος αριθμός κρουσμάτων Covid-19. Ωστόσο, δόμησαν το γράφημα για να προωθήσουν τη δική τους ατζέντα αντί να απεικονίζουν με ακρίβεια τις περιπτώσεις. Πρώτον, το αρχικό γράφημα δείχνει τις ημερομηνίες που αντιστοιχούν σε θετικές δοκιμές στο X-Axis – ωστόσο, όταν κοιτάξετε προσεκτικά, αυτές οι ημερομηνίες δεν είναι με χρονολογική σειρά. Αυτό κάνει να φαίνεται ότι οι αριθμοί για κάθε κομητεία μειώνονται σταθερά ενώ στην πραγματικότητα δεν είναι. Ένα άλλο ζήτημα είναι ότι οι κομητείες δεν εμφανίζονται με την ίδια σειρά σε κάθε ημερομηνία, αλλά είναι και πάλι ταξινομημένες με φθίνουσα σειρά, πράγμα που κάνει να φαίνεται ότι ο αριθμός των περιπτώσεων μειώνεται.

Μια πιο πρόσφατη και άσχετη κατάσταση συνέβη το 2021 όταν ο ραδιοτηλεοπτικός φορέας του Fox News, Tucker Carlson, παρουσίασε ένα γράφημα. Κατά τη διάρκεια του τμήματος, ο ραδιοτηλεοπτικός φορέας έδειξε ένα γράφημα που απεικονίζει πώς είχε μειωθεί ο αριθμός των Αμερικανών που ταυτίζονταν ως Χριστιανοί. Το γράφημα έδειξε ότι το 2009 το 77% του πληθυσμού αναγνωριζόταν ως χριστιανός, ενώ το 2019 ο αριθμός μειώθηκε στο 65%. Δεν είναι τόσο μεγάλη πτώση, αλλά ο τρόπος που παρουσίασαν το καλάθι, το έκανε να φαίνεται πολύ μεγαλύτερο από την πραγματικότητα. Αυτό το έκαναν ξεκινώντας τον άξονα Υ στο 58%, που έκανε το χάσμα να φαίνεται πολύ μεγαλύτερο από ό,τι αν ξεκινούσαν από το 0% – που είναι συνήθως ο καλύτερος τρόπος για να παρουσιάσετε με ακρίβεια στατιστικά με βάση τα ποσοστά.

Τι προκαλεί κακά δεδομένα;

Μπορεί να δημιουργηθεί με μερικούς διαφορετικούς τρόπους, μερικοί από τους οποίους περιλαμβάνουν:

  • Λάθη χρήστη όπως ορθογραφικά, γραμματικά, χρήση λανθασμένης μορφοποίησης κ.λπ
  • Δημιουργία πολλαπλών αντιγράφων με την εργασία σε πολλά συστήματα ταυτόχρονα
  • Κακή ποιότητα λογισμικού
  • Τεχνικές βλάβες
  • Αλλαγές που έγιναν στην πηγή
  • Λανθασμένα γεγονότα ή στατιστικά στοιχεία που χρησιμοποιούνται – είτε ηθελημένα είτε ακούσια
  • Άτομα που προωθούν τις δικές τους ατζέντες διαδίδοντας ψεύτικες ειδήσεις

Τελικές Σκέψεις

Καθώς οι ανησυχίες για το απόρρητο γίνονται αυστηρότεροι και οι επιχειρήσεις είτε χάνουν χρήματα από κακά δεδομένα είτε αγωνίζονται να λάβουν τα οφέλη που περίμεναν από τα δεδομένα, αυτή η μόδα που βασίζεται στα δεδομένα μπορεί να εξαφανιστεί εντελώς την επόμενη δεκαετία. Πιθανότατα θα αντικατασταθεί από έναν πιο αποτελεσματικό τρόπο διαχείρισης δεδομένων για τη διασφάλιση της ακρίβειας και της αξιοπιστίας.

Μουσικός