Moltes empreses s'esforcen per ser més basades en dades. Després de tot, amb més dades a la seva disposició, les empreses haurien de poder prendre decisions més informades. Les empreses fins i tot estan invertint grans sumes de diners en tecnologia de recollida i anàlisi de dades, però val la pena?

En aquest article s'analitza de prop el bombo recent que tenen les empreses per convertir-se en dades. També examinarem per què això és un repte per a moltes empreses. Tot i invertir i utilitzar les eines adequades, com ara rascadors web i servidors intermediaris rotatius residencials d'un proveïdor com ara smartproxy, les dades incorrectes encara poden afectar negativament el rendiment de la vostra empresa.

Cobrirem els següents temes relacionats amb dades incorrectes:

  • Per què l'exageració sobre convertir-se en dades?
  • Què són les dades dolentes?
  • Què causa dades incorrectes?

Per què l'hype sobre convertir-se en dades?

Convertir-se en dades ha estat un objectiu per a moltes empreses en els últims anys. La tecnologia i els negocis estan en constant evolució, i les indústries són cada cop més competitives. És lògic que si teniu més informació a la vostra disposició, podeu prendre millors decisions que els vostres competidors. No només podreu superar la competència, sinó que podreu fer millors inversions, entrar en nous mercats i provar innovacions més ràpidament.

Aquest raonament té sentit, de manera que les empreses estan prenent mesures actives per estar més basades en dades. Des d'invertir milions en la recollida i l'anàlisi de dades fins a la designació d'equips de gestió de dades, les empreses gasten molt de temps, diners i energia a obtenir dades que puguin utilitzar per millorar el seu rendiment.

Malauradament, alguns reptes dificulten aquest progrés en forma de dades errònies. L'ús de raspadors web juntament amb servidors intermediaris rotatius residencials està bé per recollir dades. Malauradament, les dades recollides van ser originalment escrites, editades i penjades per una persona. Això vol dir que hi pot haver molts errors, des d'errors ortogràfics i de gramàtica fins a estadístiques i fets enganyosos més greus. En una enquesta recent, moltes organitzacions creien que la informació de mala qualitat costava a les empreses 15 milions de dòlars anuals en pèrdues, tot i que el 60% no estaven segurs de quant estaven perdent.

Què són les dades dolentes?

Les dades incorrectes són informació incorrecta, falsa o inexacta.

Exemples de la vida real de dades incorrectes en acció

Durant els darrers anys s'han donat moltes situacions en què s'han utilitzat dades dolentes, i per això es va cridar a les organitzacions responsables. Alguns dels més notables van tenir lloc durant la recent pandèmia de la Covid-19, on la difusió de la desinformació va assolir proporcions èpiques.

Un exemple d'aquesta situació es va produir a Florida. El senador estatal, Steve Glazer, va exigir que el seu estat tornés a un estricte bloqueig per la preocupació de l'augment dels casos de Covid a la zona. Durant aquest període, l'estat va augmentar la prova de persones sanes (asimptomàtiques o que van donar negatiu). En aquell moment, van informar que havien fet 6,778,304 proves; d'aquests, només 425,616 van donar positiu. Tanmateix, el senador va utilitzar aquest número com a base per al seu raonament. Això va ser malgrat que nombrosos metges, epidemiòlegs, viròlegs i immunòlegs van afirmar que el factor més important era la taxa de mortalitat, no el nombre de casos positius.

De la mateixa manera, el comtat de Geòrgia va publicar un gràfic al seu lloc web per mostrar els cinc comtats amb el major nombre de casos de Covid-19. Tanmateix, van estructurar el gràfic per afavorir la seva pròpia agenda en lloc de representar amb precisió els casos. D'una banda, el gràfic original mostra les dates corresponents a les proves positives a l'eix X; tanmateix, quan es fixen de prop, aquestes dates no estan en ordre cronològic. Això fa que sembli que els números de cada comtat estan disminuint constantment quan, en realitat, no ho són. Un altre problema és que els comtats no apareixen en el mateix ordre a cada data, sinó que es tornen a ordenar en ordre descendent, cosa que fa que sembli que el nombre de casos està disminuint.

Una situació més recent i no relacionada es va produir el 2021 quan l'emissora de Fox News, Tucker Carlson, va presentar un gràfic. Durant el segment, l'emissora va mostrar un gràfic que mostra com havia baixat el nombre d'americans que s'identificaven com a cristians. El gràfic mostrava que el 2009 el 77% de la població es va identificar com a cristiana, mentre que el 2019, el nombre va baixar fins al 65%. No és una gota tan gran, però la forma en què van presentar el carro va fer que semblés molt més gran que la realitat. Ho van fer iniciant l'eix Y al 58%, cosa que va fer que la bretxa semblés molt més gran que si haguessin començat al 0%, que sol ser la millor manera de presentar estadístiques basades en percentatges amb precisió.

Què causa dades incorrectes?

Es pot crear de diverses maneres diferents, algunes de les quals inclouen:

  • Errors de l'usuari com ara l'ortografia, la gramàtica, l'ús d'un format incorrecte, etc
  • Creació de còpies múltiples treballant en molts sistemes simultàniament
  • Poca qualitat del programari
  • Falles tècniques
  • Canvis fets a la font
  • Fets o estadístiques incorrectes utilitzats, de manera intencionada o no
  • Persones que impulsen les seves pròpies agendes difonent notícies falses

Consideracions finals

Amb les preocupacions de privadesa cada cop més estrictes i les empreses perdent diners amb dades incorrectes o lluitant per obtenir els beneficis que esperaven de les dades, aquesta moda basada en dades podria desaparèixer completament en la propera dècada. Probablement es substituiria per una manera més eficient de gestionar les dades per garantir la precisió i la fiabilitat.