-
- datarensing strategier
- postet av:Mona Storm Nilsen
- Data kan bli ødelagt på en rekke måter, fra brukerundersøkelser feil til formatering inkonsekvenser. . Duplikater er en av de vanligste dataproblemer i de fleste bedrifters databaser. Den beste måten å sikre data nøyaktighet er å hindre korrupsjon, men det er lurt å ha en plan for å håndtere data problemer skulle oppstå problemer.
Duplisering
dubletter kan være en frustrerende ting å se som en data revisor. Ofte kan en front-end data skjermen ikke fange visse typer dubletter, for eksempel i en adresse tabell, 123 Main Street og 123 Main St. kan synes å være to separate adresser når faktisk er de samme adresse
Dette kan løses ved hjelp av én av to metoder:. fjerning av data eller data korreksjon. Data fjerning vil bety å slette alle unntatt én forekomst av et sett av duplikater, mens data korreksjon ville oppdatere alle forekomster av duplisering til en enkelt avtalt verdi. Programvarepakker som er tilgjengelige som bruker en algoritme for å identifisere outliers basert på standard avvik, klynger eller andre kriterier, blir så uteliggere evaluert av et saksforhold ekspert som bestemmer skjebnen til den uventede oppføringen. Extract, Transform, Load
Extract, transform, last eller ETF, er en mye brukt metode for å flytte og rene data. Selv om ingen manuell rensing forekommer, er det automatiserte oppgaver i oversette fasen. For eksempel, hvis kilden tabellen butikkene "M" og "F" og måltabellen butikkene "mannlig" og "kvinnelig", en skriptet er kjørt å oversette dataene til den nye verdier.
Når dataene er rengjort og validert, den kan importeres til måltabellen. Det kan også importeres over de gamle dataene til å skrive over data. Dette fungerer bra når en hel kolonne med data i en tabell må endres. Oppdatere Legacy Systems
Oppdatere en arv system vanligvis innebærer å flytte data til en mellomliggende sted, eller staging område, der den gjennomgår deretter en automatisert og manuell data rensing runde. Dette gjøres for å unngå å gjøre eventuelle irreversible feil i eldre data før du importerer den inn i det nye systemet. Det bør bemerkes at eldre data ikke skal være oppdatert, ifølge informasjon-ledelsen. com, for å unngå å opprettholde to separate datasett. Det bør være pensjonert i stedet og det nye systemet skal være den eneste i bruk fremover.
Relaterte artikler
hvordan du overfører en sims spillet til en annen datamaskin
hvor å fjerne en bane verktøylinje
hvordan få kontakt med ODBC til SQL Express Sde ESRI
hvordan sette et bilde som bakgrunnsbilde
hvordan brenne en wav til en dvd
hvor å konvertere PDF-filer til en full versjon av ordet
hvordan å lage en datamaskin-basert animasjon
hvordan brenne en ts mappe til dvd
hvor å unzip en photoshop plug-in
hvordan brenne en pdf på cd