Data Professional Introspective: Hoe Goede Data Eruit Ziet-Deel 4

Deze kolom is de volgende in de reeks van hoe organisaties significante verbeteringen in fundamentele data management disciplines bereiken en ondersteunen, in hun reis naar grote Data. Inhoud en aanbevelingen zijn gebaseerd op mijn werk met veel organisaties om hun EDM-programma ‘ s te evalueren, te versnellen en te verbeteren.

We gaan “hoe goed eruit ziet” verkennen voor het data quality-programma van een organisatie, met voorbeelden van voordelen en uitdagingen die moeten worden overwonnen. We bieden ook een aantal voorgestelde benaderingen, belangrijke implementatiestappen en werkproducten die u nodig hebt om uw organisatie te helpen bij het opbouwen van sterke data kwaliteit capaciteiten en evolueren naar een ‘kwaliteit cultuur.’

In een vorige kolom, How to Tackle a Data Quality Strategy, schetsten we hoe we een project kunnen beheren om een organisatiebrede data quality strategy te ontwikkelen, inclusief rollen en activiteitenstappen. In een andere, Accelerating Enterprise Data Quality, hebben we uitgelegd hoe je een data quality programma vanaf de basis te ontwikkelen, gebruikmakend van het mechanisme van een pilot project met activiteiten stappen en werkproducten. Als u zich bezighoudt met het lanceren van een van deze initiatieven, check out die kolommen voor praktische en nuttige tips.

De Gegevenskwaliteitscategorie van het Data Management Maturity-Model (DMM) bestaat uit praktijken in vier procesgebieden die samen een holistische aanpak creëren om gegevenskwaliteitscapaciteiten op te bouwen en een programma voor gegevenskwaliteit te creëren. De twee genoemde kolommen richtten zich voornamelijk op respectievelijk de data Quality Strategy en Data Profiling process areas. Nu bespreken we de business-led evaluatie van data quality, Data Quality Assessment, en de activiteiten en werkproducten die data quality governance en continue verbeteringen te bevorderen.

Laten we het kort bekijken – Er zijn vele paden waardoor onjuiste gegevens uw systemen kunnen invoeren. Enkele van de belangrijkste oorzaken van slechte gegevenskwaliteit zijn:

Wanneer gegevens worden ingevoerd door een persoon, is het onderhevig aan fouten in de gegevensinvoer, ofwel het invoeren van de verkeerde gegevens, het niet invoeren van verwachte gegevens, of het plaatsen in een standaardwaarde omdat de juiste informatie niet beschikbaar is.
Wanneer gegevens uit een andere bron worden verkregen, kunnen deze inconsistenties bevatten, zoals discrepanties in gegevensdefinities, ontbrekende, onvolledige of onnauwkeurige gegevens.
Onjuist ontwerp kan ook leiden tot slechte gegevens. Bijvoorbeeld tekstvelden voor telefoonnummers, onjuiste veldlengtes, onjuist formaat of precisie.
De inspanningen op het gebied van gegevenskwaliteit zijn meestal reactief. Een probleem of fout wordt vaak geïdentificeerd omdat het wordt opgemerkt door systeemgebruikers, of is een onderdeel van een rapport en blijkt de oorzaak van onnauwkeurigheden.
Organisaties benaderen doorgaans verbeteringen van de gegevenskwaliteit project-voor-project, Data store-voor-data store. Dit kan resulteren in verschillende regels voor dezelfde gegevens. Voor gedeelde gegevens, als regels en procedures onafhankelijk worden ontwikkeld voor elke locatie, de organisatie maakt buitensporige inspanning en kosten, en ongecoördineerde, inefficiënte implementaties (bijvoorbeeld, herhaaldelijk reinigen van gegevens in een downstream gegevensopslag, terwijl de kwaliteit van de gegevens aan de bron niet wordt verbeterd).
Zet dat allemaal bij elkaar, en je kunt zien dat het ongrijpbare doel van “nul defecten” vaak verdwijnt in de achteruitkijkspiegel. Er bestaat niet zoiets als ‘perfecte data’ in een hele organisatie. We moeten dat van meet af aan accepteren en criteria ontwikkelen om het belang van kwesties te beoordelen en te bepalen wat we kunnen bereiken.

Geautomatiseerde tools kunnen de inspanning ondersteunen om gegevensfouten (een fout) en anomalieën (onverwachte resultaten die een fout kunnen zijn) te identificeren. Hulpmiddelen voor gegevensprofilering kunnen helpen bij het identificeren van defecten in fysieke gegevensopslag en AI-detectiesoftware kan patronen blootleggen die op fouten kunnen wijzen. Echter, mensen die de gegevens produceren en gebruiken zijn nodig om definitieve beslissingen te nemen over de toestand van de gegevens.

“Je bent waar je bent – – het bouwen van een stichting
Executives beseffen dat de kwaliteit van de gegevens is zeer belangrijk om de bedrijfsvoering en beslissingen te verbeteren, evenals risico ‘ s te voorkomen. Zij horen vaak klachten over de gegevens van hun personeel en interne consumenten, en zijn waarschijnlijk op de hoogte van belangrijke bekende problemen. Ze willen de gegevens verbeteren, maar zijn ook op hun hoede voor buitensporige kosten. Zoals een Chief Technology Officer tegen me zei: “Ik haat datakwaliteit – het is zo duur!”En hij is correct-als de organisatie laat de kwaliteit van de gegevens inspanningen om silo’ s projectteams en remediërende ad hoc inspanningen, zal het oplopen herhaalde inspanningen (en kosten) in de hele organisatie.

Sommige organisaties hebben de uitdaging niet aanvaard om van af af te stappen. Bijvoorbeeld,

Eén wereldwijd bedrijf spendeerde elke maand miljoenen dollars om een data quality team op te zetten om financiële gegevens te zuiveren van vele regionale financiële systemen. Het bedrijf deed niet de moeite om de onderliggende oorzaken van de problemen te analyseren, en had geen Masterplan om de afzonderlijke systemen te consolideren of opnieuw te ontwerpen. Dat is een goed recept voor herhaalde uitgaven, maand na maand, jaar na jaar.

Als de organisatie geen bredere inzet maakt om de conditie van de gegevens te verbeteren, zal het altijd op een loopband zijn. Iedereen wil dat de gegevens beter zijn dan ze zijn. Om dat op lange termijn mogelijk te maken, moeten organisaties zich inzetten voor drie transformatieve initiatieven:

Verbeter de betrokkenheid bij gegevensbeheer door robuuste processen voor gegevenskwaliteit te definiëren
Onderwijs medewerkers in deze processen en zorg voor beleid, begeleiding en begeleiding
Plan en prioriteer waar u zich moet concentreren – per grote programma-implementatie, per domein of per business line – en formaliseer idealiter in een strategie voor gegevenskwaliteit en roadmap.
Pop quiz! Wat is het proces van gegevenskwaliteit dat zelden wordt gedefinieerd, gemodelleerd, gemandateerd en afgedwongen?

Antwoord-de proactieve, governance-intensieve activiteiten bestaande uit Data Quality Assessment-de business-driven, verantwoordelijkheid-aanvaarden, roll-up-the-moves werk dat waarschijnlijk goed is voor 75-80% van de prestaties die leiden tot de zeer gewenste, maar zelden bereikte ‘kwaliteit cultuur.’

Het bedrijf is eigenaar van de gegevens. Dus, vertel op, Ja? Hoe vaak hebben we uitspraken gehoord als: “het is verantwoordelijk voor de kwaliteit van de gegevens.”van leidinggevenden, managers en personeel? Word je er niet gek van? Echt! Bijvoorbeeld, Total Information Quality Management, een baanbrekend werk van Larry P. English, dat een alomvattende aanpak voor het vaststellen en handhaven van de kwaliteit van gegevens samenvat, is zeer invloedrijk geweest sinds de jaren 1990. het is gespeld in zwart – wit in het framework: proces 2-Assess Information Quality.

De organisatie moet de feitelijke realiteit erkennen – het zal de betrokkenheid van veel individuen, over een aanzienlijke periode van tijd, om een bevredigende conditie van de gegevens over de belangrijkste gegevensopslag te bereiken. Mijn vorige kolommen Enterprise Data & EDM strategie en weet uw Enterprise Data adres hoe te bepalen wat ‘enterprise data’ is voor uw organisatie, en hoe te benaderen het aanwijzen van kritieke data – elementen-beide helpen bij het scherpen van uw focus. In de eerder genoemde kolom data quality strategy gaan we in op het prioriteren van uw organisatiebrede kwaliteitsplan.[1]

Wanneer we onderzoeken wat er betrokken is bij het proces voor de beoordeling van de gegevenskwaliteit, gaan we ervan uit dat de organisatie een segment(s) van gegevens heeft geselecteerd om zich eerst op te concentreren – bijvoorbeeld een data-domein, een grote gedeelde data-implementatie-inspanning (bijvoorbeeld data lake Ingestion Data Set #1, het toevoegen van nieuwe gegevens aan een datawarehouse, of het implementeren van een data mastering-oplossing).

Proactieve beslissingen nemen over Data is de weg naar vooruitgang
De bestuursstructuren en activiteiten van de organisatie moeten worden uitgebreid om vier fundamentele aandachtsgebieden te benadrukken. Organisaties die op dit gebied best practices hebben geïmplementeerd, hebben deze elementen bereikt:

Data steward betrokkenheid bij het definiëren van kwaliteitsdoelstellingen en kenmerken
Een systematische methode om de kwaliteit te meten en te bewaken
Het toepassen van bedrijfsprioriteiten om te beslissen wat te saneren
En samenwerken met IT-partners om te bepalen hoe je de kwaliteit kunt verbeteren.
In het algemeen kan dit betekenen dat Voor data governance extra business data stewards per data domain of business line worden aangewezen, de gebeurtenissen of triggers worden gedefinieerd voor wanneer ze deelnemen, en de rolbeschrijvingen van data governance worden verbeterd om specifieke taken inzake gegevenskwaliteit op te nemen.

Laten we onderzoeken wat er moet gebeuren, door middel van de dubbele lenzen van wat de organisatie moet committeren aan, en de rol van de data steward / business Data expert.

Stap Één-Kwaliteit Definiëren
Organisaties moeten een systematische, bedrijfsgedreven aanpak implementeren om de gegevenskwaliteit te evalueren en te meten, om geschiktheid voor het doel te garanderen, doelen en drempels vast te stellen en dimensies van de gegevenskwaliteit te gebruiken om de kwaliteit in detail te analyseren.

Vanaf de top: Hoe ziet qualityook eruit? Jij moet beslissen.We kunnen ‘goed’ als volgt samenvatten:

De juiste gegevens – de dataset (s) die u moet produceren of gebruiken om een zakelijk doel te vervullen
Op het juiste moment – gegevens die voldoen aan valuta (periode) eisen, en is beschikbaar wanneer u het nodig hebt
In de juiste staat – gegevens die in overeenstemming zijn met de kenmerken (afmetingen) die het nuttig maken.
Deze beslissingen kunnen alleen worden genomen door gegevensproducenten en consumenten. Het kan u ondersteunen bij het analyseren van welke kwaliteit is vanuit het perspectief van het bedrijf, maar het kan dit niet zelf bepalen. De elementen die nodig zijn om “kwaliteit” te definiëren zijn::

Fitness for purpose-het definiëren van de dataset(s) die voldoen aan de vereisten om een bedrijfsproces uit te voeren, een zakelijke beslissing te nemen of nuttige rapporten en modellen te maken om belangrijke vragen te beantwoorden, trends te analyseren of bedrijfsscenario ‘ s te modelleren. De gegevensverzameling kan eng of ruim gedefinieerd zijn en kan afkomstig zijn van één of meerdere gegevensbronnen. Omgekeerd omvat de vaststelling van de geschiktheid ook de vaststelling van de wijze waarop bestaande gegevens momenteel niet aan hun zakelijke doel voldoen.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *