Daten verstehen: Warum Data Literacy die wichtigste Kompetenz unserer Zeit ist Abstract
Hauptthema des Artikels: Was Data Literacy wirklich bedeutet, warum wir in Deutschland noch weit davon entfernt sind, sie flächendeckend zu leben – und was es braucht, damit Daten endlich das leisten, was sie könnten.
Wichtige Punkte:
Data Literacy ist keine IT-Kompetenz, sondern eine Kulturtechnik.
Genauso wie Lesen und Schreiben nicht nur das Entziffern von Buchstaben bedeutet, umfasst Datenkompetenz weit mehr als das Beherrschen von Tools. Sie schließt Wissen, Fertigkeiten, Fähigkeiten und vor allem eine Haltung ein.
Daten zu haben und Daten zu verstehen sind zwei völlig verschiedene Dinge.
Viele Unternehmen investieren stark in Datentechnik, aber kaum in das Verständnis dafür, was die Daten wirklich aussagen. Das führt im schlimmsten Fall zu automatisierten schlechten Entscheidungen.
Effizienz ist gut, aber Effektivität ist das Ziel.
Wer Daten nur nutzt, um bestehende Prozesse schneller zu machen, verschenkt das größte Potenzial. Das wirklich Spannende ist, wenn Daten selbst zum Geschäftsmodell werden.
Datenqualität ist kein technisches Problem, sondern ein grundsätzliches.
Die entscheidende Frage ist nicht, ob Werte fehlen oder Ausreißer vorhanden sind. Es geht darum, wie gut Daten überhaupt die Realität abbilden, die sie beschreiben sollen.
Initiativen zur Datenkompetenz scheitern, weil wir die „Oberlehrerkultur“ nicht loswerden.
Wer Datenkompetenz in eine Organisation bringt, indem er Wissen von oben herab verteilt, hat schon verloren. Augenhöhe, echtes Interesse und Dialog sind das, was wirklich funktioniert.
Fazit: Data Literacy ist kein Nice-to-have für Spezialist:innen. Es ist die Grundkompetenz der digitalen Welt – und wir sollten aufhören, sie nur in akademischen Zirkeln zu diskutieren.
Stell dir vor, du bekommst jeden Morgen eine Zeitung. Du kannst die Buchstaben erkennen und weißt, dass da Wörter stehen. Aber du verstehst nicht, was sie bedeuten. Du kannst nicht einschätzen, ob der Artikel dich informiert oder manipuliert. Du kannst die Schlagzeile nicht hinterfragen, die behauptet, ein Brokkoli-Röschen am Tag schütze vor Darmkrebs.
Klingt absurd? Ist es nicht. Denn genau so gehen viele Menschen, Unternehmen und Organisationen heute mit Daten um. Die Rohdaten sind da, die Dashboards leuchten, die Zahlen werden präsentiert. Aber was sie wirklich bedeuten, in welchem Kontext sie entstanden sind und was man daraus tatsächlich ableiten darf, bleibt unklar.
Ich beschäftige mich seit über zwei Jahrzehnten damit, wie Organisationen mit Daten bessere Entscheidungen treffen können. Und ich sage: Das Problem ist selten die Technik, sondern vielmehr das Verständnis.
Was Data Literacy wirklich bedeutet
Der Begriff „Data Literacy“ wird oft übersetzt mit Datenkompetenz. Das stimmt zwar, greift aber zu kurz. Literacy meint ursprünglich Lesefähigkeit, also Alphabetisierung.
Alphabetisierung bedeutet dabei nicht nur, Buchstaben erkennen zu können. Sie umfasst Fertigkeiten, wie Buchstaben zu Wörtern und Sätzen zu verknüpfen. Sie umfasst Fähigkeiten, also den Sinn eines Textes zu erfassen, ihn zu tiefergehend zu verstehen und zu interpretieren. Und sie umfasst eine Haltung – Lesefreude, Interesse und den Willen, sich mit Texten auseinanderzusetzen.
Im Grunde genommen lässt sich das auch auf Daten übertragen. Data Literacy bedeutet: zu verstehen, was Daten sind, wie man sie beschafft, verarbeitet, analysiert, interpretiert und kommuniziert. Es bedeutet, sie kritisch zu hinterfragen und nicht nur zu nutzen, um ein bestimmtes Narrativ zu unterstützen. Kurz gesagt ist Data Literacy die Kompetenz, die jeder und jede braucht, um in einer zunehmend von Digitalisierung geprägten Welt erfolgreich zu navigieren.
Wichtig ist dabei: Daten und die Bedeutung von Daten sind zwei Paar Stiefel.
Ein Dashboard ist letztlich nicht mehr als Zahlen auf einem Bildschirm. Was sie bedeuten, hängt vom Kontext ab. Die eigentliche Kompetenz besteht darin, diesen Kontext richtig einzuschätzen.
Von zweckgebundenen Auswertungen zu „Was steckt eigentlich in unseren Daten?“
Dass Unternehmen mit Daten arbeiten, ist keine neue Entwicklung. In der Versicherungsbranche werden statistische Analysemethoden seit über hundert Jahren eingesetzt. Auch in der Medizinforschung, der Pharmaindustrie und der amtlichen Statistik war der Umgang mit Daten schon lange vor der digitalen Revolution üblich.
Früher wurden Daten zu einem konkreten Zweck erhoben: Welche Patient:innen sprechen besser auf ein Medikament an? Welche Kund:innen reagieren auf welche Ansprache? Die Fragestellung war klar, die Daten wurden passgenau erhoben und anschließend genutzt.
Heute lehnen sich immer mehr Unternehmen zurück und fragen: „Was steckt eigentlich in unseren Daten?“ Nicht zur Lösung eines bestimmten Problems, sondern explorativ. Diese Herangehensweise bietet einerseits riesige Chancen, stellt Organisationen allerdings auch gleichzeitig vor ganz reale Risiken.
Effizienz ist gut. Effektivität ist das Ziel.
Ich beobachte beinahe täglich, dass Unternehmen ihre Daten hauptsächlich zur Effizienzsteigerung einsetzen. Es geht darum, Kosten zu senken und Prozesse schneller und möglichst automatisiert zu gestalten. Das ist nicht falsch. Aber es ist angesichts der vielen Möglichkeiten eine sehr bescheidene Ambition.
Das wahre Potenzial von Daten steckt in der Effektivität: Wie kann ich mit Daten etwas völlig Neues machen? Wie können Daten selbst zum Geschäftsmodell werden?
Dazu ein Beispiel aus meiner eigenen Arbeit: Gemeinsam mit meinem Team von STAT-UP habe ich mit einem Automobilhersteller zusammengearbeitet. Unser Kunde hatte ein Problem mit Tachomanipulation auf dem Gebrauchtwagenmarkt in asiatischen Ländern. Ein Auto mit weniger Kilometern ist mehr wert. Das schafft den Anreiz, den Tacho zu manipulieren, was wiederum der Marke schadet.

Grafikquelle: Afs-Akademie.org [Du kannst die Grafik unter Angabe der Quelle und einer Verlinkung zu uns verwenden.]
Zuerst stellte ich mir die Frage: Kann man mit Sensordaten aus dem Fahrzeug erkennen, ob ein Tachometer manipuliert wurde? Zum Beispiel anhand der Anzahl der Bremsvorgänge oder der Häufigkeit von Türöffnungen – Dinge, die unabhängig vom Kilometerstand erfasst werden. Das war ein klarer Effizienzfall. Es gab ein Problem zu lösen und ein Ergebnis zu berechnen.
Danach fragte ich mich, ob wir mit diesen Daten nicht noch viel mehr anfangen könnten. Wenn Hersteller über einen verlässlichen Integritätsscore für ein Gebrauchtfahrzeug verfügen, können sie ein Zertifikat ausstellen. Für den Käufer ist das eine Art Qualitätsgarantie. Gleichzeitig bekommt der Hersteller einen Kontakt zu einem Gebrauchtwagenkäufer, der ihm sonst vermutlich verloren gegangen wäre. Der Käufer steht in der Kundendatenbank und kann angesprochen werden, wenn neue Modelle erscheinen – und wird vielleicht zum Erstkäufer eines Neufahrzeugs.
Ich ging noch einen Schritt weiter: Wer könnte noch Interesse an einem solchen Risikoscore haben? Eine Versicherung zum Beispiel, die sich für die Schadenswahrscheinlichkeit eines Fahrzeugs interessiert.
In diesem Moment sind die Daten nicht mehr Mittel zum Zweck. Sie sind das Produkt.
Genau hier liegen die größten Möglichkeiten. Diesen Punkt zu erreichen, erfordert allerdings etwas, das wir in der Datenwelt noch zu selten haben: die Verbindung von Datenexpertise mit betriebswirtschaftlichem Denken. Es geht darum, Datenprobleme nicht möglichst präzise zu lösen, sondern sich zu fragen: Was bringt uns das wirklich? Wie können die Daten für sich selbst sprechen?
Das unterschätzte Fundament: Datenqualität
Unternehmen und Organisationen behaupten standardmäßig, ihre Daten seien „gut“. Doch fast immer stellt sich heraus, dass das eine sehr optimistische Einschätzung ist.
Datenqualität wird meist technisch gedacht. Wenn keine fehlenden Werte oder Ausreißer vorliegen und Daten in interoperablen Formaten existieren, wird das schnell mit Qualität gleichgesetzt. All diese Dinge sind keinesfalls unwichtig, reichen aber allein für eine gute Datenqualität nicht aus. Viel wichtiger ist, wie gut die Daten die Realität, die sie abbilden sollen, tatsächlich repräsentieren. Ein mögliches Beispiel sind Umfragen: Wie repräsentativ ist die Stichprobe? Spiegeln die Antworten das wider, was die Teilnehmenden wirklich denken? Oder sind sie eigentlich ein Abbild dessen, was sie glauben, sagen zu sollen?
Und dann ist da noch eine weitere Dimension, die ich für besonders wichtig halte: Daten entstehen irgendwo und werden anschließend woanders genutzt. Die Abteilung, die Daten erhebt, ist selten dieselbe, die sie später auswertet. Das führt zu einem strukturellen Verständnisproblem. Abteilung A weiß im Zweifel nicht, was Abteilung B mit den Daten machen will. Abteilung B weiß wiederum nicht, wie die Daten entstanden sind und wo ihre Grenzen liegen.
Zirkuläre Datenkompetenz: Die Brücke zwischen IT und Praxis
Hier kommt ein Konzept ins Spiel, das ich zusammen mit meiner Forschungspartnerin, Sanne Kruse-Becher, entwickelt habe: Zirkuläre Datenkompetenz.
Zirkulär meint: Daten fließen im Kreis. Aus Daten werden Informationen, aus Informationen wird Wissen, aus Wissen werden Handlungen. Diese Handlungen erzeugen wiederum neue Daten. Das klingt abstrakt, ist aber ganz konkret.

Grafikquelle: Afs-Akademie.org [Du kannst die Grafik unter Angabe der Quelle und einer Verlinkung zu uns verwenden.]
Zirkuläre Datenkompetenz bedeutet zweierlei: Diejenigen, die Daten bereitstellen, müssen wissen, was damit gemacht wird. Diejenigen, die Daten nutzen, müssen wissen, wo diese Daten herkommen und was das für ihre Analyse bedeutet. Dabei muss beiden Seiten klar sein, wie fit die Daten für ihren jeweiligen Zweck sind.
Dieser Brückenschlag gelingt in den meisten Organisationen heute noch nicht. IT und Fachabteilung leben oft in getrennten Welten. Die Fachabteilung bekommt Daten, kann aber nicht einschätzen, welche Limitationen darin stecken. Die IT stellt bereit, was abgefragt wird, denkt aber nicht mit, was am Ende damit passieren soll. Das Ergebnis: Die Analysen sind technisch korrekt, gehen aber an der Realität vorbei.
Ein weiterer Irrtum ist, dass mehr Daten automatisch eine bessere Entscheidungsgrundlage bieten. Im Moment erlebe ich unzählige Startups, die versprechen, alle Unternehmensdaten zu vernetzen – Datenbanken, Belege, Buchhaltung, gesammeltes Wissen – und sie für alle Mitarbeitenden zugänglich zu machen. Das klingt verlockend. Aber nur weil mehr Daten vorhanden sind, stecken darin nicht automatisch mehr verwertbare Informationen.
KI bringt dieses Problem auf einen Höhepunkt. Unternehmen nutzen ihre riesigen Datenmengen, um Prozesse mithilfe von KI zu automatisieren, ohne die Prozesse vorher wirklich verstanden zu haben. Heraus kommen Entscheidungen, die auf einer Reproduktion von Mustern in fehlerhaften Daten basieren. Ohne Datenkompetenz bleibt diese Problematik gänzlich unentdeckt und kann großen Schaden anrichten. Ein schlechter Prozess, der digitalisiert wird, ist ein schlechter digitaler Prozess.
Was KI-Kompetenz wirklich bedeutet – und das Minimum, das alle brauchen
Wenn ich gefragt werde, was Menschen im Umgang mit KI mindestens verstehen sollten, ist meine Antwort überraschend schlicht: Es fängt nicht mit Kompetenz an, sondern vielmehr mit Awareness.
Also mit dem Bewusstsein: Was ist KI und was ist es nicht? Wann interagiere ich mit einem KI-System, und wann sitzt mir ein Mensch gegenüber? Und: Wie kann ich aktiv entscheiden, ein System nicht zu nutzen oder meine Daten nicht zu teilen?
Das klingt nach wenig, ist aber das Fundament, auf dem alles andere aufbaut.
Darüber liegt die erste Stufe echter Datenkompetenz: im Alltag bewusst hinterfragen, wo mir Datenanalysen begegnen. Sind sie gerechtfertigt? Sind sie möglicherweise manipulativ? Wie wurde das Ergebnis erzielt, das mir gerade präsentiert wird?
Beinahe jede Smartwatch misst heutzutage den Sauerstoffgehalt im Blut – oder genauer: Sie sendet einen Lichtstrahl, der reflektiert wird, und berechnet daraus einen Näherungswert. Wichtig ist dabei zu verstehen, dass es sich nicht um eine klinische Messung handelt. Wenn auf dem Display ein Wert von 90 % angezeigt wird und ein Alarm losgeht, sollte ich das einordnen können. Ist das ein echter Befund oder ein Messfehler?
Solche Fragen stellen wir uns zu selten. Dabei begegnen uns Daten und Algorithmen längst überall. Von der App auf dem Smartphone über die Steuerung in einem Logistikzentrum bis hin zur Pflegedienstplanung im Krankenhaus. In all diesen Kontexten trifft mangelnde Datenkompetenz auf weitreichende Konsequenzen.
Auch Medien argumentieren immer häufiger mit Statistiken, die oft schlichtweg falsch sind. So kursieren beispielsweise Schlagzeilen, die behaupten, bestimmte Lebensmittel schützen vor Krebs.

Wenn man nachhakt, stellt sich heraus, dass keinerlei Evidenz vorliegt und die zugrunde liegenden Zahlen eigentlich etwas ganz anderes zeigen. Wir haben uns so an solche Überschriften gewöhnt, dass wir den Schaden, den sie anrichten, kaum noch wahrnehmen.
Das Oberlehrerproblem: Warum Initiativen scheitern
Es gibt immer wieder Phasen, in denen das Thema Data Literacy plötzlich Aufmerksamkeit bekommt. Online-Schulungen schießen aus dem Boden, Initiativen werden gestartet, Rahmenwerke entwickelt. Und nach kurzer Zeit versandet alles wieder. Ich glaube, das hat zwei Hauptgründe.
Der erste ist strukturell: Data Literacy fehlt in der politischen Agenda. Im aktuellen Koalitionsvertrag taucht das Wort „Datenkompetenz“ nicht auf. Solange das Thema aber nicht schon in einer frühen Phase der Schulbildung aufgegriffen wird, werden wir die breite Bevölkerung nicht erreichen. Der Bildungsföderalismus in Deutschland bremst den Fortschritt auf diesem Gebiet zusätzlich.
Der zweite Grund ist kulturell: Wir haben die Oberlehrerkultur noch nicht überwunden.
Wir sind es gewohnt, dass jemand vorne steht, der/die weiß, wie es geht, Fragen stellt und auf jede Frage eine richtige oder falsche Antwort erwartet. Das lässt sich ein wenig mit dem Matheunterricht in der Grundschule vergleichen. Leider vermitteln viele Datenexpert:innen genau so ihr Wissen: als Vortragende, die anderen erklären, wie die Welt auszusehen hat.
Allerdings funktionieren Daten nicht wie Matheaufgaben. Im Gegensatz zu mathematischen Gleichungen enthalten Daten Unsicherheit, Bewertung und Kontextabhängigkeit. Zwei Menschen mit exakt denselben Daten und demselben Kompetenzniveau können sie trotzdem unterschiedlich interpretieren – einfach, weil sie den Kontext anders einschätzen. Ohne mehr Wissen über diesen Kontext ist die eine Interpretation möglicherweise genauso gerechtfertigt wie die andere. Sie ist nicht besser oder schlechter, sondern schlichtweg anders.
Das „Ich weiß es aber besser“-Auftreten ist in diesem Umfeld äußerst kontraproduktiv. Wir lernen es in der Schule, wiederholen es an Universitäten, und tragen es letztlich in Unternehmen und Behörden weiter. Angesichts dessen ist es kaum verwunderlich, dass Datenkompetenz nicht ankommt.
Was wirklich funktioniert: Augenhöhe statt Expertenmodus
Dass es nicht funktioniert, wenn man anderen erzählt, was sie mit ihren Daten zu tun und zu lassen haben, habe ich am eigenen Leib erfahren.
Ich arbeite seit einigen Jahren in einem Forschungsprojekt mit dem deutschen Zoll zusammen. Das ursprüngliche Ziel war, mit KI-Methoden besser zu verstehen, wie Handelsbeziehungen funktionieren und wie der Zoll seine Kontrollen effizienter gestalten kann.
Was wir aber schnell merkten: Mit der Haltung „Wir kommen als Expert:innen und zeigen euch, was mit euren Daten möglich ist“, stießen wir auf Widerstand. Der Zoll ist eine stark hierarchisch geprägte Organisation, in der erfahrene Mitarbeiter:innen seit Jahrzehnten auf ihr Erfahrungswissen setzen. Der Eindruck, ein Computer könnte in Zukunft Arbeitsschritte dirigieren, schreckte viele ab.
Also haben wir etwas anderes gemacht. Ich habe die Beamt:innen selbst über vier Wochen an verschiedenen Flughäfen begleitet. Und dabei habe ich etwas Entscheidendes erlebt: Die Menschen vor Ort wussten sehr genau, wo die Herausforderungen lagen. Sie wussten, wo die Daten entstehen, wo Fehler passieren, was man verbessern könnte. Sie hatten Ideen und brauchten nur jemanden, der ihnen zuhört.

Grafikquelle: Afs-Akademie.org [Du kannst die Grafik unter Angabe der Quelle und einer Verlinkung zu uns verwenden.]
Nach dieser Erkenntnis haben wir unseren Fokus grundlegende verändert. Statt Lösungen von außen nach innen zu tragen, haben wir Use Cases gemeinsam mit den Beamt:innen entwickelt. So konnte echtes Vertrauen, echte Zusammenarbeit und echte Ergebnisse entstehen. Mittlerweile ist diese Thematik sogar in erste Publikationen eingeflossen.
Einen Satz habe ich seitdem nicht vergessen: Nobody cares what you know, until they know that you care.
Das gilt nicht nur für Behörden. Es gilt für jedes Datenprojekt, jede Schulungsinitiative und jede Organisation, die versucht, eine Kultur der Datenkompetenz aufzubauen. Wer das Interesse der Menschen gewinnen will, muss zuerst Interesse an den Menschen zeigen. Wer als Expert:in reinkommt und lediglich Wissen abliefert, verliert.
Wo wir historisch stehen – und was das für die Zukunft bedeutet
Die langsame Verbreitung von Data Literacy lässt sich leicht als Versagen abstempeln. Historisch gesehen ist das allerdings ein sehr gängiges Phänomen.
Als das Auto erfunden wurde, fuhren nicht plötzlich alle Auto. Es gab speziell ausgebildete Chauffeure, ein Fahrzeug zu besitzen war zunächst ein Luxus. Erst als Autos erschwinglich wurden, verbreitete sich auch die Fahrfähigkeit in der breiten Bevölkerung.
Ähnlich verhält es sich beim Lesen und Schreiben. Vor dem Buchdruck konnten vor allem Menschen im kirchlichen Umfeld lesen. Erst als Bücher günstig und zugänglich wurden, begann sich die Lesefähigkeit zu verbreiten.
Daten und KI befinden sich gerade in einer ähnlichen Phase. Die Technologie ist noch nicht überall angekommen und die Kompetenz, sie zu nutzen und zu hinterfragen, verbreitet sich langsamer als die Technologie selbst. Erst wenn die Technologie funktionsfähig genug ist und die Allgemeinheit erreicht, fangen Menschen an zu merken, dass sie mehr wissen und können sollten.
Was uns dennoch aufhorchen lassen sollte: In Deutschland gelten nach Schätzungen rund sieben Millionen erwachsene Menschen als funktionale Analphabet:innen. Sie können einfache Texte wie Behördenbriefe nicht vollständig verstehen, obwohl Lesen seit Generationen in der Schule gelehrt wird. Wenn wir dieses Problem beim Lesen noch nicht vollständig gelöst haben, sollten wir uns keine Illusionen machen, wie schnell Data Literacy flächendeckend gelingt.
Doch statt der Zukunft pessimistisch entgegenzublicken, ist es viel wichtiger, jetzt anzufangen. Denn je länger wir damit warten, Datenkompetenz als gesellschaftliche Grundkompetenz zu behandeln, desto größer wird die Lücke zwischen denen, die Daten verstehen, und denen, die es nicht tun.

Grafikquelle: Afs-Akademie.org [Du kannst die Grafik unter Angabe der Quelle und einer Verlinkung zu uns verwenden.]
Fazit: Datenkompetenz als Mindset
Data Literacy ist keine Fähigkeit für Spezialist:innen. Sie ist keine Frage von Tools, Dashboards oder Algorithmen. Sie ist eine Grundkompetenz für eine Welt, in der Daten überall sind und Entscheidungen immer häufiger auf ihrer Basis getroffen werden.
Wir haben in den letzten Jahren viel in Datentechnik investiert. Aber Technik allein reicht nicht. Was fehlt, ist das Verständnis: Woher kommen die Daten? Was bilden sie wirklich ab? Welche Unsicherheiten stecken darin? Was darf ich daraus schlussfolgern und was nicht?
Die gute Nachricht: Es braucht kein Informatikstudium, um diese Fragen stellen zu können. Es braucht Neugier, kritisches Denken und die Bereitschaft, sich mit Unsicherheit zu arrangieren.
Und es braucht eine andere Haltung: weniger reine Wissensvermittlung, mehr Dialog. Weniger „Ich erkläre euch jetzt, wie Daten funktionieren“ – mehr „Was beschäftigt euch eigentlich, und wie könnten Daten dabei helfen?“
Datenkompetenz ist ein Mindset, dass wir alle lernen können und sollten.
FAQ
Was ist Data Literacy und warum geht der Begriff über technische Fähigkeiten hinaus?
Data Literacy bedeutet nicht nur, Daten verarbeiten zu können, sondern sie kritisch zu hinterfragen, im Kontext einzuordnen und daraus fundierte Schlüsse zu ziehen – ähnlich wie echte Lesekompetenz weit mehr umfasst als das Erkennen von Buchstaben.
Warum scheitern so viele Initiativen zur Datenkompetenz in Unternehmen?
Weil sie im Expertenmodus von oben herab vermittelt werden – wer Datenkompetenz wie Matheunterricht behandelt, vergisst, dass Daten Kontext, Unsicherheit und Interpretation enthalten, und verliert die Menschen, bevor er sie erreicht hat.
Warum sind mehr Daten nicht automatisch eine bessere Entscheidungsgrundlage?
Weil Datenqualität bedeutet, wie gut Daten die Realität tatsächlich abbilden – nicht ob technisch alles fehlerfrei ist. Wer schlechte Prozesse mit KI automatisiert, erhält schnellere schlechte Ergebnisse, keine besseren.