{"id":554,"date":"2016-10-14T16:14:02","date_gmt":"2016-10-14T14:14:02","guid":{"rendered":"http:\/\/blog.iese.fraunhofer.de\/?p=554"},"modified":"2024-02-19T12:01:21","modified_gmt":"2024-02-19T11:01:21","slug":"quantity-over-quality-mistake","status":"publish","type":"post","link":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/","title":{"rendered":"Data Quality &#8211; A BIG Challenge for BIG Data"},"content":{"rendered":"<p><strong>Lassen Sie sich nicht in die Irre f\u00fchren!<\/strong><\/p>\n<p>Wenn \u00fcber Big Data gesprochen wird h\u00f6rt man h\u00e4ufig vom Prinzip \u201eQuantity over Quality\u201c. So auch wieder bei einer Keynote im Rahmen der <a href=\"http:\/\/iwsm-mensura.org\/2016\">IWSM\/Mensura<\/a>, auf der ich letzte Woche unsere <a href=\"http:\/\/www.klaes.org\/Z-files\/Klaes-IWSM-2016-BigDataQuality.pdf\">Arbeiten zur Datenqualit\u00e4t<\/a> vorgestellt habe.<\/p>\n<p>Das Argument ist h\u00e4ufig wie folgt: \u201eBei Big Data haben wir so viele Daten, dass es auf deren Qualit\u00e4t nicht unbedingt ankommt. Die Masse an Daten mittelt die Probleme schon wieder raus.\u201c Wenn Sie das auch denken, dann befinden Sie sich in guter Gesellschaft: Sie erliegen dem gleichen Missverst\u00e4ndnis wie viele Entscheidungstr\u00e4ger, die von diesem Prinzip zum ersten Mal h\u00f6ren. Dies liegt daran, dass \u201eQuantity over Quality\u201c eine Fehlinterpretation geradezu herausfordert und damit Big-Data-Initiativen in die Irre f\u00fchren kann.<\/p>\n<p>Um dieses verbreitete Missverst\u00e4ndnis aufzukl\u00e4ren, skizziere ich in diesem Beitrag, warum auch bei steigenden Datenmengen die Qualit\u00e4t wichtig bleibt und erkl\u00e4re anschlie\u00dfend, was mit \u201eQuantity over Quality\u201c im <a href=\"https:\/\/en.wikipedia.org\/wiki\/Machine_learning\">maschinellen Lernen<\/a> eigentlich gemeint ist.<\/p>\n<hr \/>\n<p><strong>Data Quality Matters!<\/strong><\/p>\n<p>Der Fragestellung angemessene und repr\u00e4sentative Daten waren seit jeher und bleiben weiterhin die Grundlage valider Analyseergebnisse. Fehlerhafte Daten f\u00fchren im besten Fall zu einem Rauschen, das die Ergebnisqualit\u00e4t bis hin zu einem Punkt reduziert, an dem die Ergebnisse selbst unbrauchbar werden. Sie k\u00f6nnen aber auch zu v\u00f6llig fehlerhaften Schlussfolgerungen und damit auch Entscheidungen f\u00fchren, was deutlich schlimmer ist.<\/p>\n<p>Fehler durch h\u00f6here Datenmengen herauszurechnen funktioniert nur, wenn die Fehlerursache zu einem zuf\u00e4lligen Rauschen in den Daten f\u00fchrt, wobei die hierzu ben\u00f6tigte Datenmenge im Allgemeinen nicht linear, sondern quadratisch mit dem Fehler steigt. In der Praxis haben wir es h\u00e4ufig aber nicht mit zuf\u00e4lligen St\u00f6rungen, sondern mit systematischen Fehlern zu tun, bei denen auch gro\u00dfe Datenmengen nicht helfen. Solche Fehler k\u00f6nnen beispielsweise durch eine unklare Grundgesamtheit, eine nicht repr\u00e4sentative Stichprobe, fehlerbehaftete Datenerfassung oder ungeeignete Skalen auftreten.<\/p>\n<p>Gut illustrieren l\u00e4sst sich das an einem Beispiel aus dem Buch \u201eWe are Big Data: The Future of the Information Society\u201c, das dort dazu dient, das Prinzip \u201eQuantity over Quality\u201c zu belegen. Die Autoren behaupten, dass man, um die durchschnittliche Gr\u00f6\u00dfe der Sch\u00fcler in einer Klasse genauer zu bestimmen, einfach die Anzahl der vermessenen Sch\u00fcler erh\u00f6ht und somit den Messfehler senkt, ohne dass man sich um das Messverfahren oder die verwendeten Messinstrumente k\u00fcmmern m\u00fcsste. <span style=\"text-decoration: underline;\">So ganz stimmt das leider nicht<\/span>: Nehmen wir an, wir haben eine fehlerhafte Messlatte, auf der ein Meter nur 95cm hat, oder wir lesen anstelle von Zentimetern die ebenfalls vorhandene Inch-Skala ab. Dann hilft es auch nicht, die Anzahl der vermessenen Sch\u00fcler zu erh\u00f6hen \u2013 das Ergebnis bleibt fehlerhaft. Auch wenn wir die Sch\u00fcler nicht zuf\u00e4llig ausw\u00e4hlen, sondern beispielsweise systematisch Sch\u00fclerinnen bevorzugen, w\u00fcrde selbst eine erh\u00f6hte Menge von Messungen keine besseren Ergebnisse liefern.<\/p>\n<p>Hier bleibt es beim bekannten \u201eGarbage In, Garbage Out\u201c: Ein Haufen Abfall wird erst einmal nicht dadurch n\u00fctzlicher, dass er besonders gro\u00df ist. In der neuen Datenwelt sollte man daher auch den Nutzen so genannter \u201e<a href=\"https:\/\/en.wikipedia.org\/wiki\/Data_lake\">Data Lakes<\/a>\u201c, in die der gesamte \u201eDatenabfall\u201c gepumpt wird, kritisch hinterfragen, insbesondere dann, wenn die Bef\u00fcllung eines solchen DIE Big-Data-Strategie im Unternehmen darstellt.<\/p>\n<figure id=\"attachment_576\" aria-describedby=\"caption-attachment-576\" style=\"width: 641px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-576\" src=\"http:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Abfall-400x267.jpg\" alt=\"\u201eGarbage In, Garbage Out\u201c: Ein Haufen Abfall wird erst einmal nicht dadurch n\u00fctzlicher, dass er besonders gro\u00df ist.\" width=\"641\" height=\"427\" srcset=\"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Abfall-400x267.jpg 400w, https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Abfall-768x512.jpg 768w, https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Abfall-698x465.jpg 698w, https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Abfall.jpg 1280w\" sizes=\"auto, (max-width: 641px) 100vw, 641px\" \/><figcaption id=\"caption-attachment-576\" class=\"wp-caption-text\">Mehr ist nicht immer besser. Dies gilt auch bei Daten&#8230;<\/figcaption><\/figure>\n<hr \/>\n<p><strong>Was bedeutet nun aber \u201eQuantity over Quality\u201c?<\/strong><\/p>\n<p>Gemeint ist in Fachkreisen gew\u00f6hnlich, dass bei hinreichender Quantit\u00e4t der Daten auch \u201eeinfache\u201c Modelle ohne komplexes Hintergrundwissen und komplizierte h\u00e4ndische Optimierung (also mit geringerer \u201eQualit\u00e4t\u201c) komplexe Sachverhalte erfassen und hinreichend gute Ergebnisse liefern k\u00f6nnen.<\/p>\n<p>Ein Beispiel, das dieses Verst\u00e4ndnis st\u00fctzt und h\u00e4ufig zitiert wird (so auch auf besagter Keynote), sind die Durchbr\u00fcche bei Google durch die Nutzung von neuronalen Netzen und \u201e<a href=\"https:\/\/en.wikipedia.org\/wiki\/Deep_learning\">Deep Learning<\/a>\u201c. Bei \u00dcbersetzungen zwischen unterschiedlichen Sprachen liefern solche statistische Verfahren bei ausreichenden Datenmengen deutlich bessere Ergebnisse als klassische Ans\u00e4tze der maschinellen \u00dcbersetzung, die auf komplexen Sprachmodellen und Annotationen beruhen. Die \u00dcbersetzungen werden dabei unabh\u00e4ngig von Optimierungen an der Lernmethode umso besser, je mehr \u00fcbersetzte Texte zur Verf\u00fcgung stehen, auf denen das Modell trainiert werden kann. In solchen F\u00e4llen macht es durchaus Sinn, anstelle Aufwand in die weitere Optimierung der Lernmethode zu investieren, erst einmal m\u00f6glichst viele Datenquellen mit \u00dcbersetzungen zu erschlie\u00dfen. Aber auch hier gilt der Grundsatz nicht uneingeschr\u00e4nkt. Vielmehr zeigt er seine G\u00fcltigkeit insbesondere bei Problemstellungen mit hoher Varianz und vielen m\u00f6glichen Variablen, wie sie bei der Sprach- oder Bildanalyse auftreten.<\/p>\n<p>So bleibt es leider bei der Wunschvorstellung, dass Big Data uns das l\u00e4stige Problem der Datenqualit\u00e4t abnimmt. In der Realit\u00e4t werden wir uns mit dieser sowohl in der Praxis als auch in der Forschung rund um \u201eSmart Data\u201c (z.B. im <a href=\"http:\/\/www.pro-opt.org\">PRO-OPT-Projekt<\/a>) weiter besch\u00e4ftigen m\u00fcssen.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wenn \u00fcber Big Data gesprochen wird h\u00f6rt man h\u00e4ufig vom Prinzip \u201eQuantity over Quality\u201c. Um dieses verbreitete Missverst\u00e4ndnis aufzukl\u00e4ren, skizziert der Beitrag warum auch bei steigenden Datenmengen die Qualit\u00e4t wichtig bleibt und erkl\u00e4rt was mit \u201eQuantity over Quality\u201c eigentlich gemeint ist.<\/p>\n","protected":false},"author":26,"featured_media":577,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[13],"tags":[26,104],"coauthors":[46],"class_list":["post-554","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-veranstaltung","tag-big-data","tag-data-analytics"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.3 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Data Quality - A BIG Challenge for BIG Data \u2013 Fraunhofer IESE<\/title>\n<meta name=\"description\" content=\"Big Data - Wir skizziern, warum bei steigenden Datenmengen die Qualit\u00e4t wichtig bleibt und erkl\u00e4ren, was mit \u201eQuantity over Quality\u201c eigentlich gemeint ist.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Data Quality - A BIG Challenge for BIG Data \u2013 Fraunhofer IESE\" \/>\n<meta property=\"og:description\" content=\"Big Data - Wir skizziern, warum bei steigenden Datenmengen die Qualit\u00e4t wichtig bleibt und erkl\u00e4ren, was mit \u201eQuantity over Quality\u201c eigentlich gemeint ist.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/\" \/>\n<meta property=\"og:site_name\" content=\"Fraunhofer IESE\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/FraunhoferIESE\/\" \/>\n<meta property=\"article:published_time\" content=\"2016-10-14T14:14:02+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-02-19T11:01:21+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Quality_Quantity.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1280\" \/>\n\t<meta property=\"og:image:height\" content=\"853\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Dr. Michael Kl\u00e4s\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@FraunhoferIESE\" \/>\n<meta name=\"twitter:site\" content=\"@FraunhoferIESE\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. Michael Kl\u00e4s\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"4\u00a0Minuten\" \/>\n\t<meta name=\"twitter:label3\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data3\" content=\"Dr. Michael Kl\u00e4s\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/\"},\"author\":{\"name\":\"Dr. Michael Kl\u00e4s\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#\\\/schema\\\/person\\\/790f3967298ec81883eb87ed11d86c5e\"},\"headline\":\"Data Quality &#8211; A BIG Challenge for BIG Data\",\"datePublished\":\"2016-10-14T14:14:02+00:00\",\"dateModified\":\"2024-02-19T11:01:21+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/\"},\"wordCount\":820,\"publisher\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2016\\\/10\\\/Quality_Quantity.jpg\",\"keywords\":[\"Big Data\",\"Data Analytics\"],\"articleSection\":[\"Veranstaltung\"],\"inLanguage\":\"de\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/\",\"name\":\"Data Quality - A BIG Challenge for BIG Data \u2013 Fraunhofer IESE\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2016\\\/10\\\/Quality_Quantity.jpg\",\"datePublished\":\"2016-10-14T14:14:02+00:00\",\"dateModified\":\"2024-02-19T11:01:21+00:00\",\"description\":\"Big Data - Wir skizziern, warum bei steigenden Datenmengen die Qualit\u00e4t wichtig bleibt und erkl\u00e4ren, was mit \u201eQuantity over Quality\u201c eigentlich gemeint ist.\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/#primaryimage\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2016\\\/10\\\/Quality_Quantity.jpg\",\"contentUrl\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2016\\\/10\\\/Quality_Quantity.jpg\",\"width\":1280,\"height\":853,\"caption\":\"Businessman in suit against digital background with icons\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/quantity-over-quality-mistake\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Startseite\",\"item\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Data Quality &#8211; A BIG Challenge for BIG Data\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#website\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/\",\"name\":\"Fraunhofer IESE\",\"description\":\"Blog des Fraunhofer-Institut f\u00fcr Experimentelles Software Engineering\",\"publisher\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#organization\",\"name\":\"Fraunhofer IESE\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2016\\\/08\\\/fhg_iese_logo.png\",\"contentUrl\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2016\\\/08\\\/fhg_iese_logo.png\",\"width\":183,\"height\":50,\"caption\":\"Fraunhofer IESE\"},\"image\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/FraunhoferIESE\\\/\",\"https:\\\/\\\/x.com\\\/FraunhoferIESE\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/fraunhoferiese\\\/\",\"https:\\\/\\\/www.youtube.com\\\/c\\\/FraunhoferIESE\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#\\\/schema\\\/person\\\/790f3967298ec81883eb87ed11d86c5e\",\"name\":\"Dr. Michael Kl\u00e4s\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2022\\\/02\\\/klaes_michael-96x96.jpg83e380d8683e0c7345165dedbc8ccb71\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2022\\\/02\\\/klaes_michael-96x96.jpg\",\"contentUrl\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2022\\\/02\\\/klaes_michael-96x96.jpg\",\"caption\":\"Dr. Michael Kl\u00e4s\"},\"description\":\"Dr. Michael Kl\u00e4s ist seit Abschluss seines Informatikstudiums in der angewandten Forschung t\u00e4tig und ber\u00e4t Unternehmen in den Bereichen Softwarequalit\u00e4t und Datenanalyse. Im Laufe der letzten Dekade verantwortete er in zahlreichen Industrie- und Forschungsprojekten insbesondere den Aufbau von KPI-Systemen, die Evaluation neuer Technologien und die Entwicklung pr\u00e4diktiver Analysen. In seiner Dissertation besch\u00e4ftigte er sich mit der Vorhersage von Softwarefehlern unter Einbeziehung von Expertenwissen. Aktuell liegt sein Schwerpunkt im Bereich der Potenzialanalyse f\u00fcr datengetriebene Innovation und der Datenqualit\u00e4ts- und Unsicherheitsanalyse bei Big-Data- und KI-Systemen. Als Autor zahlreicher Fachpublikationen engagiert er sich zudem als Hochschuldozent und als Experte bei der Normierung (DIN\\\/VDE).\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/author\\\/michael-klaes\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Data Quality - A BIG Challenge for BIG Data \u2013 Fraunhofer IESE","description":"Big Data - Wir skizziern, warum bei steigenden Datenmengen die Qualit\u00e4t wichtig bleibt und erkl\u00e4ren, was mit \u201eQuantity over Quality\u201c eigentlich gemeint ist.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/","og_locale":"de_DE","og_type":"article","og_title":"Data Quality - A BIG Challenge for BIG Data \u2013 Fraunhofer IESE","og_description":"Big Data - Wir skizziern, warum bei steigenden Datenmengen die Qualit\u00e4t wichtig bleibt und erkl\u00e4ren, was mit \u201eQuantity over Quality\u201c eigentlich gemeint ist.","og_url":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/","og_site_name":"Fraunhofer IESE","article_publisher":"https:\/\/www.facebook.com\/FraunhoferIESE\/","article_published_time":"2016-10-14T14:14:02+00:00","article_modified_time":"2024-02-19T11:01:21+00:00","og_image":[{"width":1280,"height":853,"url":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Quality_Quantity.jpg","type":"image\/jpeg"}],"author":"Dr. Michael Kl\u00e4s","twitter_card":"summary_large_image","twitter_creator":"@FraunhoferIESE","twitter_site":"@FraunhoferIESE","twitter_misc":{"Verfasst von":"Dr. Michael Kl\u00e4s","Gesch\u00e4tzte Lesezeit":"4\u00a0Minuten","Written by":"Dr. Michael Kl\u00e4s"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/#article","isPartOf":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/"},"author":{"name":"Dr. Michael Kl\u00e4s","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#\/schema\/person\/790f3967298ec81883eb87ed11d86c5e"},"headline":"Data Quality &#8211; A BIG Challenge for BIG Data","datePublished":"2016-10-14T14:14:02+00:00","dateModified":"2024-02-19T11:01:21+00:00","mainEntityOfPage":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/"},"wordCount":820,"publisher":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#organization"},"image":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/#primaryimage"},"thumbnailUrl":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Quality_Quantity.jpg","keywords":["Big Data","Data Analytics"],"articleSection":["Veranstaltung"],"inLanguage":"de"},{"@type":"WebPage","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/","url":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/","name":"Data Quality - A BIG Challenge for BIG Data \u2013 Fraunhofer IESE","isPartOf":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/#primaryimage"},"image":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/#primaryimage"},"thumbnailUrl":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Quality_Quantity.jpg","datePublished":"2016-10-14T14:14:02+00:00","dateModified":"2024-02-19T11:01:21+00:00","description":"Big Data - Wir skizziern, warum bei steigenden Datenmengen die Qualit\u00e4t wichtig bleibt und erkl\u00e4ren, was mit \u201eQuantity over Quality\u201c eigentlich gemeint ist.","breadcrumb":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/#primaryimage","url":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Quality_Quantity.jpg","contentUrl":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Quality_Quantity.jpg","width":1280,"height":853,"caption":"Businessman in suit against digital background with icons"},{"@type":"BreadcrumbList","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/quantity-over-quality-mistake\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Startseite","item":"https:\/\/www.iese.fraunhofer.de\/blog\/"},{"@type":"ListItem","position":2,"name":"Data Quality &#8211; A BIG Challenge for BIG Data"}]},{"@type":"WebSite","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#website","url":"https:\/\/www.iese.fraunhofer.de\/blog\/","name":"Fraunhofer IESE","description":"Blog des Fraunhofer-Institut f\u00fcr Experimentelles Software Engineering","publisher":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.iese.fraunhofer.de\/blog\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Organization","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#organization","name":"Fraunhofer IESE","url":"https:\/\/www.iese.fraunhofer.de\/blog\/","logo":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#\/schema\/logo\/image\/","url":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/08\/fhg_iese_logo.png","contentUrl":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/08\/fhg_iese_logo.png","width":183,"height":50,"caption":"Fraunhofer IESE"},"image":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/FraunhoferIESE\/","https:\/\/x.com\/FraunhoferIESE","https:\/\/www.linkedin.com\/company\/fraunhoferiese\/","https:\/\/www.youtube.com\/c\/FraunhoferIESE"]},{"@type":"Person","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#\/schema\/person\/790f3967298ec81883eb87ed11d86c5e","name":"Dr. Michael Kl\u00e4s","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2022\/02\/klaes_michael-96x96.jpg83e380d8683e0c7345165dedbc8ccb71","url":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2022\/02\/klaes_michael-96x96.jpg","contentUrl":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2022\/02\/klaes_michael-96x96.jpg","caption":"Dr. Michael Kl\u00e4s"},"description":"Dr. Michael Kl\u00e4s ist seit Abschluss seines Informatikstudiums in der angewandten Forschung t\u00e4tig und ber\u00e4t Unternehmen in den Bereichen Softwarequalit\u00e4t und Datenanalyse. Im Laufe der letzten Dekade verantwortete er in zahlreichen Industrie- und Forschungsprojekten insbesondere den Aufbau von KPI-Systemen, die Evaluation neuer Technologien und die Entwicklung pr\u00e4diktiver Analysen. In seiner Dissertation besch\u00e4ftigte er sich mit der Vorhersage von Softwarefehlern unter Einbeziehung von Expertenwissen. Aktuell liegt sein Schwerpunkt im Bereich der Potenzialanalyse f\u00fcr datengetriebene Innovation und der Datenqualit\u00e4ts- und Unsicherheitsanalyse bei Big-Data- und KI-Systemen. Als Autor zahlreicher Fachpublikationen engagiert er sich zudem als Hochschuldozent und als Experte bei der Normierung (DIN\/VDE).","url":"https:\/\/www.iese.fraunhofer.de\/blog\/author\/michael-klaes\/"}]}},"jetpack_featured_media_url":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/10\/Quality_Quantity.jpg","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/posts\/554","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/users\/26"}],"replies":[{"embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/comments?post=554"}],"version-history":[{"count":33,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/posts\/554\/revisions"}],"predecessor-version":[{"id":8624,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/posts\/554\/revisions\/8624"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/media\/577"}],"wp:attachment":[{"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/media?parent=554"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/categories?post=554"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/tags?post=554"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/coauthors?post=554"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}