CINXE.COM

Korpora im DWDS | DWDS

<!DOCTYPE html> <html lang="de" itemscope itemtype="http://schema.org/WebPage"> <head> <meta charset="utf-8"> <meta name="tdm-reservation" content="1"> <meta name="tdm-policy" content="https://www.dwds.de/dwds_static/tdm-policy.json"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1"> <base href="/"> <title>Korpora im DWDS | DWDS</title> <!-- preloading CSS and fonts --> <link href="https://www.dwds.de/dwds_static/fonts/crimson-text-v8-latin-regular.woff2" as="font" rel="preload" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/fonts/source-sans-pro-v21-latin-ext_latin-italic.woff2" as="font" rel="preload" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/bootstrap-3.3.7-dist/fonts/glyphicons-halflings-regular.woff2" as="font" rel="preload" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/fonts.css" rel="preload" as="style" onload="this.rel='stylesheet'" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/fonts.css" rel="stylesheet preload" as="style" crossorigin="anonymous"> <!-- feeds --> <link rel="search" type="application/opensearchdescription+xml" title="DWDS Suche" href="/search.xml"> <link rel="alternate" type="application/atom+xml" title="DWDS: Artikel des Tages" href="/api/feed/adt"/> <link rel="alternate" type="application/atom+xml" title="DWDS: Neueste Artikel" href="/api/feed/latest"/> <!-- //feeds --> <meta property="og:description" content="DWDS – Digitales Wörterbuch der deutschen Sprache"/> <meta name="twitter:title" content="DWDS – Digitales Wörterbuch der deutschen Sprache"/> <meta itemprop="name" content="DWDS – Digitales Wörterbuch der deutschen Sprache"/><meta name="description" content="Korpora im DWDS"/> <meta property="og:title" content="Korpora im DWDS"/> <meta name="twitter:description" content="Korpora im DWDS"/><meta property="og:image" content="https://www.dwds.de/dwds_static/images/dwds-og.png"/><meta property="og:url" content="https://www.dwds.de/d/korpora"/> <meta property="og:type" content="article"/> <meta property="og:locale" content="de"/> <meta property="og:site_name" content="DWDS"/> <meta name="twitter:card" content="summary_large_image"/><meta property="twitter:image:src" content="https://www.dwds.de/dwds_static/images/d-200.png"/><meta property="image" content="https://www.dwds.de/dwds_static/images/dwds_601_141.png"/><meta itemprop="url" content="https://www.dwds.de/d/korpora"/> <!-- favicon --> <link rel="apple-touch-icon" sizes="180x180" href="/apple-touch-icon.png?v=QEJw5qWp5M"> <link rel="icon" type="image/png" sizes="32x32" href="/favicon-32x32.png?v=QEJw5qWp5M"> <link rel="icon" type="image/png" sizes="16x16" href="/favicon-16x16.png?v=QEJw5qWp5M"> <link rel="manifest" href="/site.webmanifest?v=QEJw5qWp5M" crossorigin="use-credentials"> <link rel="mask-icon" href="/safari-pinned-tab.svg?v=QEJw5qWp5M" color="#125993"> <link rel="shortcut icon" href="/favicon.ico?v=QEJw5qWp5M"> <meta name="msapplication-TileColor" content="#125993"> <meta name="theme-color" content="#ffffff"> <!-- //favicon --> <!-- Bootstrap --> <link href="https://www.dwds.de/dwds_static/bootstrap-3.3.7-dist/css/bootstrap.min.css" rel="stylesheet"><script type="application/ld+json"> [ { "@context": "https://schema.org", "@type": "WebSite", "url": "/", "potentialAction": { "@type": "SearchAction", "target": "/?q={search_term_string}", "query-input": "required name=search_term_string" } }, { "@context": "https://schema.org", "@type": "Organization", "url": "/", "logo": "https://www.dwds.de/dwds_static/images/dwds_601_141.png", "sameAs" : [ "https://wisskomm.social/@dwds" ], "contactPoint": { "@type": "ContactPoint", "telephone": "+4930203700", "email": "dwds@bbaw.de" } } ] </script> </head> <body> <header><noscript> <div class="alert alert-danger sans" style="text-align:center;margin-bottom:5px" data-nosnippet> Um den vollen Funktionsumfang dieser Webseite nutzen zu können, muss JavaScript aktiviert sein.<br /> <a href="https://www.enable-javascript.com/de/" target="_blank">Hier finden Sie Hinweise, wie Sie JavaScript in Ihrem Browser aktivieren können.</a> </div> </noscript><div id="top"></div><!-- spinner --> <div id="spinner" style="display:none">Bitte warten Sie einen Moment &hellip;</div><nav class="navbar navbar-default navbar-static-top dwds-top"> <div class="container-fluid" style="padding-left:0"> <div class="navbar-header"> <a class="navbar-brand visible-xs-inline" href="/" style="margin:1px;padding:0 0 0 15px"><img src="https://www.dwds.de/dwds_static/images/dwds.svg" width="210" height="50" alt="DWDS-Logo" /></a> <a class="navbar-brand hidden-xs" href="/" style="margin:1px;padding:0"><img src="https://www.dwds.de/dwds_static/images/dwds.svg" width="210" height="50" data-toggle="tooltip" data-placement="right" title="Digitales Wörterbuch der deutschen Sprache" alt="DWDS-Logo" /></a> <div class="visible-xs-inline-block navbar-right-mobile"> <a href="https://www.dwds.de/profile/login?c=d%2Fkorpora" class="btn btn-sm btn-default" rel="nofollow"><span class="glyphicon glyphicon-log-in"></span> Login</a> </div> </div> <div id="navbar" class="navbar-collapse collapse"> <ul class="nav navbar-nav navbar-left"> <li class="hidden-xs hidden-sm sf dwds-header-link-li"> <span class="dwds-claim"> Der deutsche Wortschatz von 1600 bis heute. </span> </li> </ul><ul class="nav navbar-nav navbar-right hidden-xs"> <li> <p class="navbar-btn"> <a href="https://www.dwds.de/profile/login?c=d%2Fkorpora" class="btn btn-sm btn-default dwds-login-button" rel="nofollow"><span class="glyphicon glyphicon-log-in"></span> Anmelden</a> </p> </li> </ul> </div> </div> </nav><div class="visible-xs-block visible-sm-block sans"> <div style="color:#666; font-weight:normal; text-align:center; font-size:14px; margin-top:0; margin-bottom:10px; border-bottom:1px solid #e0e0e0" class="dwds-claim"> Digitales Wörterbuch der deutschen Sprache </div> </div> </header> <main> <div class="container-fluid" style="max-width:1400px"> <ol class="breadcrumb" itemscope itemtype="https://schema.org/BreadcrumbList"> <li itemprop="itemListElement" itemscope itemtype="https://schema.org/ListItem"> <a href="/" class="intern" itemprop="item"><span itemprop="name">Startseite</span></a> <meta itemprop="position" content="1" /> </li> <li itemprop="itemListElement" itemscope itemtype="https://schema.org/ListItem"> <a href="/d" class="intern" itemprop="item"><span itemprop="name">Dokumentation</span></a> <meta itemprop="position" content="2" /> </li> <li class="active" itemprop="itemListElement" itemscope itemtype="https://schema.org/ListItem"> <span itemprop="name">Korpora im DWDS</span> <meta itemprop="position" content="3" /> </li> </ol> <div class="row sans"> <div class="col-md-7"> <h1>Korpora im DWDS</h1> <h2>Einleitung</h2> <p> Gefördert von der Deutschen Forschungsgemeinschaft hat das Projekt DWDS von 2000 bis 2003 eine große Textbasis erstellt. Hierbei entstand das <i>DWDS-Kernkorpus</i>, das erste zeitlich und nach Textsorten ausgewogene Textkorpus der deutschen Sprache des 20. Jahrhunderts. Seitdem wurden eine Reihe weiterer Korpora in die DWDS-Abfrageplattform eingebunden. Alle Korpora enthalten Metadaten zu Textsorten, Autor, Titel, Verlag und Erscheinungsdatum. Die in ihnen enthaltenen Wörter sind lemmatisiert und mit Wortartinformationen versehen. Sie sind – soweit die Nutzungsvereinbarungen mit den Textgebern dies zulassen – mit der linguistischen Suchmaschine <a href="/d/korpussuche">DDC</a> über die DWDS-Webseite abfragbar. </p> <p> Für die Recherche im DWDS stehen über 72 Mrd. Tokens in historischen und gegenwartssprachlichen Textkorpora zur Verfügung. </p> <p class="label label-default">Hinweis</p> <p class="bg-info" style="padding:10px"> Ein <i>Token</i> bezeichnet ein Wort, ein Satzzeichen oder eine anderweitig zusammenhängende elementare Folge von Zeichen. </p> <p> Die Statistiken über alle DWDS-Korpora sind <a href="https://www.dwds.de/r/stat">auf einer gesonderten Seite</a> abfragbar. <a href="/d/korpora/neuigkeiten">Hier</a> finden Sie Neuigkeiten zu den Korpora im DWDS. </p> <p> Wir unterscheiden folgende Arten von Korpora: </p> <ul> <li> <b><a href="/d/k-meta">Metakorpora</a></b> &ndash; mehrere Korpora aggregiert zur einfachen Recherche, </li> <li> <b><a href="/d/k-referenz">Referenzkorpora</a></b> &ndash; zeitlich und hinsichtlich der Textsortenverteilung ausgewogene Korpora, </li> <li> <b><a href="/d/k-zeitung">Zeitungskorpora</a></b> &ndash; entweder retrodigitalisierte oder rein digital erstellte Texte großer Tages- und Wochenzeitungen, </li> <li> <b><a href="/d/k-web">Webkorpora</a></b> &ndash; gecrawlte Korpora aus internetbasierten Quellen, </li> <li> <b><a href="/d/k-spezial">Spezialkorpora</a></b> &ndash; für besondere Sprachbereiche zusammengestellte Korpora. </li> </ul> <h2 id="wb">Verweise vom DWDS-Wörterbuch in Korpora</h2> <p> In allen Artikeln des DWDS-Wörterbuchs finden Sie unter der Überschrift <strong>Belege in Korpora</strong> Verweise auf Korpuszitate in den Textsammlungen des DWDS. In den meisten Fällen werden damit Belege für das jeweilige Stichwort im Wörterbuch angezeigt. Bitte beachten Sie, dass die Annotation der DWDS-Korpora bzgl. Wortart, Eigennamenerkennung, Lemmatisierung etc. ein <strong>automatischer Prozess</strong> ist, bei dem es zu Ungenauigkeiten kommen kann. Die Suchmaschine, die die Korpuszitate aus den Sammlungen extrahiert, arbeitet <strong>rein schreibungsorientiert</strong> und nimmt <strong>keine Bedeutungszuordnung</strong> vor. </p> <ul> <li> Als Ergebnis der Korpussuche werden Belege für die im jeweiligen Wörterbuchartikel angegebenen Schreibungen ausgegeben. Für das Stichwort <i>Arzt</i> werden beispielsweise die Schreibungen <i>Arzt</i>, <i>Arztes</i>, <i>Ärzte</i>, <i>Ärzten</i> etc. angezeigt. </li> <li> Eine Unterscheidung zwischen den verschiedenen Bedeutungen eines Wortes findet in der Korpussuche nicht statt, z. B. zwischen <i>Bank</i> ‚Sitzgelegenheit‘ und <i>Bank</i> ‚Finanzhaus‘ oder dem Gemüse <i>Kohl</i> und dem Eigennamen <i>Kohl</i>. </li> <li> In seltenen Fällen können zwei ganz verschiedene Lemmata in ihren Flexionsparadigmen eine identische Schreibung aufweisen, beispielsweise <i>Wolle</i> als Nomen und <i>wolle</i> als Verbform. Bei den Verweisen auf die Korpora findet keine explizite Abfrage bzgl. der Wortart statt. Sie können innerhalb der Korpussuche <a href="/d/korpussuche#pos">entsprechende Filter</a> verwenden, um die Trefferlisten zu verfeinern. </li> <li> Historische Formen werden mittels eines maschinellen Verfahrens normalisiert, d. h. auf Rechtschreibung der Gegenwartssprache abgebildet. Damit werden Formen wie <i>Theyl</i>, <i>Thayl</i> oder <i>Theil</i> auf das heutige <i>Teil</i> abgebildet. Das Verfahren weist eine hohe Genauigkeitsrate von 99 % auf und findet in Projekten wie CLARIN-D oder Text+ breite Anwendung. In Ausnahmefällen kann es hier zu einer fehlerhaften Normalisierung oder Lemmatisierung kommen, wie es bei jedem automatisierten Verfahren der Fall ist. Diese können sich auch als Folgefehler eventueller OCR-Fehler, Transkriptionsfehler oder Konvertierungsfehler ergeben, die trotz größtmöglicher Sorgfalt bei der Korpuskuration in den Korpusquellen verblieben sind. </li> </ul> <h2 id="ocr">OCR-erfasste Texte</h2> <p> In einigen Korpora des DWDS finden sich Dokumente, die mithilfe von automatischer Texterkennung (OCR, <em>Optical Character Recognition</em>) erstellt wurden. Korpustreffer aus diesen Dokumenten werden in den Ergebnislisten mit dem Symbol <img src="https://www.dwds.de/dwds_static/images/letters/letter-ocr.svg" style="height:1.5rem" alt="Symbol OCR"/> markiert. Unter Umständen kann das OCR-Verfahren dazu führen, dass Zeichen, Wörter oder teils komplette Abschnitte nicht korrekt erfasst sind und daher falsche Ergebnisse bei Korpusrecherchen erbringen. In Korpora, wo OCR-erfasste Texte zusammen mit anderweitig erstellten Dokumenten zusammengefasst sind (z. B. im Metakorpus »<a href="/d/korpora/dtaxl">Historische Korpora</a>«), können Sie über die angebotene Schaltfläche <em>OCR-Texte nicht durchsuchen</em> entsprechend filtern. </p> <h2 id="lexdb">Lexikalische Datenbanken</h2> <p> Für einige Korpora bieten wir <a href="https://www.dwds.de/r/lexdb">lexikalische Datenbanken</a> mit Informationen zu Frequenzen und Lemmatisierungen an. Diese Datenbanken stehen auch als Download zur Verfügung. </p> <h2 id="diacollo">DiaCollo</h2> <p> Für viele Korpora bieten wir auch die Recherchemöglichkeit mit dem Tool <a href="https://clarin-d.de/de/kollokationsanalyse-in-diachroner-perspektive" target="_blank">DiaCollo</a> an, die entsprechenden Verweise darauf finden Sie in der <a href="https://www.dwds.de/r#corpusstat">Übersicht über die Korpora im DWDS</a>. </p> </div> <div class="col-md-4 col-md-offset-1 rightcol"> <p class="h3">Übersicht über die Korpora des DWDS</p> <ul> <li> <a href="/d/k-meta">Metakorpora</a> <ul> <li><a href="/d/korpora/dwdsxl">Gegenwartskorpora mit freiem Zugang</a></li> <li><a href="/d/korpora/dtaxl">Historische Korpora</a></li> <li><a href="/d/korpora/dta">Deutsches Textarchiv Kernkorpus + Erweiterungen</a></li> <li><a href="/d/korpora/dta+dwds">DTA-Gesamt+DWDS-Kernkorpus (1600–1999)</a></li> <li><a href="/d/korpora/zeitungenxl">DWDS-Zeitungskorpus (ab 1945)</a></li> <li><a href="/d/korpora/regional">ZDL-Regionalkorpus (ab 1993)</a></li> <li><a href="/d/korpora/webxl">WebXL</a></li> </ul> </li> <li> <a href="/d/k-referenz">Referenzkorpora</a> <ul> <li><a href="/d/korpora/kern">DWDS-Kernkorpus (1900–1999)</a></li> <li><a href="/d/korpora/kern21">DWDS-Kernkorpus 21 (2000–2010)</a></li> <li><a href="/d/korpora/dtak">DTA-Kernkorpus (1598–1913)</a></li> </ul> </li> <li> <a href="/d/k-zeitung">Zeitungskorpora</a> <ul> <li><a href="/d/korpora/bz_pp">Berliner Zeitung (1945–1993)</a></li> <li><a href="/d/korpora/bz">Berliner Zeitung (1994–2005)</a></li> <li><a href="/d/korpora/fas">Frankfurter Allgemeine Sonntagszeitung</a></li> <li><a href="/d/korpora/faz">Frankfurter Allgemeine Zeitung</a></li> <li><a href="/d/korpora/nd">Neues Deutschland (1946–1990)</a></li> <li><a href="/d/korpora/tsp">Der Tagesspiegel (ab 1996)</a></li> <li><a href="/d/korpora/zeit">Die ZEIT</a></li> </ul> </li> <li> <a href="/d/k-web">Webkorpora</a> <ul> <li><a href="/d/korpora/web">Webkorpus</a></li> <li><a href="/d/korpora/webmonitor">Webmonitor</a></li> <li><a href="/d/korpora/liechtenstein">Webseiten aus Liechtenstein</a></li> <li><a href="/d/korpora/ballsport">Ballsport</a></li> <li><a href="/d/korpora/jura">Jurakorpus</a></li> <li><a href="/d/korpora/medizin">Medizinkorpus</a></li> <li><a href="/d/korpora/corona">Corona-Korpus</a></li> <li><a href="/d/korpora/modeblogs">Mode- und Beauty-Blogs</a></li> <li><a href="/d/korpora/it_blogs">IT-Blogs</a></li> <li><a href="/d/korpora/blogs">Blogs</a></li> </ul> </li> <li> <a href="/d/k-spezial">Spezialkorpora</a> <ul> <li><a href="/d/korpora/dtae">DTA-Erweiterungen (1465–1969)</a></li> <li><a href="/d/korpora/adg">Archiv der Gegenwart (1931–2000)</a></li> <li><a href="/d/korpora/dingler">Polytechnisches Journal</a></li> <li><a href="/d/korpora/ibk_dchat">Dortmunder Chat-Korpus</a></li> <li><a href="/d/korpora/untertitel">Filmuntertitel</a></li> <li><a href="/d/korpora/spk">Gesprochene Sprache</a></li> <li><a href="/d/korpora/textberg">Text+Berg</a></li> <li><a href="/d/korpora/wende">Berliner Wendekorpus</a></li> <li><a href="/d/korpora/ddr">DDR</a></li> <li><a href="/d/korpora/politische_reden">Politische Reden (1982–2020)</a></li> <li><a href="/d/korpora/bundestag">Bundestagskorpus (1949–2017)</a></li> <li><a href="/d/korpora/soldatenbriefe">Soldatenbriefe (1745–1872)</a></li> <li><a href="/d/korpora/copadocs">Korpus Patiententexte (1834–1957)</a></li> <li><a href="/d/korpora/avh-bern">A. v. Humboldts Publizistik (dt., 1790–1859)</a></li> <li><a href="/d/korpora/bruedergemeine">Nachrichten aus der Brüdergemeine (1819–1894)</a></li> <li><a href="/d/korpora/pitaval">Der Neue Pitaval (1842–1890)</a></li> <li><a href="/d/korpora/jean_paul">Briefe von Jean Paul (1780–1825)</a></li> <li><a href="/d/korpora/dekude">Deutsche Kunst und Dekoration (1897–1932)</a></li> <li><a href="/d/korpora/nschatz_deu">Neuer Deutscher Novellenschatz (1884–1887)</a></li> <li><a href="/d/korpora/stimm-los">stimm-los – Wiedergefundene Perlen der Literatur</a></li> <li><a href="/d/korpora/wikibooks">Wikibooks-Korpus</a></li> <li><a href="/d/korpora/wikipedia">Wikipedia-Korpus</a></li> <li><a href="/d/korpora/wikivoyage">Wikivoyage-Korpus</a></li> <li><a href="/d/korpora/gesetze">Gesetze und Verordnungen (1897–2024)</a></li> <li><a href="/d/korpora/boersenblatt">Börsenblatt für den deutschen Buchhandel (1834–1945)</a></li> <li><a href="/d/korpora/samisdat">Politischer Samisdat der DDR (1969–1990)</a></li> </ul> </li> </ul> </div> </div> </div> <div id="to-top"><img src="https://www.dwds.de/dwds_static/images/up.svg" title="nach oben scrollen" data-toggle="tooltip" onclick="scrollToTop()"/> </div> </main><footer class="dwds-bottom dwds-bottom-box"> <div class="container"> <div class="row dwds-bottom-claim"> <div class="col-md-4 col-md-offset-2" style="margin-top:10px"> DWDS – Digitales Wörterbuch der deutschen Sprache </div> <div class="col-md-4 col-md-offset-1"> <a href="https://play.google.com/store/apps/details?id=org.kiwix.kiwixcustomdwds" target="_blank" style="margin-right:30px"> <img src="https://www.dwds.de/dwds_static/images/app/google-play-badge.png" alt="Logo Google Play Store" style="width:120px"/> </a> <a href="https://apps.apple.com/de/app/dwds/id6741328425" target="_blank"> <img src="https://www.dwds.de/dwds_static/images/app/apple-appstore-badge.svg" alt="Logo Apple App Store" style="width:110px"/> </a></div> </div> <div class="row"> <div class="col-md-12"> <div class="dwds-bottom-box"> <div class="dwds-bottom-flex"> <a href="/d/ueber-uns">Über uns</a> </div> <div class="dwds-bottom-flex"> <a href="/d">Dokumentation</a> </div> <div class="dwds-bottom-flex"> <a href="/d/datenschutz">Datenschutz</a> </div> <div class="dwds-bottom-flex"> <a href="/d/nutzungsbedingungen">Nutzungsbedingungen</a> </div> <div class="dwds-bottom-flex"> <a href="/d/zitieren">Zitieren des DWDS</a> </div> <div class="dwds-bottom-flex"> <a href="https://www.dwds.de/kontakt">Kontakt und Feedback</a> </div> <div class="dwds-bottom-flex"> <a href="/d/impressum">Impressum</a> </div> <div class="dwds-bottom-flex"> <a href="https://www.bbaw.de/" target="_blank"><img src="https://www.dwds.de/dwds_static/images/bbaw.svg" style="height:80px" height="80" width="180" alt="BBAW-Logo" loading="lazy" /></a> </div> </div> </div> </div> </div> </footer> <!-- Bootstrap slider, https://github.com/seiyria/bootstrap-slider --> <link href="https://www.dwds.de/dwds_static/bootstrap-slider/css/bootstrap-slider.min.css" rel="stylesheet"><!--[if lt IE 9]> <script src="https://www.dwds.de/dwds_static/js/html5shiv.min.js"></script> <script src="https://www.dwds.de/dwds_static/js/respond.min.js"></script> <![endif]--><link href="https://www.dwds.de/dwds_static/dwds.min.css?v=87" rel="stylesheet"> <script> base = '/' base_static = 'https://www.dwds.de/dwds_static/' q = "" is_lex = 0 is_user = 0 pos = '' dwds_host_staging = 'https://www.dwds.de/' dwds_host_dynamic = 'https://www.dwds.de/' dwds_host_api = 'https://www.dwds.de/' dwds_want_kiwix = 0</script> <script src="https://www.dwds.de/dwds_static/dwds.min.js?v=65"></script><script> new ClipboardJS('.ddc-copy-hit'); </script><!-- Matomo --> <script> var _paq = window._paq = window._paq || []; /* tracker methods like "setCustomDimension" should be called before "trackPageView" */ _paq.push(['trackPageView']); _paq.push(['enableLinkTracking']); (function() { var u="https://stats.dwds.de/"; _paq.push(['setTrackerUrl', u+'matomo.php']); _paq.push(['setSiteId', '1']); _paq.push(['enableLinkTracking']); _paq.push(['trackPageView']); _paq.push(['trackVisibleContentImpressions']); var d=document, g=d.createElement('script'), s=d.getElementsByTagName('script')[0]; g.async=true; g.src=u+'matomo.js'; s.parentNode.insertBefore(g,s); })(); </script> <noscript><p><img src="https://stats.dwds.de/matomo.php?idsite=1&amp;rec=1" style="border:0;" alt="" /></p></noscript> <!-- End Matomo Code --></body> </html>

Pages: 1 2 3 4 5 6 7 8 9 10