CINXE.COM
Verlaufskurven im DWDS | DWDS
<!DOCTYPE html> <html lang="de" itemscope itemtype="http://schema.org/WebPage"> <head> <meta charset="utf-8"> <meta name="tdm-reservation" content="1"> <meta name="tdm-policy" content="https://www.dwds.de/dwds_static/tdm-policy.json"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1"> <base href="/"> <title>Verlaufskurven im DWDS | DWDS</title> <!-- preloading CSS and fonts --> <link href="https://www.dwds.de/dwds_static/fonts/crimson-text-v8-latin-regular.woff2" as="font" rel="preload" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/fonts/source-sans-pro-v21-latin-ext_latin-italic.woff2" as="font" rel="preload" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/bootstrap-3.3.7-dist/fonts/glyphicons-halflings-regular.woff2" as="font" rel="preload" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/fonts.css" rel="preload" as="style" onload="this.rel='stylesheet'" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/fonts.css" rel="stylesheet preload" as="style" crossorigin="anonymous"> <!-- feeds --> <link rel="search" type="application/opensearchdescription+xml" title="DWDS Suche" href="/search.xml"> <link rel="alternate" type="application/atom+xml" title="DWDS: Artikel des Tages" href="/api/feed/adt"/> <link rel="alternate" type="application/atom+xml" title="DWDS: Neueste Artikel" href="/api/feed/latest"/> <!-- //feeds --> <meta property="og:description" content="DWDS – Digitales Wörterbuch der deutschen Sprache"/> <meta name="twitter:title" content="DWDS – Digitales Wörterbuch der deutschen Sprache"/> <meta itemprop="name" content="DWDS – Digitales Wörterbuch der deutschen Sprache"/><meta name="description" content="Verlaufskurven im DWDS"/> <meta property="og:title" content="Verlaufskurven im DWDS"/> <meta name="twitter:description" content="Verlaufskurven im DWDS"/><meta property="og:image" content="https://www.dwds.de/dwds_static/images/dwds-og.png"/><meta property="og:url" content="https://www.dwds.de/d/plot"/> <meta property="og:type" content="article"/> <meta property="og:locale" content="de"/> <meta property="og:site_name" content="DWDS"/> <meta name="twitter:card" content="summary_large_image"/><meta property="twitter:image:src" content="https://www.dwds.de/dwds_static/images/d-200.png"/><meta name="twitter:site" content="@dwds_de"/><meta property="image" content="https://www.dwds.de/dwds_static/images/dwds_601_141.png"/><meta itemprop="url" content="https://www.dwds.de/d/plot"/> <!-- favicon --> <link rel="apple-touch-icon" sizes="180x180" href="/apple-touch-icon.png?v=QEJw5qWp5M"> <link rel="icon" type="image/png" sizes="32x32" href="/favicon-32x32.png?v=QEJw5qWp5M"> <link rel="icon" type="image/png" sizes="16x16" href="/favicon-16x16.png?v=QEJw5qWp5M"> <link rel="manifest" href="/site.webmanifest?v=QEJw5qWp5M" crossorigin="use-credentials"> <link rel="mask-icon" href="/safari-pinned-tab.svg?v=QEJw5qWp5M" color="#125993"> <link rel="shortcut icon" href="/favicon.ico?v=QEJw5qWp5M"> <meta name="msapplication-TileColor" content="#125993"> <meta name="theme-color" content="#ffffff"> <!-- //favicon --> <!-- Bootstrap --> <link href="https://www.dwds.de/dwds_static/bootstrap-3.3.7-dist/css/bootstrap.min.css" rel="stylesheet"><script type="application/ld+json"> [ { "@context": "https://schema.org", "@type": "WebSite", "url": "/", "potentialAction": { "@type": "SearchAction", "target": "/?q={search_term_string}", "query-input": "required name=search_term_string" } }, { "@context": "https://schema.org", "@type": "Organization", "url": "/", "logo": "https://www.dwds.de/dwds_static/images/dwds_601_141.png", "sameAs" : [ "https://twitter.com/dwds_de" ], "contactPoint": { "@type": "ContactPoint", "telephone": "+4930203700", "email": "dwds@bbaw.de" } } ] </script> <script> MathJax = { tex: { inlineMath: [['$', '$']], macros: { "avg": ["\\operatorname\{avg\}"], "Corpus": ["\\operatorname\{Corpus\}"], "class": ["\\operatorname\{class\}"], "count": ["\\operatorname\{count\}"], "date": ["\\operatorname\{date\}"], "floor": ["\\operatorname\{floor\}"], "slice": ["\\operatorname\{slice\}"] } }, svg: { fontCache: 'global' } } </script> <script type="text/javascript" async="async" src="https://www.dwds.de/dwds_static/MathJax/es5/tex-chtml.js" id="MathJax-script"></script> </head> <body> <header><noscript> <div class="alert alert-danger sans" style="text-align:center;margin-bottom:5px" data-nosnippet> Um den vollen Funktionsumfang dieser Webseite nutzen zu können, muss JavaScript aktiviert sein.<br /> <a href="https://www.enable-javascript.com/de/" target="_blank">Hier finden Sie Hinweise, wie Sie JavaScript in Ihrem Browser aktivieren können.</a> </div> </noscript><div id="top"></div><!-- spinner --> <div id="spinner" style="display:none">Bitte warten Sie einen Moment …</div><nav class="navbar navbar-default navbar-static-top dwds-top"> <div class="container-fluid" style="padding-left:0"> <div class="navbar-header"> <a class="navbar-brand visible-xs-inline" href="/" style="margin:1px;padding:0 0 0 15px"><img src="https://www.dwds.de/dwds_static/images/dwds.svg" width="210" height="50" alt="DWDS-Logo" /></a> <a class="navbar-brand hidden-xs" href="/" style="margin:1px;padding:0"><img src="https://www.dwds.de/dwds_static/images/dwds.svg" width="210" height="50" data-toggle="tooltip" data-placement="right" title="Digitales Wörterbuch der deutschen Sprache" alt="DWDS-Logo" /></a> <div class="visible-xs-inline-block navbar-right-mobile"> <a href="https://www.dwds.de/profile/login?c=d%2Fplot" class="btn btn-sm btn-default" rel="nofollow"><span class="glyphicon glyphicon-log-in"></span> Login</a> </div> </div> <div id="navbar" class="navbar-collapse collapse"> <ul class="nav navbar-nav navbar-left"> <li class="hidden-xs hidden-sm sf dwds-header-link-li"> <span class="dwds-claim"> Der deutsche Wortschatz von 1600 bis heute. </span> </li> </ul><ul class="nav navbar-nav navbar-right hidden-xs"> <li> <p class="navbar-btn"> <a href="https://www.dwds.de/profile/login?c=d%2Fplot" class="btn btn-sm btn-default dwds-login-button" rel="nofollow"><span class="glyphicon glyphicon-log-in"></span> Anmelden</a> </p> </li> </ul> </div> </div> </nav><div class="visible-xs-block visible-sm-block sans"> <div style="color:#666; font-weight:normal; text-align:center; font-size:14px; margin-top:0; margin-bottom:10px; border-bottom:1px solid #e0e0e0" class="dwds-claim"> Digitales Wörterbuch der deutschen Sprache </div> </div> </header> <main> <div class="container-fluid" style="max-width:1400px"> <ol class="breadcrumb" itemscope itemtype="https://schema.org/BreadcrumbList"> <li itemprop="itemListElement" itemscope itemtype="https://schema.org/ListItem"> <a href="/" class="intern" itemprop="item"><span itemprop="name">Startseite</span></a> <meta itemprop="position" content="1" /> </li> <li itemprop="itemListElement" itemscope itemtype="https://schema.org/ListItem"> <a href="/d" class="intern" itemprop="item"><span itemprop="name">Dokumentation</span></a> <meta itemprop="position" content="2" /> </li> <li class="active" itemprop="itemListElement" itemscope itemtype="https://schema.org/ListItem"> <span itemprop="name">Verlaufskurven im DWDS</span> <meta itemprop="position" content="3" /> </li> </ol> <div class="row sans"> <div class="col-md-8"> <h1>Verlaufskurven im DWDS</h1> <h2>Inhalt dieses Dokuments</h2> <ul> <li><a href="https://www.dwds.de/d/plot#einleitung">Einleitung: Was Verlaufskurven aussagen und was nicht</a></li> <li><a href="https://www.dwds.de/d/plot#probleme">Welche Probleme kann es mit der Verlaufskurve geben?</a></li> <li><a href="https://www.dwds.de/d/plot#wb">Anzeige der Verlaufskurven im DWDS-Wörterbuch</a></li> <li><a href="https://www.dwds.de/d/plot#datengrundlage">Datengrundlage</a></li> <li><a href="https://www.dwds.de/d/plot#hinweise">Hinweise</a></li> <li><a href="https://www.dwds.de/d/plot#glaettung">Geglättete Ansicht</a></li> <li><a href="https://www.dwds.de/d/plot#erweitert">Erweiterte Ansicht</a></li> <li><a href="https://www.dwds.de/d/plot#rohdaten">Zugriff auf die Rohdaten</a></li> </ul> <h2 id="einleitung">Einleitung: Was Verlaufskurven aussagen und was nicht</h2> <p> Die Verlaufskurven zeigen die Auftretenshäufigkeit von Wörtern (genauer: Lemmata) in unseren Korpora über einen gewissen Zeitraum an. Dabei werden für jedes Zeitintervall (x-Achse; in der Regel ein Jahr oder eine Dekade) die relativen oder absoluten Gebrauchsfrequenzen (y-Achse) in einer Grafik dargestellt. </p> <p> Verlaufskurven bieten somit eine Möglichkeit zu ermitteln, wie sich der Gebrauch eines Wortes über die Zeit entwickelt: So lässt sich aus Verlaufskurven beispielsweise entnehmen, ob bzw. wann ein Wort in Gebrauch kam bzw. dessen Gebrauchshäufigkeit zunahm (Beispiel: <em><a href="https://www.dwds.de/r/plot/?q=Stress&corpus=dwdsxl">Stress</a></em>, <em><a href="https://www.dwds.de/r/plot/?q=Demografie&corpus=dwdsxl">Demografie</a></em>) oder wann es außer Gebrauch kam (Beispiele: <em><a href="https://www.dwds.de/r/plot/?q=Backfisch&corpus=dwdsxl">Backfisch</a></em>, <em><a href="https://www.dwds.de/r/plot/?q=baldigst&corpus=dwdsxl">baldigst</a></em>). </p> <p> Es ist außerdem möglich, die Frequenz eines Ausdrucks im Vergleich zu anderen zu ermitteln, beispielsweise von synonym verwendeten Ausdrücken wie <em><a href="https://www.dwds.de/r/plot/?view=1&corpus=zeitungenxl&q1=Handy&q2=Smartphone&q3=Mobiltelefon">Handy, Smartphone und Mobiltelefon</a></em>. </p> <p> Die Daten für die Verlaufskurven speisen sich aus mehreren, z. T. sehr großen Textsammlungen (Korpora): </p> <ul> <li>Das <a href="/d/korpora/zeitungenxl">DWDS-Zeitungskorpus</a> (ab 1946) (ca. 25 Milliarden Tokens, voreingestellte Ansicht im DWDS),</li> <li>das Metakorpus <a href="/d/korpora/dwdsxl">Gegenwartskorpora mit freiem Zugang</a> (ca. 3 Milliarden Tokens),</li> <li>DTA-Gesamt+DWDS-Kernkorpus (1600–1999, ca. 371 Millionen Tokens),</li> <li>sowie das <a href="/d/korpora/regional">ZDL-Regionalkorpus</a> (ab 1993, ca. 11 Milliarden Tokens).</li> </ul> <p class="label label-default">Hinweis</p> <p class="bg-info" style="padding:10px"> Ein <i>Token</i> bezeichnet ein Wort, ein Satzzeichen oder eine anderweitig zusammenhängende elementare Folge von Zeichen. </p> <p> Weitere Informationen zur Datengrundlage, zur Ansicht und Hinweise zum Umgang mit den Verlaufskurven finden Sie in den folgenden Abschnitten. </p> <h2 id="probleme">Welche Probleme kann es mit der Verlaufskurve geben?</h2> <p> <b>Mangelnde Ausgewogenheit der Korpora:</b> Die Korpusgrößen sind weder zeitlich noch über die Textsorten hinweg gleichverteilt. Das DWDS bemüht sich um urheberrechtliche Vereinbarungen, um eine größere Ausgewogenheit der Korpora zu erreichen. </p> <p> <b>Absolute Häufigkeiten:</b> Mit aggregierten Korpora lassen sich Verlaufskurven von hochfrequenten Wörtern einigermaßen verlässlich darstellen. Anders ist dies bei mittel- und niedrigfrequenten Wörtern. Hier können Ausreißer in Einzelwerken dazu führen, dass die Wortverläufe verzerrt dargestellt werden. Auch hier empfiehlt sich der Wechsel zur Ansicht „Rohfrequenzen“. </p> <p> Die <b>Annotation der DWDS-Korpora</b> bzgl. Wortart, Eigennamenerkennung, Lemmatisierung etc. ist ein automatischer Prozess. Dabei kann es zu Ungenauigkeiten kommen, die sich auch auf die Verlaufskurven auswirken können. </p> <p> Trotz größtmöglicher Sorgfalt bei der Korpuskuration können eventuell verbliebene <b>Fehler in den Korpusquellen</b> (<abbr title="bezüglich" data-toggle="tooltip">bzgl.</abbr> <abbr title="Optical Character Recognition (automatische Zeichenerkennung)" data-toggle="tooltip">OCR</abbr>, Transkription und Konvertierung) zu Folgefehlern bei der Lemmatisierung und damit zu falschen Frequenzangaben bei der automatischen Bestimmung der Verlaufskurven führen. </p> <h2 id="wb">Anzeige der Verlaufskurven im DWDS-Wörterbuch</h2> <p> In den meisten Artikeln des DWDS-Wörterbuchs finden Sie unter der Überschrift <strong>Verlaufskurve</strong> eine Grafik zur Häufigkeit eines Stichworts im zeitlichen Verlauf. Bitte beachten Sie dabei, dass die Suchmaschine, die die Frequenzen aus unseren Textsammlungen extrahiert, rein schreibungsorientiert arbeitet: </p> <ul> <li> Eine Unterscheidung zwischen den verschiedenen Bedeutungen eines Wortes findet in der Verlaufskurve nicht statt, z. B. zwischen <em>Bank</em> ‚Sitzgelegenheit‘ und <em>Bank</em> ‚Finanzhaus‘ oder der Gemüsebezeichnung <em>Kohl</em> und dem Eigennamen <em>Kohl</em>. </li> <li> In seltenen Fällen können zwei ganz verschiedene Lemmata in ihren Flexionsparadigmen eine identische Schreibung aufweisen, beispielsweise <em>Wolle</em> als Nomen und <em>wolle</em> als Verbform. Bei der Zählung der Häufigkeiten findet keine explizite Abfrage bzgl. der Wortart statt. Sie können aber <a href="/d/korpussuche#pos">weitere Suchfilter</a> verwenden, um die Ergebnisse zu verfeinern. </li> <li> Für die Verlaufskurve werden alle Varianten einer Wortform gezählt. Für das Stichwort <em>Arzt</em> werden beispielsweise die Schreibungen <em>Arzt</em>, <em>Arztes</em>, <em>Ärzte</em>, <em>Ärzten</em> etc. gezählt. </li> </ul> <h2 id="datengrundlage">Datengrundlage</h2> <p> Das DWDS bietet Zugriff auf moderne und historische Textkorpora, mit denen Wortverläufe für einen Zeitraum von über 400 Jahren recherchiert werden können. </p> <ol> <li> <b><a href="/d/korpora/dwdsxl">Gegenwartskorpora mit freiem Zugang</a></b> (voreingestellte Ansicht im DWDS): Dieses Korpus umfasst alle ohne Login zugänglichen Korpora im DWDS aus dem Feld der Gegenwartssprache: <ul> <li><a href="/d/korpora/kern">DWDS-Kernkorpus (1900–1999)</a></li> <li><a href="/d/korpora/kern21">DWDS-Kernkorpus 21 (2000–2010)</a></li> <li><a href="/d/korpora/bz">Berliner Zeitung (1994–2005)</a></li> <li><a href="/d/korpora/tsp">Der Tagesspiegel (ab 1996)</a></li> <li><a href="/d/korpora/blogs">Blogs</a></li> <li><a href="/d/korpora/adg">Archiv der Gegenwart (1931–2000)</a></li> <li><a href="/d/korpora/untertitel">Filmuntertitel</a></li> <li><a href="/d/korpora/spk">Gesprochene Sprache</a></li> <li><a href="/d/korpora/ddr">DDR</a></li> <li><a href="/d/korpora/politische_reden">Politische Reden (1982–2020)</a></li> <li><a href="/d/korpora/bundestag">Bundestagskorpus (1949–2017)</a></li> <li><a href="/d/korpora/wikibooks">Wikibooks-Korpus</a></li> <li><a href="/d/korpora/wikipedia">Wikipedia-Korpus</a></li> <li><a href="/d/korpora/wikivoyage">Wikivoyage-Korpus</a></li> <li><a href="/d/korpora/gesetze">Gesetze und Verordnungen (1897–2024)</a></li> </ul> </li> <li> <b><a href="/d/k-referenz">DTA-Gesamt+DWDS-Kernkorpus (1600–1999)</a></b>: Für den Zeitraum des 17. bis 20. Jahrhunderts liegen mengenmäßig kleinere Textkorpora vor (insgesamt ca. 370 Millionen Tokens). Dies sind das <a href="/d/korpora/dtak">Deutsche Textarchiv</a> mit seinen <a href="/d/korpora/dtae">Erweiterungen</a> sowie das <a href="/d/korpora/kern">DWDS-Kernkorpus</a>. Bei diesen Korpora handelt es sich vornehmlich um sogenannte Referenzkorpora, also Textsammlungen, die gegenüber dem Zeitungskorpus den Vorteil besitzen, dass sie mehrere Textsorten (Wissenschaft, Belletristik, journalistische Prosa und Gebrauchsliteratur) in ausgewogenen Anteilen umfassen. </li> <li> <b><a href="/d/korpora/zeitungenxl">DWDS-Zeitungskorpus</a></b>: Für die Zeit ab 1946 liegen sehr große und bereits digitalisierte Volltextsammlungen vor. Das DWDS greift hier auf ein ca. 25 Milliarden Tokens (ca. 20 Milliarden Textwörter) umfassendes Zeitungskorpus zurück, welches eine Vielzahl wichtiger überregionaler Tages- und Wochenzeitungen umfasst. Aufgrund lizenzrechtlicher Beschränkungen ist hier der Zugriff auf Belegstellen nicht möglich. Die in der Verlaufskurve angezeigten Daten werden regelmäßig aktualisiert. (Hinweis: Mit Update vom 19.11.2021 wurde die Datengrundlage des DWDS-Zeitungskorpus um alle Mantel- und Regionalteile der Zeitungen des <a href="/d/korpora/regional">ZDL-Regionalkorpus</a> erweitert.) </li> <li> <b><a href="/d/korpora/regional">ZDL-Regionalkorpus (ab 1993)</a></b>: Dieses Korpus setzt sich aus Lokal- und Regionalteilen deutscher Zeitungen zusammen, die jeweils bestimmten Arealen zugeordnet sind: D-Nordwest, D-Nordost, D-Mittelwest, D-Mittelost, D-Südwest, D-Südwest, A und CH. In der Visualisierung wird neben dem Gesamtverlauf der Verlauf pro Areal angezeigt. Der Default-Zeitraum in der Visualisierung ist der größte Zeitraum, in dem es Zeitungsdaten aus allen Arealen gibt (gegenwärtig ab 2005). </li> </ol> <h2 id="hinweise">Hinweise</h2> <p> Sie können beliebige DDC-Anfragen an das Verlaufskurven-Tool stellen. Bitte beachten Sie die <a href="/d/korpussuche">Dokumentation zur Korpussuche</a>. </p> <h2 id="glaettung">Geglättete Ansicht</h2> <p> Zur leichteren Interpretierbarkeit der Verlaufskurven wird ein Glättungsverfahren eingesetzt, einzelne Ausreißer werden abgeschnitten. Gerade bei mittel- und niedrigfrequenten Wörtern (d. h. unterhalb einer Schwelle von 1 pro Million Tokens) kann es aber passieren, dass die geglätteten Kurven die tatsächlichen Frequenzanstiege und -abfälle nicht adäquat darstellen. In diesem Fall besteht die Möglichkeit, auf die Ansicht „Rohfrequenzen“ umzustellen. </p> <h2 id="erweitert">Erweiterte Ansicht</h2> <style> .param-table { margin-bottom:10px; margin-top:20px } .param-table th { border-bottom:none !important; font-weight:normal } .param-table td { font-weight:bold } .param-table td:nth-child(2) { width:40% } .param-table td:nth-child(2) { width:30%; font-family:monospace } .param-table td:nth-child(3) { width:30%; font-family:monospace } .param-desc { margin-left:20px; margin-bottom:20px } code { color:#333;border:1px solid #eee; border-radius:0; padding:4px } </style> <table class="table table-condensed param-table" id="norm"> <thead> <tr> <th></th> <th>Parameter</th> <th>Default</th> </tr> </thead> <tbody> <tr> <td>Normalisierung</td> <td>norm</td> <td>Datum+Textklasse</td> </tr> </tbody> </table> <div class="param-desc"> <p> Kategorisierungsfunktion zur Berechnung des Nenners für die Ergebnis-Skalierung pro Million Tokens (Workaround für nicht-balancierte Korpora). </p> <p> <code>Datum+Textklasse</code> heisst: Wenn $n$ Treffer von insgesamt $m$ Tokens in der Schnittmenge von Zeitabschnitt $x$ und Textklasse $z$ liegen, dann ist der normalisierte (und anzuzeigende) Wert $y_{x,z} = f \times (x,z) = \frac{n}{m} \times 1000000$ Treffer pro Million Tokens. </p> </div> <table class="table table-condensed param-table" id="smooth"> <thead> <tr> <th></th> <th>Parameter</th> <th>Default</th> </tr> </thead> <tbody> <tr> <td>Glättung</td> <td>smooth</td> <td>Kurve</td> </tr> </tbody> </table> <div class="param-desc"> <p> Methode zur graphischen Glättung der Kurven (Interpolierung). </p> </div> <table class="table table-condensed param-table" id="grand"> <thead> <tr> <th></th> <th>Parameter</th> <th>Default</th> </tr> </thead> <tbody> <tr> <td>Gesamtwerte anzeigen</td> <td>grand</td> <td>1</td> </tr> </tbody> </table> <div class="param-desc"> <p> Wenn gesetzt, wird zusätzlich zu den Textklassen-spezifischen Kurven eine „Gesamt“-Kurve angezeigt. </p> </div> <table class="table table-condensed param-table" id="slice"> <thead> <tr> <th></th> <th>Parameter</th> <th>Default</th> </tr> </thead> <tbody> <tr> <td>Zeitintervall</td> <td>slice</td> <td>1 für DWDS-Zeitungskorpus, 10 sonst</td> </tr> </tbody> </table> <div class="param-desc"> <p> Zeitscheiben-Breite (natürliche Zahl $S$) mit optionalem Offset $O$, notiert $S+O$ oder $S-O$. </p> <p> Ein Datenpunkt $y$ wird berechnet für jedes Paar aus Zeitscheibe $x$ und Textsorte $z$, wobei der Index jeder Zeitscheibe modulo $slice$ immer gleich $O$ ist; d. h. für $slice = 10+0$ wären $S=10$ und $O=0$ und es gäbe Zeitscheiben <code>1900, 1910, 1920, …</code> </p> <p> Für $slice = 5 + 0$ mit $S = 5$ und $O = 0$ gäbe es <code>1900, 1905, 1910, …</code> </p> <p> Jeder Treffer wird genau einer Zeitscheibe zugeordnet, in dem das Offset vom Ursprungsjahr des Treffers abgezogen wird, das Ergebnis modulo $S$ berechnet, anschließend mit $S$ multipliziert und mit $O$ addiert wird: </p> $$\slice(hit) = O + S \times \floor \left(\frac{\date(hit) - O}{S}\right)$$ </div> <table class="table table-condensed param-table" id="window"> <thead> <tr> <th></th> <th>Parameter</th> <th>Default</th> </tr> </thead> <tbody> <tr> <td>Fenster</td> <td>window</td> <td>3</td> </tr> </tbody> </table> <div class="param-desc"> <p> Fensterbreite für <a href="https://de.wikipedia.org/wiki/Gleitender_Mittelwert" target="_blank">gleitenden Mittelwert</a> (Glättung), als natürliche Zahl $w$ (Anzahl Zeitscheiben). Bei $window = w = 0$ wird ein „reines“ Histogramm berechnet, d. h.: </p> $$ \begin{align} y_{x,z} = y_{x,z}^0 &= \count(x,z) \\ &= \left| \slice^{-1}(x) \cap \class^{-1}(z) \right|\\ &= \left| \left\{ hit \in \Corpus : \slice(hit) = x\; \& \class(hit) = z \right\} \right| \end{align} $$ <p> Bei $window = w = 1$ werden die unmittelbar benachbarten Zeitabschnitte zur Hilfe gezogen: </p> $$ \begin{align} y_{x,z} = y^1_{x,z} &= \avg(y_{x-S,z}^0, y_{x,z}^0,y_{x+S,z}^0)\\ &= \frac{\count(x-S,z)+\count(x,z)+\count(x+S,z)}{3} \end{align} $$ <p> Allgemein für $window = w$ und $slice = S$ mit $wbase = b \in \set{0,1}$: </p> $$ \begin{align} y_{x,z} = y_{x,z}^w &= \avg_{i=-w}^w\left(y_{x+iS,z}^0\right) \\ &= \frac{1}{1+2w} \sum_{i=-w}^w \count(x+iS,z) \end{align} $$ </div> <table class="table table-condensed param-table" id="wbase"> <thead> <tr> <th></th> <th>Parameter</th> <th>Default</th> </tr> </thead> <tbody> <tr> <td>Glättungskoeffizient</td> <td>wbase</td> <td>0</td> </tr> </tbody> </table> <div class="param-desc"> <p> Invers-Distanz Glättungsbasis (reelle Zahl <var>b</var>); wobei $b=0$ (Default) intern auf $b=1$ abgebildet wird (Gleichgewichtung aller zu $y_{x,z}$ beitragenden Zeitscheiben). Kann benutzt werden, um den Beitrag von benachbarten Zeitscheiben entsprechend ihrem $x$-Abstand zur Zielzeitscheibe zu gewichten („fernerliegende“ Nachbarscheiben tragen weniger bei). Berechnet $y_{x,z}$ als: </p> $$ \begin{align} y_{x,z} = y_{x,z}^{w,b} &= E_{i=-w}^{w}\left[b^{-i}\right]y_{x+iS,z}^0 \\ &= \frac{1}{1+2\sum_{i=1}^{w}b^{-i}}\sum_{i=-w}^{w}b^{-i}y_{x+iS,z}^0 \end{align} $$ <p> Akzeptiert auch den Wert „<var>e</var>“: $e = \exp(1) \approx 2.71828\dots$ </p> </div> <table class="table table-condensed param-table" id="xrange"> <thead> <tr> <th></th> <th>Parameter</th> <th>Default</th> </tr> </thead> <tbody> <tr> <td>Zeitbereich</td> <td>xrange</td> <td></td> </tr> </tbody> </table> <div class="param-desc"> <p>Anzuzeigendes Datenintervall für die x-Achse (Datum).</p> </div> <a name="konfidenz"></a> <table class="table table-condensed param-table" id="prune"> <thead> <tr> <th></th> <th>Parameter</th> <th>Default</th> </tr> </thead> <tbody> <tr> <td>Konfidenz</td> <td>prune</td> <td>0 (0.05 bei DTA-Gesamt+DWDS-Kernkorpus)</td> </tr> </tbody> </table> <div class="param-desc"> <p> Inverses Konfidenzintervall für Ausreißererkennung (0: kein Pruning, .05 ~ 95% Konfidenzintervall). Berechnet zunächst eine Fehlerverteilung für die normalisierten Datenpunkte (nach Normalisierung aber vor Glättung) gegenüber einer doppelt-<a href="https://de.wikipedia.org/wiki/Exponentielle_Gl%C3%A4ttung" target="_blank">exponentialgefilterten</a> „Erwartungsfunktion“ (berechnet mit <a href="http://pdl-stats.sourceforge.net/TS.htm#filter_exp" target="_blank"><code>PDL::Stats::TS::filter_exp()</code></a>, vorwärts+rückwärts gemittelt). Die beobachteten „Fehler“ werden unter Annahme einer Normalverteilung in <var>p</var>-Werte überführt, und alle Datenpunkte mit <var>p</var>-Werten außerhalb des angegebenen Konfidenzbereichs werden als Ausreißer behandelt. Ausreißer-Rohwerte werden ersetzt durch eine lineare Interpolierung der nächstliegenden nicht-Ausreißer-Datenpunkte. Vgl. <a href="https://kaskade.dwds.de/~jurish/pubs/jurish-verlaufskurven-2016-05-31.pdf" target="_blank">https://kaskade.dwds.de/~jurish/pubs/jurish-verlaufskurven-2016-05-31.pdf</a>. </p> </div> <table class="table table-condensed param-table" id="logavg"> <thead> <tr> <th></th> <th>Parameter</th> <th>Default</th> </tr> </thead> <tbody> <tr> <td>Logarithmische Glättung</td> <td>logavg</td> <td>0</td> </tr> </tbody> </table> <div class="param-desc"> <p> Wenn gesetzt, werden die gleitenden Mittelwerte $y_{x,z}$ bzgl. der entsprechenden Logarithmen berechnet und anschließend auf absolute Werte zurückprojiziert (für eine Glättungskonstante $\epsilon$, Default $\epsilon = \frac{1}{2}$): </p> $$ y = \exp\left(\dots\: \log(y_{x+iS,z}^0+\epsilon) \dots\right)-\epsilon $$ </div> <table class="table table-condensed param-table" id="logscale"> <thead> <tr> <th></th> <th>Parameter</th> <th>Default</th> </tr> </thead> <tbody> <tr> <td>Logarithmische Skalierung</td> <td>logscale</td> <td>0</td> </tr> </tbody> </table> <div class="param-desc"> <p> Wenn gesetzt, werden die angezeigten Achsen logarithmisch skaliert. </p> </div> <h2 id="rohdaten">Zugriff auf die Rohdaten</h2> <p> Über die dstar-Umgebung können Sie Zugriff auf die Rohdaten in verschiedenen Formaten erhalten. Momentan ist das für folgende Korpora möglich: </p> <ul> <li><a href="https://www.dwds.de/dstar/adg_www/hist.perl" target="_blank">Archiv der Gegenwart (1931–2000)</a></li> <li><a href="https://www.dwds.de/dstar/avh-bern_www/hist.perl" target="_blank">A. v. Humboldts Publizistik (dt., 1790–1859)</a></li> <li><a href="https://www.dwds.de/dstar/blogs_www/hist.perl" target="_blank">Blogs</a></li> <li><a href="https://www.dwds.de/dstar/bz_www/hist.perl" target="_blank">Berliner Zeitung (1994–2005)</a></li> <li><a href="https://www.dwds.de/dstar/copadocs_www/hist.perl" target="_blank">Korpus Patiententexte (1834–1957)</a></li> <li><a href="https://www.dwds.de/dstar/ddr_www/hist.perl" target="_blank">DDR</a></li> <li><a href="https://www.dwds.de/dstar/dingler_www/hist.perl" target="_blank">Polytechnisches Journal</a></li> <li><a href="https://www.dwds.de/dstar/dta_www/hist.perl" target="_blank">DTA-Kern+Erweiterungen</a></li> <li><a href="https://www.dwds.de/dstar/dtae_www/hist.perl" target="_blank">DTA-Erweiterungen (1465–1969)</a></li> <li><a href="https://www.dwds.de/dstar/dtak_www/hist.perl" target="_blank">DTA-Kernkorpus (1598–1913)</a></li> <li><a href="https://www.dwds.de/dstar/dwdsxl_www/hist.perl" target="_blank">Gegenwartskorpora mit freiem Zugang</a></li> <li><a href="https://www.dwds.de/dstar/gesetze_www/hist.perl" target="_blank">Gesetze und Verordnungen (1897–2024)</a></li> <li><a href="https://www.dwds.de/dstar/kern_www/hist.perl" target="_blank">DWDS-Kernkorpus (1900–1999)</a></li> <li><a href="https://www.dwds.de/dstar/kern21_www/hist.perl" target="_blank">DWDS-Kernkorpus 21 (2000–2010)</a></li> <li><a href="https://www.dwds.de/dstar/nschatz_deu_www/hist.perl" target="_blank">Neuer Deutscher Novellenschatz (1884–1887)</a></li> <li><a href="https://www.dwds.de/dstar/politische_reden_www/hist.perl" target="_blank">Politische Reden (1982–2020)</a></li> <li><a href="https://www.dwds.de/dstar/soldatenbriefe_www/hist.perl" target="_blank">Soldatenbriefe (1745–1872)</a></li> <li><a href="https://www.dwds.de/dstar/spk_www/hist.perl" target="_blank">Gesprochene Sprache</a></li> <li><a href="https://www.dwds.de/dstar/stimm-los_www/hist.perl" target="_blank">stimm-los – Wiedergefundene Perlen der Literatur</a></li> <li><a href="https://www.dwds.de/dstar/untertitel_www/hist.perl" target="_blank">Filmuntertitel</a></li> <li><a href="https://www.dwds.de/dstar/wikibooks_www/hist.perl" target="_blank">Wikibooks-Korpus</a></li> <li><a href="https://www.dwds.de/dstar/wikipedia_www/hist.perl" target="_blank">Wikipedia-Korpus</a></li> <li><a href="https://www.dwds.de/dstar/wikivoyage_www/hist.perl" target="_blank">Wikivoyage-Korpus</a></li> </ul> </div> </div> </div> <div id="to-top"><img src="https://www.dwds.de/dwds_static/images/up.svg" title="nach oben scrollen" data-toggle="tooltip" onclick="scrollToTop()"/> </div> </main><footer class="dwds-bottom dwds-bottom-box"> <div class="container"> <div class="row dwds-bottom-claim"> <div class="col-md-5 col-md-offset-2" style="margin-top:10px"> DWDS – Digitales Wörterbuch der deutschen Sprache </div> <div class="col-md-2 col-md-offset-1"> <a href="https://play.google.com/store/apps/details?id=org.kiwix.kiwixcustomdwds" target="_blank"> <img src="https://www.dwds.de/dwds_static/images/app/google-play-badge.png" alt="Logo Google Play Store" style="width:120px"/> </a></div> </div> <div class="row"> <div class="col-md-12"> <div class="dwds-bottom-box"> <div class="dwds-bottom-flex"> <a href="/d/ueber-uns">Über uns</a> </div> <div class="dwds-bottom-flex"> <a href="/d">Dokumentation</a> </div> <div class="dwds-bottom-flex"> <a href="/d/datenschutz">Datenschutz</a> </div> <div class="dwds-bottom-flex"> <a href="/d/nutzungsbedingungen">Nutzungsbedingungen</a> </div> <div class="dwds-bottom-flex"> <a href="/d/zitieren">Zitieren des DWDS</a> </div> <div class="dwds-bottom-flex"> <a href="https://www.dwds.de/kontakt">Kontakt und Feedback</a> </div> <div class="dwds-bottom-flex"> <a href="/d/impressum">Impressum</a> </div> <div class="dwds-bottom-flex"> <a href="https://www.bbaw.de/" target="_blank"><img src="https://www.dwds.de/dwds_static/images/bbaw.svg" style="height:80px" height="80" width="180" alt="BBAW-Logo" loading="lazy" /></a> </div> </div> </div> </div> </div> </footer> <!-- Bootstrap slider, https://github.com/seiyria/bootstrap-slider --> <link href="https://www.dwds.de/dwds_static/bootstrap-slider/css/bootstrap-slider.min.css" rel="stylesheet"><!--[if lt IE 9]> <script src="https://www.dwds.de/dwds_static/js/html5shiv.min.js"></script> <script src="https://www.dwds.de/dwds_static/js/respond.min.js"></script> <![endif]--><link href="https://www.dwds.de/dwds_static/dwds.min.css?v=83" rel="stylesheet"> <script> base = '/' base_static = 'https://www.dwds.de/dwds_static/' q = "" is_lex = 0 is_user = 0 pos = '' dwds_host_staging = 'https://www.dwds.de/' dwds_host_dynamic = 'https://www.dwds.de/' dwds_host_api = 'https://www.dwds.de/' dwds_want_kiwix = 0</script> <script src="https://www.dwds.de/dwds_static/dwds.min.js?v=63"></script><script> new ClipboardJS('.ddc-copy-hit'); </script> <style> .param-desc img { margin:10px } </style> <!-- Matomo --> <script> var _paq = window._paq = window._paq || []; /* tracker methods like "setCustomDimension" should be called before "trackPageView" */ _paq.push(['trackPageView']); _paq.push(['enableLinkTracking']); (function() { var u="https://stats.dwds.de/"; _paq.push(['setTrackerUrl', u+'matomo.php']); _paq.push(['setSiteId', '1']); _paq.push(['enableLinkTracking']); _paq.push(['trackPageView']); _paq.push(['trackVisibleContentImpressions']); var d=document, g=d.createElement('script'), s=d.getElementsByTagName('script')[0]; g.async=true; g.src=u+'matomo.js'; s.parentNode.insertBefore(g,s); })(); </script> <noscript><p><img src="https://stats.dwds.de/matomo.php?idsite=1&rec=1" style="border:0;" alt="" /></p></noscript> <!-- End Matomo Code --></body> </html>