CINXE.COM
Erschließung: DWDS-Beispielextraktor | DWDS
<!DOCTYPE html> <html lang="de" itemscope itemtype="http://schema.org/WebPage"> <head> <meta charset="utf-8"> <meta name="tdm-reservation" content="1"> <meta name="tdm-policy" content="https://www.dwds.de/dwds_static/tdm-policy.json"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1"> <base href="/"> <title>Erschließung: DWDS-Beispielextraktor | DWDS</title> <!-- preloading CSS and fonts --> <link href="https://www.dwds.de/dwds_static/fonts/crimson-text-v8-latin-regular.woff2" as="font" rel="preload" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/fonts/source-sans-pro-v21-latin-ext_latin-italic.woff2" as="font" rel="preload" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/bootstrap-3.3.7-dist/fonts/glyphicons-halflings-regular.woff2" as="font" rel="preload" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/fonts.css" rel="preload" as="style" onload="this.rel='stylesheet'" crossorigin="anonymous"> <link href="https://www.dwds.de/dwds_static/fonts.css" rel="stylesheet preload" as="style" crossorigin="anonymous"> <!-- feeds --> <link rel="search" type="application/opensearchdescription+xml" title="DWDS Suche" href="/search.xml"> <link rel="alternate" type="application/atom+xml" title="DWDS: Artikel des Tages" href="/api/feed/adt"/> <link rel="alternate" type="application/atom+xml" title="DWDS: Neueste Artikel" href="/api/feed/latest"/> <!-- //feeds --> <meta property="og:description" content="DWDS – Digitales Wörterbuch der deutschen Sprache"/> <meta name="twitter:title" content="DWDS – Digitales Wörterbuch der deutschen Sprache"/> <meta itemprop="name" content="DWDS – Digitales Wörterbuch der deutschen Sprache"/><meta name="description" content="Erschließung: DWDS-Beispielextraktor"/> <meta property="og:title" content="Erschließung: DWDS-Beispielextraktor"/> <meta name="twitter:description" content="Erschließung: DWDS-Beispielextraktor"/><meta property="og:image" content="https://www.dwds.de/dwds_static/images/dwds-og.png"/><meta property="og:url" content="https://www.dwds.de/d/beispielextraktor"/> <meta property="og:type" content="article"/> <meta property="og:locale" content="de"/> <meta property="og:site_name" content="DWDS"/> <meta name="twitter:card" content="summary_large_image"/><meta property="twitter:image:src" content="https://www.dwds.de/dwds_static/images/d-200.png"/><meta name="twitter:site" content="@dwds_de"/><meta property="image" content="https://www.dwds.de/dwds_static/images/dwds_601_141.png"/><meta itemprop="url" content="https://www.dwds.de/d/beispielextraktor"/> <!-- favicon --> <link rel="apple-touch-icon" sizes="180x180" href="/apple-touch-icon.png?v=QEJw5qWp5M"> <link rel="icon" type="image/png" sizes="32x32" href="/favicon-32x32.png?v=QEJw5qWp5M"> <link rel="icon" type="image/png" sizes="16x16" href="/favicon-16x16.png?v=QEJw5qWp5M"> <link rel="manifest" href="/site.webmanifest?v=QEJw5qWp5M" crossorigin="use-credentials"> <link rel="mask-icon" href="/safari-pinned-tab.svg?v=QEJw5qWp5M" color="#125993"> <link rel="shortcut icon" href="/favicon.ico?v=QEJw5qWp5M"> <meta name="msapplication-TileColor" content="#125993"> <meta name="theme-color" content="#ffffff"> <!-- //favicon --> <!-- Bootstrap --> <link href="https://www.dwds.de/dwds_static/bootstrap-3.3.7-dist/css/bootstrap.min.css" rel="stylesheet"><script type="application/ld+json"> [ { "@context": "https://schema.org", "@type": "WebSite", "url": "/", "potentialAction": { "@type": "SearchAction", "target": "/?q={search_term_string}", "query-input": "required name=search_term_string" } }, { "@context": "https://schema.org", "@type": "Organization", "url": "/", "logo": "https://www.dwds.de/dwds_static/images/dwds_601_141.png", "sameAs" : [ "https://twitter.com/dwds_de" ], "contactPoint": { "@type": "ContactPoint", "telephone": "+4930203700", "email": "dwds@bbaw.de" } } ] </script> </head> <body> <header><noscript> <div class="alert alert-danger sans" style="text-align:center;margin-bottom:5px" data-nosnippet> Um den vollen Funktionsumfang dieser Webseite nutzen zu können, muss JavaScript aktiviert sein.<br /> <a href="https://www.enable-javascript.com/de/" target="_blank">Hier finden Sie Hinweise, wie Sie JavaScript in Ihrem Browser aktivieren können.</a> </div> </noscript><div id="top"></div><!-- spinner --> <div id="spinner" style="display:none">Bitte warten Sie einen Moment …</div><nav class="navbar navbar-default navbar-static-top dwds-top"> <div class="container-fluid" style="padding-left:0"> <div class="navbar-header"> <a class="navbar-brand visible-xs-inline" href="/" style="margin:1px;padding:0 0 0 15px"><img src="https://www.dwds.de/dwds_static/images/dwds.svg" width="210" height="50" alt="DWDS-Logo" /></a> <a class="navbar-brand hidden-xs" href="/" style="margin:1px;padding:0"><img src="https://www.dwds.de/dwds_static/images/dwds.svg" width="210" height="50" data-toggle="tooltip" data-placement="right" title="Digitales Wörterbuch der deutschen Sprache" alt="DWDS-Logo" /></a> <div class="visible-xs-inline-block navbar-right-mobile"> <a href="https://www.dwds.de/profile/login?c=d%2Fbeispielextraktor" class="btn btn-sm btn-default" rel="nofollow"><span class="glyphicon glyphicon-log-in"></span> Login</a> </div> </div> <div id="navbar" class="navbar-collapse collapse"> <ul class="nav navbar-nav navbar-left"> <li class="hidden-xs hidden-sm sf dwds-header-link-li"> <span class="dwds-claim"> Der deutsche Wortschatz von 1600 bis heute. </span> </li> </ul><ul class="nav navbar-nav navbar-right hidden-xs"> <li> <p class="navbar-btn"> <a href="https://www.dwds.de/profile/login?c=d%2Fbeispielextraktor" class="btn btn-sm btn-default dwds-login-button" rel="nofollow"><span class="glyphicon glyphicon-log-in"></span> Anmelden</a> </p> </li> </ul> </div> </div> </nav><div class="visible-xs-block visible-sm-block sans"> <div style="color:#666; font-weight:normal; text-align:center; font-size:14px; margin-top:0; margin-bottom:10px; border-bottom:1px solid #e0e0e0" class="dwds-claim"> Digitales Wörterbuch der deutschen Sprache </div> </div> </header> <main> <div class="container-fluid" style="max-width:1400px"> <ol class="breadcrumb" itemscope itemtype="https://schema.org/BreadcrumbList"> <li itemprop="itemListElement" itemscope itemtype="https://schema.org/ListItem"> <a href="/" class="intern" itemprop="item"><span itemprop="name">Startseite</span></a> <meta itemprop="position" content="1" /> </li> <li itemprop="itemListElement" itemscope itemtype="https://schema.org/ListItem"> <a href="/d" class="intern" itemprop="item"><span itemprop="name">Dokumentation</span></a> <meta itemprop="position" content="2" /> </li> <li class="active" itemprop="itemListElement" itemscope itemtype="https://schema.org/ListItem"> <span itemprop="name">Erschließung: DWDS-Beispielextraktor</span> <meta itemprop="position" content="3" /> </li> </ol> <div class="row sans"> <div class="col-md-8 col-md-offset-2"> <h1>Erschließung: DWDS-Beispielextraktor</h1> <h2>Motivation</h2> <p> Es ist für Nutzer einsprachiger Wörterbücher hilfreich, wenn die Bedeutungen lexikalischer Einheiten mittels gut gewählter Beispiele und Belege beschrieben werden. Als gut gewählt gelten Beispiele dann, wenn sie typische Verwendungsweisen der lexikalischen Einheiten bzw. Lesarten veranschaulichen. Die Verwendung typischer Belege ist gängige Praxis in den großen englischsprachigen Wörterbüchern, aber auch bereits bei der Erstellung des <a href="/d/wb-wdg">Wörterbuchs der deutschen Gegenwartssprache</a> (WDG), welches die Grundlage für das <a href="/d/wb-dwdswb">DWDS-Wörterbuch</a> bildet. Das WDG beispielsweise enthält zu den ca. 90 000 Einträgen gut 230 000 Beispiele mit typischen Verwendungskontexten. </p> <p> Mit der Verfügbarkeit großer Korpora – die DWDS-Korpora umfassen mehrere Milliarden laufende Textwörter – besteht das Problem heutzutage weniger darin, Belege für ein Stichwort bzw. eine Lesart zu finden, sondern vielmehr darin, aus der Fülle der Kandidaten die am besten geeigneten Belege zu extrahieren. Insbesondere muss festgelegt werden, was einen „guten Beleg“ ausmacht bzw. umgekehrt müssen Kriterien festgelegt werden, um ungeeignete Belege herauszufiltern. </p> <h2>Methode</h2> <p> Mit dem Werkzeug <i>DWDS-Beispielextraktor</i> können für jedes Suchwort, für das Belege in ausreichender Zahl vorhanden sind (mindestens 100), die besten <var>n</var> Belege ausgewählt werden. Die Auswahl der Belegmenge folgt globalen und lokalen Kriterien. </p> <p> Die globalen Kriterien beziehen sich auf die Ausgewogenheit der Belegmenge: </p> <ul> <li>Die Belege sollten aus verschiedenen Zeitscheiben stammen.</li> <li>Die Belege sollten, wenn möglich, aus mehr als einer Textsorte entstammen (Belletristik, Gebrauchsliteratur, Wissenschaft, Zeitungen).</li> <li>Quellen aus der Setzliste (z. B. Thomas Mann, Habermas, Suter, cf. Geyken 2007) werden präferiert.</li> </ul> <p>Die lokalen Kriterien beziehen sich auf die Korrektheit und Verständlichkeit eines Beleges:</p> <ul> <li>Ein Beleg sollte eine bestimmte Satzlänge nicht über- oder unterschreiten.</li> <li>Ein Beleg sollte mit einem großgeschriebenen Wort anfangen und mit einem Satzzeichen enden.</li> <li>Ein Beleg sollte keine freien Pronomen enthalten.</li> <li>Ein Beleg sollte im Bezug zur <a href="/d/tagh">TAGH-Morphologie</a> keine unbekannten Wörter enthalten.</li> <li>Ein Beleg sollte gebräuchliche Wörter enthalten.</li> <li>Das Stichwort sollte an prominenter Stelle im Satz stehen, also möglichst im Hauptsatz.</li> </ul> <p> Eine Auswahl von derzeit maximal fünf Belegen wird bei jedem Suchwort angezeigt. </p> <h2>Weitere Informationen</h2> <ul> <li>Jörg Didakowski, Lothar Lemnitzer, Alexander Geyken (2012): <i>Automatic example sentence extraction for a contemporary German dictionary.</i> In: Proc. EURALEX 2012, Oslo, pp. 343–349.</li> <li>Alexander Geyken (2007). <i>The DWDS corpus: A reference corpus for the German language of the 20th century.</i> In: Fellbaum, Christiane (Hg.): Collocations and Idioms: Linguistic, lexicographic, and computational aspects. London, S. 23–41.</li> </ul> </div> </div> </div> <div id="to-top"><img src="https://www.dwds.de/dwds_static/images/up.svg" title="nach oben scrollen" data-toggle="tooltip" onclick="scrollToTop()"/> </div> </main><footer class="dwds-bottom dwds-bottom-box"> <div class="container"> <div class="row dwds-bottom-claim"> <div class="col-md-5 col-md-offset-2" style="margin-top:10px"> DWDS – Digitales Wörterbuch der deutschen Sprache </div> <div class="col-md-2 col-md-offset-1"> <a href="https://play.google.com/store/apps/details?id=org.kiwix.kiwixcustomdwds" target="_blank"> <img src="https://www.dwds.de/dwds_static/images/app/google-play-badge.png" alt="Logo Google Play Store" style="width:120px"/> </a></div> </div> <div class="row"> <div class="col-md-12"> <div class="dwds-bottom-box"> <div class="dwds-bottom-flex"> <a href="/d/ueber-uns">Über uns</a> </div> <div class="dwds-bottom-flex"> <a href="/d">Dokumentation</a> </div> <div class="dwds-bottom-flex"> <a href="/d/datenschutz">Datenschutz</a> </div> <div class="dwds-bottom-flex"> <a href="/d/nutzungsbedingungen">Nutzungsbedingungen</a> </div> <div class="dwds-bottom-flex"> <a href="/d/zitieren">Zitieren des DWDS</a> </div> <div class="dwds-bottom-flex"> <a href="https://www.dwds.de/kontakt">Kontakt und Feedback</a> </div> <div class="dwds-bottom-flex"> <a href="/d/impressum">Impressum</a> </div> <div class="dwds-bottom-flex"> <a href="https://www.bbaw.de/" target="_blank"><img src="https://www.dwds.de/dwds_static/images/bbaw.svg" style="height:80px" height="80" width="180" alt="BBAW-Logo" loading="lazy" /></a> </div> </div> </div> </div> </div> </footer> <!-- Bootstrap slider, https://github.com/seiyria/bootstrap-slider --> <link href="https://www.dwds.de/dwds_static/bootstrap-slider/css/bootstrap-slider.min.css" rel="stylesheet"><!--[if lt IE 9]> <script src="https://www.dwds.de/dwds_static/js/html5shiv.min.js"></script> <script src="https://www.dwds.de/dwds_static/js/respond.min.js"></script> <![endif]--><link href="https://www.dwds.de/dwds_static/dwds.min.css?v=85" rel="stylesheet"> <script> base = '/' base_static = 'https://www.dwds.de/dwds_static/' q = "" is_lex = 0 is_user = 0 pos = '' dwds_host_staging = 'https://www.dwds.de/' dwds_host_dynamic = 'https://www.dwds.de/' dwds_host_api = 'https://www.dwds.de/' dwds_want_kiwix = 0</script> <script src="https://www.dwds.de/dwds_static/dwds.min.js?v=63"></script><script> new ClipboardJS('.ddc-copy-hit'); </script><!-- Matomo --> <script> var _paq = window._paq = window._paq || []; /* tracker methods like "setCustomDimension" should be called before "trackPageView" */ _paq.push(['trackPageView']); _paq.push(['enableLinkTracking']); (function() { var u="https://stats.dwds.de/"; _paq.push(['setTrackerUrl', u+'matomo.php']); _paq.push(['setSiteId', '1']); _paq.push(['enableLinkTracking']); _paq.push(['trackPageView']); _paq.push(['trackVisibleContentImpressions']); var d=document, g=d.createElement('script'), s=d.getElementsByTagName('script')[0]; g.async=true; g.src=u+'matomo.js'; s.parentNode.insertBefore(g,s); })(); </script> <noscript><p><img src="https://stats.dwds.de/matomo.php?idsite=1&rec=1" style="border:0;" alt="" /></p></noscript> <!-- End Matomo Code --></body> </html>