CINXE.COM
Digitalisierung an der UB Heidelberg: Workflow und Technik
<!DOCTYPE html> <!-- {"":{ "title": "! Kein Titel gesetzt !", "button": "" }, "title": "Digitalisierung an der UB Heidelberg: Workflow und Technik"} --> <html lang="de"><head> <meta charset="utf-8"> <title>Digitalisierung an der UB Heidelberg: Workflow und Technik</title> <meta name="keywords" content=""> <meta name="description" content=""> <meta http-equiv="Content-Language" content="de"> <meta name="organization-name" content="Universitätsbibliothek Heidelberg"> <meta name="organization-email" content="ub@ub.uni-heidelberg.de"> <meta name="city" content="Heidelberg"> <meta name="country" content="Germany - Deutschland"> <meta name="language" content="German, Deutsch, de, at, ch"> <meta name="robots" content="index"> <meta name="robots" content="follow"> <meta name="revisit-after" content="1 month"> <meta name="rating" content="General"> <meta http-equiv="imagetoolbar" content="no"> <meta name="MSSmartTagsPreventParsing" content="true"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <meta name="google-site-verification" content="Fe1egWKUFNNSp3IYTaGTmvQ_nZKTZK6L5q7QetXMfa4"> <script type="text/javascript" src="//www.ub.uni-heidelberg.de/js/jquery-1.11.1.min.js"></script> <link rel="SHORTCUT ICON" href="/favicon.ico" type="image/x-icon"> <style media="screen" type="text/css"> @import url(https://www.ub.uni-heidelberg.de/css/uni/core/base_ltr.css); @import url(https://www.ub.uni-heidelberg.de/css/uni/basemod_ltr_small.css); @import url(https://www.ub.uni-heidelberg.de/css/uni/content.css); @import url(https://www.ub.uni-heidelberg.de/css/uni/style_ltr.css); @import url(https://www.ub.uni-heidelberg.de/css/unilayout2013_ub.css); } </style> <link rel="stylesheet" type="text/css" href="https://www.ub.uni-heidelberg.de/css/ubhd-mod.css"> <script type="text/javascript"> $( document ).ready(function() { var sprachumstellung = $(".sprachumschalter").text(); if(sprachumstellung == '') { $( ".trennstrich" ).hide() $( ".sprachumschalter" ).hide() } }); $(function () { $('.ym-skip1[href="#"]').click(function () { var isHidden = $( "#col1" ).is( ":hidden" ); var isHidden_navi = $( "#naviMainContainer" ).is( ":hidden" ); if(isHidden == true) { $('#col1').show(250); $('#naviMainContainer').show(); $( ".roundbox_white_left" ).hide(); } else { if(isHidden_navi == true) { $('#naviMainContainer').show(); $( ".roundbox_white_left" ).hide(); } else { $('#col1').hide(250); } } }); $('.ym-skip2[href="#"]').click(function () { var isHidden = $( "#col1" ).is( ":hidden" ); var isHidden_einstieg = $( ".roundbox_white_left" ).is( ":hidden" ); if(isHidden == true) { $('#col1').show(250); $('#naviMainContainer').hide(); $( ".roundbox_white_left" ).show(); } else { if(isHidden_einstieg == true) { $('#naviMainContainer').hide(); $( ".roundbox_white_left" ).show(); } else { $('#col1').hide(250); } } }); }); $("a[href^='https://www.ub.uni-heidelberg.de'], a:not([href^='http://'], [href^='#'])") .click(function () { var a = $(this); var href=a.attr("href"); if ( 0 && href.test(/\?/) ) { alert("Link enthält bereits einen Querystring. Bitte &responsive=1 in Browseradresszeile ggf. selbst anfügen und neu laden."); } else { a.attr('href', href+'?responsive=1'); } }); </script> </head> <body> <div id="topBarInstitute"> <a href="#contentbegin" accesskey="6">Navigation überspringen</a><a name="up" id="up"></a> <ul class="ym-skiplinks"> <li id="ym-skip1"><a class="ym-skip1" href="#">Hauptmenü</a></li> <li>|</li> <li id="ym-skip2"><a class="ym-skip2" href="#">Schnelleinstieg</a></li> <li class="trennstrich">|</li> <li class="sprachumschalter"> </li> </ul> </div> <div id="page_margins"> <div id="page"> <div id="universitaet"> <!--// Schriftzug Universität //--> <a href="//www.uni-heidelberg.de/index.html" title="Zur Universität" accesskey="0"><img src="//www.ub.uni-heidelberg.de/nav4/grafik/layout/schriftzug_mit_siegel.gif" alt="Ruprecht-Karls-Universität Heidelberg"></a> </div> <div id="institutslogo_rwd"> <a href="https://www.ub.uni-heidelberg.de" accesskey="1" title="Homepage Universitätsbibliothek Heidelberg"><img src="https://www.ub.uni-heidelberg.de/nav4/grafik/layout/ub_logo2.gif" alt="Universitätsbibliothek"></a> </div> <div id="greyBar"> </div> <div id="main"> <!--// Beginn Seiten //--> <div id="col1"> <!--// Beginn linke Spalte//--> <div id="col1_content" class="clearfix"> <div class="institutslogo"> <!-- Logo-Schriftzug links - Breite: 204 px --> <!-- Link zur Startseite --> <a href="//www.ub.uni-heidelberg.de" accesskey="1" title="Homepage Universitätsbibliothek Heidelberg"><img src="https://www.ub.uni-heidelberg.de/nav4/grafik/layout/ub_logo2.gif" alt="Universitätsbibliothek"></a> </div> <div id="naviMainContainer"> <!--// Beginn Haupt-Navi //--> <div id="heidisuch"> <form action="https://www.ub.uni-heidelberg.de/cgi-bin/search.cgi" name="suchform" method="get" accept-charset="UTF-8" enctype="application/x-www-form-urlencoded"> <input type="text" id="suchfeld" name="query" class="inputSearchTop" placeholder="Schnellsuche ..."> <input class="inputSearchRightButton" type="submit" value=""><br> <input type="hidden" name="q" value="homepage"> <input type="hidden" name="sprache" value="ger"> <input type="radio" name="wo" value="h" id="radh" checked="" onclick="jQuery('#suchfeld').autocomplete('option','disabled',false);"> <label for="radh">HEIDI</label> <input type="radio" name="wo" value="w" id="radw" onclick="jQuery('#suchfeld').autocomplete('option','disabled',true);"> <label for="radw">Web-Seiten</label> </form> </div> <ul> <!-- highlight: ="class="current"" --> <li class="oberste"><a href="https://www.ub.uni-heidelberg.de/helios/kataloge/Welcome.html">Literatursuche und -bestellung</a></li> <li class="oberste"><a href="https://www.ub.uni-heidelberg.de/helios/Welcome.html">Digitale Bibliothek</a></li> <li class="oberste"><a href="https://www.ub.uni-heidelberg.de/service/Welcome.html">Nutzung und Service</a></li> <li class="oberste"><a href="https://www.ub.uni-heidelberg.de/fachinfo/Welcome.html">Fachbezogene Informationen</a></li> <li class="oberste"><a href="https://www.ub.uni-heidelberg.de/schulung/Welcome.html">Kurse, Beratung, E-Learning</a></li> <li class="oberste"><a href="https://www.ub.uni-heidelberg.de/wir/Welcome.html">Bibliotheken der Universität</a></li> <li class="oberste"><a href="https://www.ub.uni-heidelberg.de/a-z/a.html" accesskey="3">A bis Z</a></li> </ul> <div class="navilast"> </div> </div> <div class="roundbox_white_left"> <h4 style="margin-top:5px;">Schnelleinstieg</h4> <ul style="line-height: 1em;"> <li style="margin-bottom: 0.7em"><a href="https://www.ub.uni-heidelberg.de/de/anmeldung-und-nutzerkonto">Anmeldung für Studierende<br>(Erstanmeldung)</a></li> <li style="margin-bottom: 0.7em;"><a href="https://www.ub.uni-heidelberg.de/allg/profil/adoeftel.html" title="Öffnungszeiten der UB Heidelberg">Öffnungszeiten</a></li> <li style="margin-bottom: 0.7em;"><a href="https://www.ub.uni-heidelberg.de/service/einsteiger/ubfuereinsteiger.html">UB für Einsteiger</a></li> <li style="margin-bottom: 0.7em;"><a href="/cgi-bin/ub3d.cgi">Virtueller Rundgang</a></li> <li style="margin-bottom: 0.7em;"><a href="https://katalog.ub.uni-heidelberg.de/cgi-bin/login.cgi">Konto</a></li> <li style="margin-bottom: 0.7em;"><a href="https://www.ub.uni-heidelberg.de/service/gruppenarbeitsraeume.html" title="Informationen zu den Gruppenarbeitsräumen">Gruppenarbeitsräume</a></li> <li style="margin-bottom: 0.7em;"><a href="https://www.ub.uni-heidelberg.de/service/myub.html"><em lang="EN-gb">My</em>UB</a></li> <li style="margin-bottom: 0.7em;"><a href="https://www.ub.uni-heidelberg.de/schulung/literaturverwaltung/Welcome.html">Literaturverwaltung</a></li> <li style="margin-bottom: 0.7em;"><a href="https://www.ub.uni-heidelberg.de/service/openaccess/Welcome.html">Elektronisches Publizieren</a></li> <li class="fz"><span class="fragezeichen">?</span> <a href="https://www.ub.uni-heidelberg.de/service/auskunft.html" title="Auskunft der Abteilung Informationsdienste der UB Heidelberg">Fragen Sie uns!</a></li> </ul> </div> <!-- <div style="font-size: 0.8em; margin-top: 15px;" id="facebook-link"><img alt="Icon Facebook" class="imgLeft" style="margin: 0 5px 0 2px;" src="https://www.uni-heidelberg.de/md/zentral/images/icon_facebook.jpg"> <a title="" href="https://www.facebook.com/ubheidelberg">Die UB auf Facebook</a></div>--> <!-- ICONS --> <div id="social-media-links"> <a title="Die UB auf Facebook" href="https://www.facebook.com/ubheidelberg"> <img alt="Icon Facebook" src="/bilder/logo_facebook.png"> </a> <a title="Die UB auf Youtube" href="https://www.youtube.com/channel/UCkWljtG6woFVHLOsAMWaDFw"> <img alt="Icon Youtube" src="/bilder/logo_youtube.png"> </a> <a title="Die UB auf Instagram" href="https://www.instagram.com/ubheidelberg/"> <img alt="Icon Instagram" src="/bilder/logo_instagram.png"> </a> </div> </div> <!-- Ende Haupt-Navi --> </div> <div id="col2"><div id="col2_content" class="clearfix"> <div class="noprint keyVisual"> <img src="/helios/digi/bilder/bereichsbild.jpg" alt="Buchscanner" /></div> <div class="headlineRightColumn">Allgemeiner Kontakt</div> <div class="boxRightColumn" style="background-image:none;"> <div class="rightColumntext"> <p> <a href="mailto:digitalisierung@ub.uni-heidelberg.de"" title="mit Ihrem E-Mail-Programm eine E-Mail an Digitalisierungszentrum senden"><img alt="Brief" title="E-Mail" align="align='bottom'" src="/nav1/grafik/all/email_transp.gif" /> Digitalisierungszentrum</a><br /> Tel.: 06221-54-2376<br /> <a href="/cgi-bin/digi/digiorder.cgi" title="Link zum Online-Auftragsformular">Online-Auftragsformular</a> </p> </div> </div> <div class="headlineRightColumn">Ansprechpartner</div> <div class="boxRightColumn" style="background-image:none;"> <div class="rightColumntext"> <p>Dr. Thomas Wolf<br><a href="mailto:Wolf@ub.uni-heidelberg.de"" title="mit Ihrem E-Mail-Programm eine E-Mail an Dr. Thomas Wolf senden"><img alt="Brief" title="E-Mail" align="align='bottom'" src="/nav1/grafik/all/email_transp.gif" /> E-Mail</a>, Tel. +49 6221-54-2798<br /> Dr. Maria Effinger<br> <a href="mailto:Effinger@ub.uni-heidelberg.de"" title="mit Ihrem E-Mail-Programm eine E-Mail an Dr. Maria Effinger senden"><img alt="Brief" title="E-Mail" align="align='bottom'" src="/nav1/grafik/all/email_transp.gif" /> E-Mail</a>, Tel. +49 6221-54-3561 </p> </div> </div> <div class="headlineRightColumn">Weitere Informationen</div> <div class="boxRightColumn" style="background-image:none;"> <div class="rightColumntext"> <ul> <li><a href="https://www.ub.uni-heidelberg.de/allg/Mitarbeiter/digitalisierung.html">Digitalisierungszentrum</a></li> <li><a href="https://digi.ub.uni-heidelberg.de/diglit/rss?set=handschriften"><img src="/bilder/rss.png" border='0' alt='RSS' width="15" height="15" style="margin:5px 0 0 0;" title='RSS-Feeder: Handschriften digital'> Neuerscheinungen: Handschriften-digital</a> (RSS Feed 2.0)</li> <li><a href="https://digi.ub.uni-heidelberg.de/diglit/rss?set=druckschriften"><img src="/bilder/rss.png" border='0' alt='RSS' width="15" height="15" style="margin:5px 0 0 0;" title='RSS-Feeder: Druckschriften digital'> Neuerscheinungen: Druckschriften-digital</a> (RSS Feed 2.0)</li> </ul> </div></div> </div></div> <!--ENDE rechte Spalte--> <div id="col3"> <!--// Beginn content //--> <div id="col3_content" class="clearfix"> <div id="content"> <div id="naviHor"> <!-- Beginn horizontale Navi --> <a href="https://www.ub.uni-heidelberg.de/kontakt/Welcome.html" accesskey="4">Kontakt</a> | <a href="https://www.ub.uni-heidelberg.de/sitemap/Welcome.html">Sitemap</a> | </div> <!-- Ende horizontale Navi --> <!-- Beginn Seiteninhalt --> <!--// Beginn Breadcrumb //--> <div class="pathway"> <a href="https://www.ub.uni-heidelberg.de/">Startseite ></a> > <a href="https://www.ub.uni-heidelberg.de/helios/digi/Welcome.html">Digitalisierungszentrum ></a> > <br><br></div> <!--// Ende Breadcrumb //--> <a name="contentbegin"></a> <h1 class="einzeilig">Digitalisierung an der UB Heidelberg: Workflow und Technik</h1> <ul class="verweise"> <li><a href="#konzeption">Konzeption</a></li> <li><a href="#digitalisierung">Digitalisierung</a></li> <li><a href="#qualktrl">Qualitätskontrolle / Aufbereitung</a></li> <li><a href="#volltext_ocr">Volltexterfassung</a></li> <li><a href="#archivierung">Archivierung</a></li> <li><a href="#praesentation">Präsentation, Benutzungsfunktionen</a></li> <li><a href="#annotation">Neues Modul: Annotationen und Kommentare</a></li> </ul> <a name="konzeption"></a><h2><img alt="" class="imgRight img_rwd_100" src="/helios/digi/bilder/digiwerk2.jpg" title="Scanvorrichtungen" />Konzeption</h2> <p>Gemäß den Prinzipien des Open Access ist die freie und nachhaltige Bereitstellung ihrer wertvollen Hand- und Druckschriftenbestände erklärtes Ziel der Universitätsbibliothek Heidelberg. Dabei werden bei der Digitalisierung und der Internetpräsentation die derzeit gültigen Standards, die auch in der aktuellen Fassung der <a class="extern" href="https://www.dfg.de/formulare/12_151/index.jsp" title="Homepage DFG; Praxisregeln Digitalisierung">„DFG-Praxisregeln Digitalisierung“</a> dokumentiert sind, eingehalten.</p> <p>Um einen reibungslosen und übersichtlichen Workflow zu gewährleisten, setzt die UB Heidelberg das selbstentwickelte <a class="pfeil" href="https://www.ub.uni-heidelberg.de/helios/digi/dwork.html" title="Link: Informationen zum Programm DWork">Programm <strong>DWork – Heidelberger Digitalisierungsworkflow</strong></a> für die Arbeitsabläufe bei der Digitalisierung und der Webpräsentation ein. Über eine Web-Applikation wird einerseits die Generierung der Präsentationen, andererseits das Archivierungssystem der Scans und der Metadaten gesteuert. Dabei unterstützt „DWork” sämtliche Einzelschritte des Workflows von der Metadatenerstellung bis hin zu den Arbeitsschritten im <strong>hauseigenen <a href="https://www.ub.uni-heidelberg.de/helios/digi/Welcome.html">Digitalisierungszentrum</a></strong> und automatisiert sämtliche Arbeitsschritte einschließlich der Erstellung der Webpräsentation des jeweiligen Werks. </p> <a name="digitalisierung"></a><h2>Digitalisierung</h2> <p><img alt="Arbeiten am „Grazer Buchtisch“" class="imgRight img_rwd_100" src="/helios/digi/bilder/digiwerk3b.jpg" title="Grazer Buchtisch" />Zur größtmöglichen Schonung der wertvollen und z.T. sehr fragilen Objekte und zur Erzielung maximaler Bearbeitungseffizienz und Bildqualität erfolgt die Digitalisierung wertvoller Codices, wertvoller Drucke oder großformatiger Tafelwerke auf dem so genannten <strong>Buchtisch „Grazer Modell“</strong>. Der speziell zur Digitalisierung von Handschriften entwickelte Kameratisch ermöglicht durch seine Konstruktion eine kontaktlose Direktdigitalisierung fragiler Objekte. Das Buch wird mit Hilfe eines Laserstrahls exakt positioniert, das aufgeschlagene Blatt jeweils durch den milden Sog einer Unterdruckeinrichtung fixiert. Durch eine spezielle Konstruktion ist dabei das Objektiv der Kamera im rechten Winkel auf das Blatt ausgerichtet, so dass auch Verzerrungen minimiert werden können. Das Buch muss bei diesem Vorgang nicht vollständig aufgeschlagen werden. Aufgrund der Konstruktion mit über dem Buch schwebender Kamera genügt ein minimaler Öffnungswinkel von etwa 90 Grad. Entsprechend werden die Seiten einzeln aufgenommen, und zwar jeweils zunächst alle Recto- und anschließend alle Verso-Seiten, so dass das Buch nur einmal – nämlich beim Wechsel von recto zu verso – gedreht werden muss. Für die Aufnahmen wird eine Spiegelreflex-Digitalkamera, Typ CANON EOS 5DS, mit einer Auflösung von ca. 51 Mio Pixel und einer Farbtiefe von 24 Bit verwendet. Die digitalen Images werden per Firewire-Schnittstelle unmittelbar zu einem angeschlossenen PC übertragen und ohne lokale Zwischenspeicherung auf dem Festplattensystem eines Fileservers abgelegt. Dies geschieht im kameraspezifischen Rohdatenformat, um Detailverluste, Farbverfälschungen o.ä. zu vermeiden und gleichzeitig die höchstmögliche Übertragungsgeschwindigkeit zu erzielen.</p> <p>Für weniger empfindliches Material werden im Digitalisierungszentrum derzeit 2 Zeutschel-Aufsichts-Buchscanner eingesetzt: für große Vorlagen bis A0 ein <a href="https://www.zeutschel.de/produkte/os-hq/">OS HQ</a> und für kleinere Vorlagen bis A2 ein <a href="https://www.zeutschel.de/produkte/os-q2/">OS Q2</a> (Auflösung/Farbtiefe jeweils 300 dpi/24 Bit). Diese ermöglichen die Digitalisierung von Doppelseiten, die noch während der Scanphase automatisch geschnitten werden.</p> <p>Diese Geräteausstattung wurde im Januar 2011 um einen <a class="extern" href="http://qidenus.com/technologies/products/robotic-book-scanner/" title="Homepage Qidenus, Produktinformatonen der Firma Qidenus Technologies">Qidenus Scanroboter RBS Pro TT</a> und im Juli 2013 um einen <a class="extern" href="http://qidenus.com/technologies/products/mastered-book-scanner/" title="Homepage Qidenus">Qidenus Scanroboter RBS 3.0</a> ergänzt. Im Frühjahr 2016 wurde zusätzlich ein <a class="extern" href="http://www.book2net.net/index.php/de/produkte/buchscanner/a1/cobra-a1-buchscanner" title="Homepage book2net; Produktinformationen Cobra A1 V-Scan">Cobra A1 V-Scan</a> der Firma Microbox sowie ein Gerät zur Digitalisierung von Wasserzeichen in Betrieb genommen.</p> <a name="qualktrl"></a> <h2>Qualitätskontrolle der Digitalisate und Aufbereitung für die Internetpräsentation</h2> <p>Nach der Digitalisierung werden die Images in das dem technischen Standard für die Archivierung entsprechende TIFF-Format umgewandelt und mittels professioneller Bildbearbeitungssoftware (Adobe Photoshop) so nachbearbeitet, dass Farb-, Helligkeits-, Kontrast- und Schärfegrad weitest möglich dem Original entsprechen. Die am Grazer Buchtisch getrennt aufgenommenen und zunächst in unterschiedlichen Verzeichnissen gespeicherten Recto- und Verso-Seiten werden maschinell umbenannt und ineinander sortiert.</p> <img alt="Vergleich von Original und Online-Digitalisat" class="imgRight img_rwd_100" src="/helios/digi/bilder/digiwerk3.jpg" title="Durchblättern und Vergleichen" /> <p>Zur Kontrolle von Vollständigkeit und Qualität der Digitalisate werden die Images des gesamten Werks am Bildschirm durchgeblättert und überprüft. Fehlende oder den Qualitätsansprüchen nicht genügende Seiten werden unmittelbar nachdigitalisiert und eingefügt.</p> <p>Aus den digitalen Seiten wird unter Verwendung des <a class="extern" href="http://www.loc.gov/standards/mets/METSOverview.v2_de.html">„Metadata Encoding and Transmission Standard“ (METS)</a> das Präsentationsmodell eines virtuellen Buches erstellt. Dazu ist es notwendig, bibliographische Metadaten anzulegen und die Buchstruktur abzubilden. Beides geschieht mit Hilfe des <a class="pfeil" href="https://www.ub.uni-heidelberg.de/helios/digi/dwork.html" title="Link: Informationen zum Programm DWork">Programms <strong>DWork – Heidelberger Digitalisierungsworkflow</strong></a>, durch welches der gesamte Produktionsprozess automatisiert ist.</p> <p>Dieser Workflow beginnt mit dem Anlegen eines Projektnamens, wodurch der Name der XML-Datei festgelegt wird sowie die notwendigen Verzeichnisse auf dem Server erzeugt werden. Im Hintergrund werden in einer MySQL-Datenbank die Metadaten zu den digitalen Büchern verwaltet, in der mit diesem Schritt die Metadatenfelder für den neuen Projektnamen generiert werden. Nun werden die bibliographischen Daten des jeweiligen Werkes mithilfe des Katkey direkt aus dem lokalen Bibliothekssystem abgerufen. Anschließend erfolgt die Eingabe der Strukturdaten: Kapitel- und Unterkapiteleinträge (Bezeichnung und Seitennummer des Kapitelanfangs) werden in ein freies Textfeld in einer vorgegebenen, einfachen Syntax eingegeben. Dabei ist es auch möglich, dass eine Seite mehreren Kapitel zugeordnet wird, was immer dann wichtig ist, wenn auf der letzten Seite eines Kapitels das folgende Kapitel beginnt.</p> <p>Im nächsten Schritt werden die beim Scannen erzeugten Dateien in die Datenbank eingelesen, wobei in der Regel der bereits vorher bei der Umbenennung festgelegte Dateiname für die Bezeichnung der Seite übernommen wird. Hier sind sowohl die Seiten- als auch die für Handschriften und ältere Drucke typische Blattbezeichnung möglich, wodurch in der Webpräsentation die Originalzählung angezeigt und auch als Eingabemöglichkeit für den „Sprung zu Seite“ verwendet werden kann. Die Dateibenennung kann an dieser Stelle jedoch auch nach Wunsch geändert werden, z.B. wenn es sich um im Original nicht gezählte Seiten oder Seiten mit Sonderzählung handelt. Es folgen die Image-Konvertierungen (Umwandlung von TIFF in JPG, für jede Seite Generierung von 5 JPG-Derivaten unterschiedlicher Auflösung) und die OCR-Verarbeitung, die ebenfalls über das Workflow-Programm gesteuert werden.</p> <p>Über eine Exportfunktion werden abschließend die für die Präsentation errechneten Images, die OCR-Daten und die Metadaten im METS-Format exportiert und an das auf dem Webserver der UB liegende Präsentationssystem übergeben sowie das Kopieren der Dateien zur Archivierung angestoßen.</p> <p>Auf der Datenebene existiert am Ende dieses Prozesses eine auch für die langfristige elektronische Archivierung geeignete XML-Datei. Die bibliographischen Metadaten werden darin unter Anwendung von METS gespeichert. Neben diesen reinen Erschließungs-Metadaten, die im <a class="extern" href="http://www.loc.gov/standards/mods/">„Metadata Object Description Schema“ (MODS)</a> eingebettet werden, enthält die XML-Datei auch die Strukturdaten für die Navigation in der Handschrift (Abfolge der Seiten sowie die Verknüpfung des manuell erstellten Inhaltsverzeichnisses mit den einzelnen Images). Zum Datenaustausch per OAI-Schnittstelle stehen die ebenfalls in das METS-Schema eingebettete Dublin Core Beschreibungsdaten zur Verfügung. Da in den Dateien selbst nur reiner ASCII-Text gespeichert ist, haben sie einen nur sehr geringen Speicherbedarf von wenigen kB und enthalten zudem keinerlei proprietäre Formatierungen. Ein weiterer Vorteil von XML besteht darin, dass auch zukünftige Änderungen, z.B. an der Definition des Erscheinungsbildes, sehr leicht umzusetzen sind.</p> <p>Jedes Werk erhält eine zitierfähige Adressierung in Form einer persistenten URL (PURL) und eines Uniform Ressource Name (URN) und auch jede Einzelseite ist eindeutig und nachhaltig referenzierbar. Die Metadaten können per OAI-Schnittstelle abgerufen werden und enthalten alle zur Nutzung durch den <a class="extern" href="http://dfg-viewer.de">DFG-Viewer</a> notwendigen Angaben.</p> <a name="volltext_ocr"></a> <h2>Volltexterfassung mit <a href="http://de.wikipedia.org/wiki/Texterkennung"><abbr title="Optical Character Recognition">OCR</abbr></a></h2> <p>Bei der digitalen Präsentation von Druckschriften ist eine Volltextsuche implementiert. Die Bilddateien vor allem der mit Antiqua-Schriften gedruckten Texte werden automatisch mit professioneller OCR-Software (<a class="extern" href="http://abbyy-finereader.de.softonic.com/">Abbyy-FineReader 11</a>) in der Extended Platform Support (EPS)-Variante auf einem Linux-Server bearbeitet. Die Images werden vor der OCR-Verarbeitung – ggf. inkl. Korrektur der Perspektive – ausgerichtet. Zur Bestimmung der Perspektive wird die diskrete <a class="extern" href="http://de.wikipedia.org/wiki/Radon-Transformation">Radon-Transformation</a> des Scans herangezogen. Das XML-Ausgabeformat enthält neben dem erkannten Text die Koordinaten für die Kennzeichnung der in der Volltextsuche gefundenen Textstellen in der Präsentation. Das Ergebnis dieser Bearbeitung sind Volltextdateien, deren Inhalt in einen Index für die <a class="extern" href="http://lucene.apache.org/solr/">Open-Source Suchengine SOLR</a> eingespielt wird. Somit stehen die Textinhalte für eine Volltextrecherche zur Verfügung. Diese soll eine zentrale Stelle innerhalb der WWW-Präsentation einnehmen. Auch wenn mit diesem Verfahren („schmutziges OCR“) keine Vollständigkeit des Suchergebnisses garantiert werden kann und der Volltext nur zur Positivsuche dienen kann, so stellt es doch gegenüber der reinen Imagepräsentation einen großen Mehrwert dar. Deshalb wird bei der Trefferanzeige in der Volltextsuche nicht nur das Image mit „Highlighting“ der Fundstelle angeboten, sondern auch der OCR-Text selbst. So kann der Wissenschaftler die gefundene Textpassage selbst mit dem Image vergleichen. Zudem besteht so die Möglichkeit, bequem Zitate mit Copy & Paste in die eigenen Texte zu übernehmen. Über einen kurzen <a href="https://www.ub.uni-heidelberg.de/helios/digi/ocr.html">Informationstext</a> wird der Nutzer über das eingesetzte Verfahren informiert. <h2 id="archivierung">Archivierung</h2> <p>Über das DWork-Archivmodul werden die Original-Scandateien, die Metadaten im METS-XML-Format und die Ausgaben der OCR-Verarbeitung im <a class="extern" href="https://de.wikipedia.org/wiki/BagIt" title="Portal Wikipedia; Eintrag 'BagIt'">BagIt-Format</a> gepackt und archiviert. Zu jeder Datei wird hierbei eine Prüfsumme gebildet, bzw. die vorher bereits im ermittelte Prüfsumme validiert und übernommen. An der UB Heidelberg werden die Archivdaten redundant vorgehalten. Neben der Speicherung auf Festplattensystemen wird in den TSM-Verbund der baden-württembergischen Universitätsrechenzentren archiviert. Die Prüfsummen und die Verfügbarkeit der Bandsicherungen werden regemäßig überwacht.</p> <p>Eine Ablieferung eines Digital Master an die Deutsche Nationalbibliothek ist vorgesehen und soll umgesetzt werden, sobald die dortigen Systeme für den Routinebetrieb zur Verfügung stehen.</p> <h2 id="praesentation">Digitale Präsentation der Bestände und Benutzungsfunktionen</h2> <p>Innerhalb des Webauftritts der UB Heidelberg erhält der Besucher freien Zutritt zu den „digitalen Bücherregalen“, aus denen er einzelne Bücher zur genaueren Betrachtung „herausnehmen“ kann. Die Auswahl kann über <a href="https://www.ub.uni-heidelberg.de/helios/digi/digilit.html">thematisch geordnete Listen</a> geschehen bzw. über die <a href="https://www.ub.uni-heidelberg.de/wir/projekte.html">Übersicht der entsprechenden Drittmittelprojekte</a>, oder man kann sich – wie z.B. im Falle der deutschsprachigen Palatina-Handschriften – durch eine nach Signaturen der Codices geordnete <a href="https://www.ub.uni-heidelberg.de/helios/digi/codpalgerm.html">Übersicht</a>, die neben der kurzen inhaltlichen Benennung eine exemplarische Text- oder Bildseite, die als bildhafter Repräsentant des Codices dient, leiten lassen.</p> <p>Hinter dem Link zur Hand- oder Druckschrift liegt die Bildschirmpräsentation eines Buches, das auf einfache Weise nutzbar ist. So ist es möglich, eine beliebige Seiten- bzw. Blattzahl direkt anzusteuern, an den Anfang oder das Ende des Dokuments zu springen, aber auch seitenweise vor- bzw. zurückzublättern. Zusätzlich wird jede digitale Reproduktion mit weiteren Informationen und komfortablen Navigationsmöglichkeiten angereichert. Ausgehend von einer Werkeinstiegsseite, die neben den bibliographischen Informationen wie Signatur, Autor, Titel, Herstellungsort und Datierung, auch das Inhaltsverzeichnis mit einzeln anwählbaren Kapitelüberschriften enthält, kann die Handschrift oder der Druck gezielt an einer bestimmten Textstelle „geöffnet“ werden. Über eine „Vorschau“-Funktion kann sich der Betrachter mit Hilfe von Thumbnails einen Überblick über das gesamte Werk verschaffen: Darüber hinaus wird eine Zoommöglichkeit für die Betrachtung einzelner Details in verschiedenen Vergrößerungsstufen sowie eine Druckfunktion angeboten. Die kompletten Hand- oder Druckschriften werden auch als pdf-Dateien zum Download bereitgestellt. Die Einbindung von Social-Bookmarks rundet die Präsentation ab und bietet die Möglichkeit, persönliche Lesezeichen zu vergeben.</p> <p> <h2 id="annotation">Neues Modul: heiANNO – Das Heidelberger Annotationsmodul für Annotationen und Kommentare</h2> <p>Die in Heidelberg unter <a href="http://hd-historische-bestaende-digital.uni-hd.de" title="Übersichtsseite der digitalisierten Bestände der UB Heidelberg">„Heidelberger historische Bestände – digital“</a> online gestellten Hand- und Druckschriften können mit <a class="pfeil" href="https://www.ub.uni-heidelberg.de/service/openaccess/heianno.html" title="Informationen zu heiANNO - Das Heidelberger Annotationsmodul">heiANNO – Das Heidelberger Annotationsmodul</a> durch Wissenschaftler und Wissenschaftlerinnen weltweit annotiert werden. Jede Annotation, die über ein komfortables Webeingabeformular angebracht werden kann, ist mit dem Namen ihres Urhebers versehen, und ist eindeutig referenzierbar und damit zitierfähig. Korrekturen sind über eine Versionierung möglich, so dass jederzeit frühere Versionen einsehbar sind. Als Datenmodell für die als eigenständige, von der Anwendung DWork unabhängige (und somit für weitere Dienste nachnutzbar) programmierte Applikation fungiert das <a class="extern" href="http://www.openannotation.org/spec/core" title="Homepage Open Annotation Collaboration Model">„Open Annotation Collaboration Model (OAC Model)”</a>.</p> <p>Die entsprechenden Text- und Bildzonen im digitalen Faksimile können über frei zeichenbare Polygone referenziert werden. Über die Annotationen können so semantische Verknüpfungen auf externe Objekte erstellt werden. Das Annotationswerkzeug wird auch in den nächsten Jahren weiter ausgebaut werden. Zusammen mit einem Editionsmodul trägt es dazu bei, dass sich der an der UB entwickelte Digitalisierungworkflow DWork stetig von einer reinen Präsentationsoberfläche zu einer interaktiven Forschungsplattform weiterentwickelt.</p> </p> </div> <div class="cleaner"></div> <div class="topVariabel"> <a href="#up"></a><a href="#up"><img src="/nav4/grafik/layout/icon_top.gif" alt="zum Seitenanfang" width="39" height="13"></a></div> </div> </div> <!--// Ende content //--> <!-- IE Column Clearing --> <div id="ie_clearing"> </div> </div> <br class="rechts"> </div> <!-- Ende 3./mittlere Spalte --> <!-- begin: #footer --> <div id="footerBar"> </div> <!--// roter Balken Seitenfuss //--> <div id="footer"> <div class="copyright"> Letzte Aktualisierung: 24.10.2023 © Universitätsbibliothek Heidelberg <a href="mailto:ub@ub.uni-heidelberg.de"" title="mit Ihrem E-Mail-Programm eine E-Mail an Universitaetsbibliothek Heidelberg senden"><img alt="Brief" title="E-Mail" align="align='bottom'" src="/nav1/grafik/all/email_transp.gif" /> Universitaetsbibliothek Heidelberg</a> <a href="https://www.ub.uni-heidelberg.de/wir/impressum.html">Impressum</a> ⋅ <a href="https://www.uni-heidelberg.de/datenschutzerklaerung_web.html">Datenschutz</a> <span id="intern"><a href="https://www.ub.uni-heidelberg.de/intern/">Intern</a> </span></div> </div><!-- Ende footer --> </div><!-- Ende page --> <!-- Ende pagemargin --> </body> </html>