Beschreibung der Beschaffung
Die Sammlung des Museums für Naturkunde Berlin wird so zu einer modernen und global vernetzten Forschungsinfrastruktur und das Museum zu einem Motor für Innovation und gesellschaftlichen Wandel.
In einem Pilotprojekt werden bis Ende 2022 500.000 Insekten und ihre rund 1 Million individuellen Etiketten bearbeitet und fotografiert. Gemeinsam mit Partnern aus Wirtschaft und Wissenschaft hat das niederländische Unternehmen Picturae eine Digitalisierungsstraße für Insekten entwickelt, die nun erstmals im Museum eingesetzt wird. In dem Hochdurchsatzverfahren werden bis pro Tag zu 5.000 Insekten – mit einer maximalen Größe von acht Zentimetern – schneller als je zuvor digitalisiert.
Die an den Exemplaren angebrachten Etiketten bilden die Sammlungsgeschichte der Objekte von heute bis ins 18. Jahrhundert ab, wobei die Formate und Etiketten sehr unterschiedlich sind. Die Formate und Etiketten sind ganz verschieden: Viele sind handschriftlich, während die neuesten gedruckt sind und maschinenlesbare Codes wie QR-Codes, Barcodes oder Data Matrix enthalten. Die digitale Transkription und Erschließung der auf diesen Etiketten befindlichen Objekt-Metadaten sind zentrale Aufgaben im Rahmen der Sammlungsdigitalisierung, da sie eine wichtige Datengrundlage für sammlungsbezogene Forschungsprojekte darstellen.
Hauptziel der vorliegenden Ausschreibung ist die digitale Transkription von entomologischen Etiketteninformationen auf der Grundlage von Fotos.
Um auf die Informationen zuzugreifen, die auf den digitalen Fotos der Etiketten entomologischer Exemplare zu sehen sind, sind die folgenden Arbeitsschritte erforderlich:
- Wörtliche Transkription der einzelnen Etiketten (verbatim)
-Alle sichtbaren Zeichen müssen erfasst und in eine Textform (z. B. ein Volltexteingabefeld in einer Tabellenvorlage oder Datenbank) übertragen werden, die sowohl von Menschen als auch von Maschinen lesbar ist.
- Die Wörter müssen entsprechend dem Originaltext getrennt oder kombiniert werden, auch wenn dies nicht der gängigen Praxis entspricht.
-Der Kontext und die Lesereihenfolge auf dem Etikett müssen berücksichtigt werden. Wenn die Informationen auf dem Etikett spaltenweise angeordnet sind, müssen die aufeinanderfolgenden Textzeilen im Transkript entsprechend sortiert werden. Der Inhalt des Etiketts muss allein anhand des Transkripts nachvollziehbar sein.
- Zeilenumbrüche sind in Absprache mit dem Auftraggeber RCF 4180-konform zu kennzeichnen.
-Wenn auf den Originaletiketten Symbole oder Sonderzeichen vorkommen, muss der Auftragnehmer mit dem MfN Kontakt aufnehmen, um in gegenseitigem Einvernehmen festzulegen, wie diese in der Datenausgabe kodiert werden.
-Unleserliche Zeichen oder Textpassagen sind zu kennzeichnen und an den Auftraggeber zurückzugeben. Der Auftraggeber unterstützt die Entzifferung schwer lesbarer Handschriften durch Hinzuziehung von Sammlungsexperten, die mit dem Schriftbild vertraut sind und die Terminologie kennen. Der Auftragnehmer muss einen Lerneffekt nachweisen und die Fähigkeit der Operatoren stetig verbessern, schwierige Zeichen zu erkennen.
- Die Transkription muss nach den derzeit im MfN geltenden Transkriptionsregeln erfolgen. Den ergabeunterlagen liegt ein Papier bei, das für die Transkription von Dokumenten über die Plattform „Transkribus“ erstellt wurde. Die darin aufgeführten Regeln sind auch als Grundlage für die Etikettentranskription anzuwenden, sofern keine angepasste Fassung der Regeln zur Verfügung gestellt wird. Bei der Auftragsvergabe wird dem Auftragnehmer das jeweils gültige Regelwerk zur Verfügung gestellt. Änderungen des Regelwerks, die während der Auftragsbearbeitung in Kraft treten, sind zu berücksichtigen. Regeln für die Abschrift von Zeichen und Strukturelemente auf den Etiketten können nur im gegenseitigen ausdrücklichen Einvernehmen zwischen dem MfN und dem Auftragnehmer geändert werden. Eine sich daraus ergebende Änderung ist einheitlich für den gesamten Datensatz anzuwenden.