Input DNA Data

From GGBN Wiki
Revision as of 13:45, 30 March 2011 by WikiSysop (talk | contribs)
Jump to: navigation, search

Input Tool

File:Input.jpg
Input Mask DNA Module

This feature enables to set up references between DNA and specimen data.
Input mask is parted in specimen data (green) and DNA data (black). Please have a look at the screenshot.

Before entering DNA data you have to load the relevant specimen data. There is no possibility to save DNA data without specimen information! To guarantee both the safeguarding and long-term availability of referenced DNA samples these should be deposited in research collections. Corresponding data including voucher information have to be stored in suitable collections databases.

Specimen Data

Each DNA sample is extracted from a specimen. This specimen can be a tissue sample, a complete individual, a living plant or animal or a culture (algae, microorganisms). By defining a reference between DNA sample and the DNA voucher you should keep in mind what exactly the DNA voucher is. In terms of the DNA Bank Network the ideal DNA voucher means a complete individual, from which the tissue and DNA sample was taken from. This DNA voucher should be deposited in a natural history collection and the voucher data are available via GBIF. In many cases it is not possible to deposit such an ideal voucher, because it is for example a threatend species. Than you should reference to the most applicable DNA voucher.

The GBIF world

GBIF technologies are basis and backbone of the DNA Module and the DNA Bank Network. Many institutions are GBIF providers, more than 213 millions of specimen and observation records are available via GBIF.
But how to find out if the required specimen data is available via GBIF? For that you should check the following facts:

  • Where is the DNA voucher deposited?
  • Is the relevant institution already a GBIF provider? Ask administrators or curators for help.
    • If so: The requirement related to specimen data is fulfilled.
    • If not: Is the relevant institution planning or willing to become a GBIF provider?
      • If so: The requirement will be met if the relevant database is GBIF accessible.
      • If not: Relevant institution has no specimen database or no possibility of becoming a GBIF provider any time soon?


Dazu benötigen Sie folgende Informationen: 1. Specimen Number/UnitID 2. in welcher Datenbank liegen die Informationen -> ist die Datenbank schon angebunden? (Datenbank anbinden) 3. Für den Fall, dass die Specimen-Daten nicht online verfügbar sind, lesen Sie bitte hier weiter Es ist auch möglich, Daten abzurufen, zu denen es keine Specimen-Nummer bzw. keinen Beleg gibt (s.u.)

Im Folgenden werden alle Felder genauer erläutert.

Grafik 1: Specimen Number/UnitID: Um die Wrapper-Abfrage erfolgreich ausführen zu können, benötigen Sie die UnitID des Specimens. Dabei handelt es sich um eine eindeutige Nummer in der Datenbank. Einige Sammlungen benutzen als UnitID die hausinterne eindeutige Nummer des Beleges, z.B. wird in der Herbar-Datenbank des BGBM der Barcode der Herbarbelege als UnitID verwendet (z.B. "B 10 000204643"), der auch auf dem digitalisierten Beleg zu finden ist. Es kann jedoch auch vorkommen, dass als UnitID eine datenbankintere Nummer verwendet wird, die nichts mit der eigentlichen Beleg-Nummer zu tun hat und demzufolge auch nicht auf dem digitalisierten Beleg zu finden ist! Sollte also bei der Wrapper-Abfrage nicht das gewünschte Ergebnis geliefert werden, könnte das auch daran liegen! Ein Beispiel dafür ist das Herbarium Wien. Die Belege haben hausintern eine Nummer nach folgendem Schema 1956-000123. Als UnitID wird jedoch eine Datenbank-ID benutzt, z.B. 3115643. Specimen database: Hinter "Internal" und "External" verbirgt sich jeweils eine Liste mit Datenbanken. Auf die hausinternen Datenbanken wird genauso per Wrapper zugegriffen wie auf die externen. In der Liste der internen Datenbanken gibt es zusätzlich den Eintrag "offline specimen data". Wenn Sie das auswählen, wird ausschließlich in den Specimen-Daten gesucht, die nicht online verfügbar sind und von Ihnen zuvor eingegeben wurden. An die Auswahl einer Datenbank (außer offline specimen data) ist zwingend die Eingabe der Specimen-Nummer/UnitID gekoppelt. Anschließend müssen Sie auf "Verify" drücken. No specimen number available: Dies trifft zu, wenn z.B. der externe Beleg vorhanden ist, jedoch vor Ort noch nicht in der Datenbank erfasst wurde und noch keine Specimen-Nr. vergeben wurde. Oder es handelt sich um einen Beleg in Privathand. Da es sich dabei immer um externe Belege handelt, kann die Specimen-Nummer nur von der besitzenden Sammlung vergeben werden. Die Specimen-Daten können jedoch hier offline eingegeben werden und später, wenn die Daten durch die externe Sammlung online zugänglich gemacht wurden durch die online-Daten ersetzt werden. Um die Daten dann abzurufen müssen sie die Box "No specimen number available" (siehe Grafik 1) markieren und bei Specimen database "Internal" ->"offline specimen data" auswählen, anschließend auf "Verify" drücken und aus der Liste das gewünschte Objekt selektieren. add offline specimen data: Bei Klick öffnet sich ein neues Formular, in das Specimen-Daten eingegeben werden können, die nicht online verfügbar sind. Gründe dafür können sein: die betreffende Sammlung - hat keine Datenbank, - hat eine Datenbank, die jedoch nicht online via Wrapper zugänglich ist, - hat eine Datenbank, die via Wrapper erreichbar ist, jedoch werden die benötigten Daten erst sehr viel später eingegeben und online zugänglich - der Beleg befindet sich in Privathand und ist nicht per Wrapper erreichbar. Nähere Informationen dazu entnehmen Sie bitte der dortigen Dokumentation. Im Verwaltungsteil der DNA-Daten gibt es eine Funktion, bei der für die betroffenen DNA-Proben im Nachhinein die offline-Daten durch die online-Daten manuell ersetzt werden können. add new dataset: Bei Klick öffnet sich ein neues Formular, in das eine neue Datenbankanbindung eingegeben werden kann. Nähere Informationen dazu entnehmen Sie bitte der dortigen Dokumentation.

TO DO

Abcd 2.05 und digir noch keine Sammelnummer zum Speichern drin!

Add new specimen data provider

Mit diesem Formular können Sie neue Specimen-Datenbanken anbinden. Die Specimen-Datenbanken liegen bei Providern. Oft hostet ein Provider mehrere Specimen-Datenbanken. Dabei wird für die Datenabfrage oft die selbe url für mehrere Datenbanken eines Providers benutzt. Daher wird im Formular zuerst geprüft, ob die url bereits im DNA-Modul gespeichert wurde und wenn ja für welche Specimen-Datenbanken. (Für den Fall, dass die Specimen-Daten nicht online verfügbar sind, lesen Sie bitte hier weiter)

Die Provider-Url bekommt man zumeist über Gbif (wenn nicht muss man sich an das jeweilige Institut wenden): 1. http://data.gbif.org/welcome.htm 2. Nach dem Specimen-Artnamen suchen -> Explore: -> "Occurrences" 3. Add search filter "Catalogue Number" -> Specimen-Number eintragen -> "Add filter" anklicken -> "Search" anklicken 4. In der Tabelle "Sample results" ganz rechts beim richtigen Specimen "View" anklicken 5. Als erster Block erscheint "Dataset" -> auf den Link vom "Dataset" klicken 6. Ganz unten beim Block "Information" erscheint die Url des Providers als "Access Point Url" Diese Url muss in das folgende Feld eingetragen werden: Provider-Url: Beispiel 1: http://ww3.bgbm.org/biocase/pywrapper.cgi?dsa=HerbariumImages Beispiel 2: http://aadc-maps.aad.gov.au/digir/digir.php Beispiel 3: http://www.biologie.uni-ulm.de/cgi-bin/biocase_new/www/pywrapper.cgi?dsa=zoological Beispiel 3 ist die Url zu den zoologischen Datenbanken, die von SysTax gehostet werden. Diese Url gilt daher für viele Specimen-Datenbanken, auf die möglicherweise hier zugegriffen werden muss. Beispiel 1 hingegen gilt nur für die Specimen-Datenbank "HerbarImages" des BGBM. Nach der Eingabe der Url bitte auf "Verify" klicken. Jetzt wird in der DNA-Datenbank gesucht, ob diese Url schon existiert. Fall A - die Url existiert noch nicht: In diesem Fall erscheint eine entsprechende Meldung und die Möglichkeit, einen neuen Provider/Dataset einzugeben. Dabei wird automatisch das Feld "Provider url" mit dem gesuchten Wert gefüllt, kann jedoch beliebig geändert werden. Anmerkung: In jedem Fall sollte man einen Verbindungstest durchführen bevor man speichert, das heißt, prüfen, ob der Provider erreichbar ist. Wenn eine Fehlermeldung kommt, kann man es ein paar Minuten später noch einmal probieren. Möglicherweise lag nur ein temporäres Problem vor. Sollte der Verbindungstest jedoch mehrfach fehlschlagen, muss man sich an den zuständigen Provider wenden. Um zu prüfen, ob das Skript richtig arbeitet, kann man als Test eine "normale Webseite" eingeben (z.B. http://www.bgbm.org).

Die Eingabe des verwendeten Schemas ist zwingend erforderlich. Man kann dieses aus der Liste auswählen (ABCD 1.2, ABCD 2.05, ABCD 2.06, DarwinCore/Digir). Welches Schema verwendet wird, erkennt man, indem man die Provider-Url aufruft bzw. schon an der Url selber, z.B. wenn wie in Beispiel 2 in der url bereits die Bezeichnung "digir" auftaucht. Beim Aufrufen der Url erhält man ein xml-Schema, in dem im oberen Teil u.a. diese oder eine ähnliche Zeile zu finden ist: <SupportedSchemas request="true" namespace="http://www.tdwg.org/schemas/abcd/1.2" response="true"> In diesem Fall (Beispiel 1), wäre es das Schema ABCD 1.2, bei Beispiel 3 wäre es ABCD 2.06. Desweiteren muss eine Bezeichnung eingegeben werden (das ist die Info, dass in der DNA-Input-Mask im Auswahl-Feld erscheint) und ausgewählt werden, ob es sich um eine externe oder interne Datenbank handelt. Diese Zuordnung und Bezeichnung soll Ihnen die Bedienung und das Wiederfinden erleichtern. Da Sie auf die hauseigenen Datenbanken häufiger zugreifen werden und daher eine kurze eigene Liste handlicher ist. Fall B - die Url existiert bereits: In diesem Fall erhält man eine Liste mit den bereits gespeicherten Specimen-Datenbank-Verknüpfungen. Wenn wir z.B. für die SysTax-Url (Beispiel 3) bereits einen Eintrag haben der "Zoologische Staatssammlung München - Mollusca" heißt und nun als nächstes "Zoologische Staatssammlung München - Arachnida" anbinden wollen kann man dafür entweder einen neuen Dataset-Eintrag für den Provider festlegen oder man ändert den Namen "Zoologische Staatssammlung München - Mollusca" in "Zoologische Staatssammlung München " um und legt keinen neuen Eintrag fest. Das bleibt dem Nutzer überlassen. Eine Liste aller gehosteten Datenbanken von SysTax findet man bei Gbif. SysTax ist ein Beispiel, wo sehr viele Datenbanken gehostet werden. Je mehr Datenbanken Sie anbinden werden, desto häufiger werden Sie jedoch weitere Provider finden, die mehr als eine Specimen-Datenbank hosten. Es kann daher der Fall eintreten, dass Sie eine Specimen-Nummer in die DNA-Input-Mask eingeben und mehr als einen Treffer bekommen, einfach weil dieselbe Nummer in verschiedenen Datenbanken des Providers verwendet wird. In diesem Fall können Sie jedoch das gewünschte Specimen anklicken (im Hintergrund werden nun weitere Identifier übergeben und abgefragt) und bekommen die gewünschten Daten angezeigt. Anmerkung: Sollte es sich um einen Digir-Provider handeln ist der Bearbeitungsmodus generell deaktiviert! Das liegt daran, dass Digir zwei weitere Parameter für die "Ansprache" der richtigen Specimen-Datenbank benötigt und somit eine "Sammel-Url" für Datenbanken desselben Digir-Providers nicht zum gewünschten Ergebnis führen würde. Jede Digir-Specimen-Datenbank muss also einzeln angebunden werden. Wenn der Provider mit Digir arbeitet, ist die Eingabe zweier weiterer Parameter zwingend erforderlich: Resource und Source. 1.-4. siehe oben 5. „Retrieve original record from data provider” anklicken (ganz oben in dem hellrosa Kasten) 6. man erhält ein XML-Schema, wobei die ersten Zeilen so aussehen sollten: <response>

 <header>
 <version>$Revision: 1.10 $</version>
 <sendTime>01-12-2007 01:28:09+1100</sendTime>
http://aadc-maps.aad.gov.au:80/digir/digir.php
 <destination>192.38.28.101</destination>

</header></response> 7. seabirds ist in diesem Fall die resource und http://aadc-maps.aad.gov.au:80/digir/digir.php ist die source. (In diesem Beispiel handelt es sich also offensichtlich um eine Datenbank über Seevögel.) Die Source unterscheidet sich in diesem Fall durch ":80" von der url in Beispiel 2. Mitunter kann es jedoch passieren, dass die source mit der Provider-Url identisch ist. Die Eingabe der source ist aber in jedem Fall zwingend. Es kann auch vorkommen, dass die resource sehr kryptisch aussieht, z.B. rsr941f2d0ae5d102bfc2267d999a16650b für eine entomologische Datenbank in Dänemark. 8. Diese Angaben sind in die beiden folgenden Felder einzutragen: Digir-Resource: Digir-Source: Bei jeder neuen Digir-Datenbank muss natürlich auch eine Bezeichnung eingegeben werden und ausgewählt werden, ob es sich um eine interne oder externe Datenbank handelt (so wie oben bei Fall A beschrieben)

DNA Daten

Dateneingabe: Mit diesem Formular können Sie DNA-Daten eingeben und dem richtigen Beleg zuordnen. Die Eingabe-Maske ist aufgeteilt in Specimen-relevante Daten (grün) und DNA-relevante Daten (schwarz). Als erstes sollten Sie die Specimen-/bzw. Aufsammlungs-Daten abrufen.

Grafik 2


Übersicht >> Dateneingabe >> DNA-Daten DNA-Daten eingeben Last DNA No: Die DNA-Nummern sind aufsteigend sortiert. Hier wird die höchste vergebene und eingetragene Nummer angezeigt. Das entspricht meist, jedoch nicht immer der zuletzt eingegeben DNA-Nummer. DNA Extraction Number: Pflichtfeld. Das Format sollte immer eine Zahl sein. Sollten Sie für die spätere Darstellung im Webportal einen Institutions-Code davorsetzen wollen, kann das später für alle Datensätze festgelegt werden. Relation to Voucher: Pflichtfeld. Erweiterbar. Hier ist folgende Auswahl möglich: - DNA from specimen (voucher) - DNA and specimen from the same population - DNA from cultivated offspring of the specimen - No voucher available (voucher->observation) -> das trifft z.B. zu, wenn im Feld nur eine Feder, Blut oder ein Blatt entnommen wurden und nicht das Individuum als Ganzes entnommen wird. Im Idealfall sollte dann dazu ein Foto vom Naturstandort existieren Tissue: Erweiterbar. Bezeichnet das Gewebe bzw. Organ, von dem DNA entnommen wurde (z.B. Muskel, Blüte). Preservation: Erweiterbar. Bezeichnet die Konservierungsmethode des Gewebes/Individuums, aus dem DNA entnommen wurde. (z.B. Alkohol, Frischmaterial, Silikagel) DNA Type: Auswahl zwischen "Complete DNA" und "Mitochondrial DNA" möglich. DNA Extraktion Method: Pflichtfeld. Erweiterbar. Bezeichnet das Extraktionskit. DNA Extraction Date: Pflichtfeld. Bezeichnet das Datum der Extraktion. Das Format ist vorgegeben. DNA Extraktion Staff: Pflichtfeld. Erweiterbar. Anzeige nur intern, nicht im Webportal. Bezeichnet den, der die Extraktion durchgeführt hat. DNA Purification Method: Pflichtfeld. Erweiterbar. Bezeichnet das Aufreinigungskit. Ratio of absorbance: Bezeichnet die Werte der optischen Dichte. Zugelassen sind die Ziffern 0-9 sowie der Punkt. DNA Concentration: Bezeichnet den Wert der Konzentration. Zugelassen sind die Ziffern 0-9 sowie der Punkt. DNA Quality: Auswahl zwischen "high", "medium" und "low". DNA Qualtity Check Date: Bezeichnet das Datum der Qualitätsmessung (Messung von Konzentration und optischer Dichte). Number of Aliquots: Anzeige nur intern, nicht im Webportal. Anzahl der hergestellten Aliquots, Standardwert ist in diesem Beispiel "5". Dabei ist zu beachten, dass der Stock extra gewertet wird. Also wenn man 5 eingibt, bedeutet das, dass 5 Aliquots plus 1 Stock angelegt und gespeichert werden. µl per Aliquot: Anzeige nur intern, nicht im Webportal. Volumenangabe pro Aliquot. Beim Speichern wird im Hintergrund das Gesamtvolumen aller zusammengehörenden Aliquots berechnet sowie die Aliquot-Nummer vergeben. z.B. DNA-Nummer: 1234, fünf Aliquots angelegt -> 1. Aliquot: 1234-A -> 2. Aliquot: 1234-B -> 3. Aliquot: 1234-C -> 4. Aliquot: 1234-D -> 5. Aliquot: 1234-E Location Stock Solution: Pflichtfeld. Anzeige nur intern, nicht im Webportal. Bezeichnet den Lagerort des Stock. Dahinter kann man die Menge des Stocks in µl eintragen. Der Standardwert in diesem Beispiel liegt bei "47". Location Aliquots: Kein Pflichtfeld, jedoch erscheint bei Nichtangabe eine Meldung. Anzeige nur intern, nicht im Webportal. Bezeichnet den Lagerort der Aliquots. Normalerweise passen mehrere Aliquots in eine Box, so dass nur einmal für alle zusammengehörenden Aliquots der Lagerort eingetragen werden muss. Es kann jedoch sein, dass zusammengehörende Aliquots sich auf mehrere Boxen verteilen oder unterschiedliche Volumina aufweisen. Für diesen Fall kann man die in Grafik 3 markierte Box aktivieren und es erscheint eine weitere Tabelle mit der Möglichkeit zur Eingabe von 10 verschiedenen Aliquots. Gleichzeitig verschwinden die Eingabemöglichkeiten für "Number of Aliquots", "µl per Aliquot" sowie "Location Aliquots" (siehe Grafik 4). Hierbei muss nun für JEDES angelegte Aliquot der Lagerort und die µl festgelegt werden. Sollten Sie mehr als 10 Aliquots anlegen wollen, können sie über die Suchfunktion den Datensatz suchen und weitere Aliquots hinzufügen.

Grafik 3

Grafik 4 Backup Aliquot: Anzeige nur intern, nicht im Webportal. Diese Box ist standardmäßig markiert. Es bezeichnet das Aliquot, was zur Sicherheit zusätzlich angelegt wird. Es bekommt keinen fortlaufenden Buchstabenzusatz wie die normalen Aliquots. Source material gone: Anzeige nur intern, nicht im Webportal. Als Ausgangsmaterial ist hier z.B. die Silikaprobe, allgemein die Gewebeprobe oder der ganze Beleg gemeint. DNA Sample Provided by: Erweiterbar. Anzeige nur intern, nicht im Webportal. Bezeichnet den externen Wissenschaftler, der die DNA zur Verfügung gestellt hat. Block until: Sofern der externe Wissenschaftler (DNA Sample Provided by) die Weitergabe des DNA-Materials bis zu einem bestimmten Zeitpunkt blocken möchte, kann hier das jeweilige Datum eingetragen werden. Das Format ist vorgegeben. Die DNA wäre dann im Webportal suchbar, jedoch nicht bestellbar! Block in General: Sofern die DNA-Probe aus z.B. artenschutzrechtlichen Gründen nicht weitergegeben werden darf, muss diese Box markiert sein. Die DNA wäre dann im Webportal nicht suchbar und auch nicht bestellbar! Notes: Anmerkungen zu dieser DNA-Probe. Amplification: Wenn Amplifikationen durchgeführt wurden, muss diese Box (Grafik 5) markiert werden. Dann öffnet sich eine weitere Tabelle (Grafik 6).

Grafik 5

Grafik 6 Amplification successful: Auswahl ja oder nein. Amplification Date: Bezeichnet das Datum der Amplifikation. Das Format ist vorgegeben. Staff: Bezeichnet den, der die Amplifikation durchgeführt hat. Fragment: Erweiterbar. Bezeichnet das Fragment an dem die Amplifikation durchgeführt wurde. GenBank Acc.No: Sofern vorhanden, kann hier die Gen Bank Accession Number eingetragen werden. Link: Sofern eine Gen Bank Accession Number vorhanden ist, kann hier der entsprechende Link eingetragen werden add more Amplifications: Beim Markieren dieser Box öffnet sich die gleiche Tabelle für vier weitere Eintragungen.

Search/Edit

GenBank and BOLD entries