Montag, 27. Juni 2016

Evaluation von DNA Extraktionen mittels Lichtabsorption

Einleitung

Wenn wir DNA aus Pflanzen isolieren wollen wir diese für gewöhnlich in weiteren Experimenten einsetzen. Je nachdem was für Experimente bzw. Methoden dies sind, benötigen wir DNA mit entsprechender Konzentration und Reinheit. Wir verwenden dazu ein Photospektrometer (Nanodrop, ND1000, Fisher Scientific) mit dem die Absorptionseigenschaften von DNA und anderen Molekülen dazu verwendet werden um aussagen über die Konzentration an DNA und deren Reinheit getroffen werden können. DNA absorbiert Licht mit einer Wellenlänge von 260 nm und Proteine mit 280 nm. Über den Wert der Absorption bei 260 nm wird die Konzentration der DNA berechnet (siehe Lambert-beersches Gesetz). Der Quotient 260 nm / 280 nm stellt die Konzentrationen an DNA der Konzentration von Proteinen gegenüber und erlaubt eine qualitative Aussage über die Reinheit der DNA. Ein Wert um 1.8 wird dabei als "reine" DNA interpretiert. Ein höherer Wert deutet meist darauf hin, dass im Extrakt auch RNA enthalten ist, welche Uracil statt Thymin als Base enthält und Absorptionseigenschaften eher wie Adenin hat (siehe Tabelle 1).


Tabelle 1: 260:280 ratios estimated for each nucleotide if measured independently

Guanine1.15
Adenine4.50
Cytosine1.51
Uracil4.00
Thymine1.47
Ein weiterer Faktor der für Abweichungen des 260 / 280 Quotienten sorgen kann, ist der pH-Wert. Da wir i.d.R. mit TE-Puffer arbeiten, sollte dieser aber keine Rolle spielen. Ein Wert unter 1.8 deutet auf Kontaminationen mit Proteinen, Phenolen oder anderen Substanzen hin. Diese können in folgenden Experimenten für Probleme sorgen. Der Quotient 260 nm / 230 nm wird als sekundärer Qualitätsmarker verwendet und sollte bei "reiner" DNA zwischen 1.8 und 2.2 liegen. Wenn dieser geringer ist, deutet das ebenfalls auf Kontaminationen hin, die ebenfalls problematische Auswirkungen auf z.B. eine PCR haben können. Zuletzt will ich explizit darauf hinweisen, dass diese Werte nur Anhaltspunkte sind, welche man dazu verwenden kann um abzuschätzen ob die isolierte DNA für eine Methode brauchbar ist oder nicht. Definitive Sicherheit erhält man nur, durch ausprobieren. Z.B. habe ich in meiner Zeit immer wieder DNA Isolationen gehabt, die laut Nanodrop KEINE DNA enthalten und dennoch eine PCR damit erfolgreich durchgeführt werden konnte. Bei sehr geringen DNA Konzentrationen sind die aufgeführten Quotienten meist unbrauchbar. Über Lichtabsorption lässt sich außerdem keine Aussage über die Integrität der DNA treffen. Die Frage, ob komplette genomische DNA oder hauptsächlich zerstückelte DNA vorliegt muss man über eine Gelelektrophorese ermitteln.

Weiterführende Infos:


In Protokollen zum Praktikum finde ich immer wieder Tabellen mit den Werten, die der Nanodrop ausgibt. Im Falle von guten Ergebnissen, ist das meist nicht notwendig, und es genügt, wenn man mit Worten darauf hinweist, dass die Qualität gut ist. Man bezieht sich dann auf die entsprechenden Quotienten und die Konzentrationen. Es gibt aber auch Fälle, da lohnt es sich, die Daten etwas aufzubereiten und so zu präsentieren, dass man den oder die Aspekte direkt sehen kann, auf die man hinweisen will.

Rohdaten

In den Rohdaten kann man im Prinzip alle Fakten ermitteln. Sobald es aber viele Proben werden, ist es meist schwierig ein Muster (z.B. Gruppen von "guten" und "schlechten" Extrakten) zu erkennen.

In einem vollständigen Nanodrop Bericht sind folgende Informationen in Spalten einer Tabelle enthalten:

  • Sample ID
  • User ID
  • Date Time
  • ng/ul
  • A260
  • A280
  • 260/280
  • 260/230
  • Constant
  • Cursor Pos.
  • Cursor abs.
  • 340 raw
  • Measurement Type
  • Serial #
  • Config.
  • Absorption bei 220,  221, 222, ..., 350 nm
Relevant sind dabei vor allem die Sample ID, die Konzentration (ng / µl) und die Quotienten (260/280 und 260/230). Mit den Absorptionen der Wellenlänge 220 - 350 lassen sich die Spektren, welche man auch am Nanodrop sehen kann, mit Excel reproduzieren.


Tabelle 2: Beispiel-Tabelle mit relevanten Nandrop Ergebnissen aus dem letzten Praktikum. ID entspricht dabei der Sample ID und die zusätzliche Spalte Taxon ordnet entsprechende Artnamen den IDs zu.

Diagramme

Mit einem Diagramm lassen sich Daten und deren innewohnende Tendenzen bzw. Muster darstellen.

Abbildung 1: Darstellung der DNA Konzentrationen (blaue Balken, ng / µl, linke y-Achse) sowie Qualitätsquotienten 260 / 280 (rote Linie) und 260 / 230 (grüne Linie) von DNA Isolationen aus Pelargonium Akzessionen.
Davon ausgehend, dass wir bei reiner DNA 260 / 280 Werte um 1.8 erwarten kann man hier auf Anhieb sehen, dass es starke Schwankungen gibt. Diese gehen aber in den meisten Fällen nach oben und nicht nach unten, was dann für Kontaminationen sprechen würde.

Dass es sich hierbei um eine DNA Isolation handelt, bei der es Probleme gab, lässt sich am besten im Vergleich zu einer anderen zeigen.

Abbildung 2: Vergleich zweier DNA Isolationen. A: wie Abbildung 1 (Pelargonium), B: wie Abbildung 1 (Tagetes).
In Abbildung 2 erkennt man im Vergleich besonders stark die Schwankungen sowie die niedrigen DNA Konzentrationen. In beiden Versuchen wurde die gleiche Masse Ausgangsmaterial verwendet. Was genau die Ursache für die stark schwankenden DNA Konzentrationen und Qualitäten der Pelargonium DNA Isolationen ist, kann man sicherlich nicht, anhand der Daten erkennen. Hier kann man nur spekulieren. Dafür kann man sich z.B. die Beschaffenheit des verwendeten Ausgangsmaterial genauer anschauen. Bei Pelargonium wurden z.B. mehr verschiedene Arten beprobt und auch das alter der entsprechenden Pflanzen ist deutlich heterogener als bei den Tagetes.
Im folgenden weitere Darstellungen die sich mit den Nanodrop Daten anfertigen lassen:

Abbildung 3: Histogramme der 260 / 280 Werte von Pelargonium (A) und Tagetes (B) DNA Isolationen.
In einem Histogramm sieht man die Häufigkeit von bestimmten Werten, bzw. Werten innerhalb eines Intervals. In Abbildung 3 wird wieder deutlich, dass die Werte bei der Pelargonium DNA Isolation deutlich stärker streuen. Es wird aber auch deutlich, dass auch bei den Tagetes einige Werte deutlich über 1.8 liegen. Histogramme lassen sich in Excel erzeugen, wenn man das entsprechende Add-In aktiviert.

Grüße
Thomas










Dienstag, 10. Mai 2016

Optimierung von phylogenetischen Bäumen

Siehe auch...
...Einen Neighbor-Joining Baum erstellen...
...Phylogentische Analysen - Grundlagen von Bäumen...

Nachdem man einen phylogenetischen Baum mit z.B. MEGA berechnet hat, stellt sich die Frage, was man mit dem Baum zeigen will. Phylogenetische Bäume lassen sich in der Regel unterschiedlich darstellen. Zum einen gibt es grundsätzliche Darstellungen (MEGA unterscheidet hier zwischen klassisch, radiär und kreisförmig) und zum anderen ist vielleicht nicht jede Information im Baum relevant für die aktuelle Fragestellung.

Abb. 1: NJ-Phylogeny von Bambus, basierend auf rbcL Sequenzen. Klassisches Phylogram. Rohfassung.
In Abbildung 1 sehen wir die direkte Ausgabe (Rohfassung) eines phylogenetischen Baumes (NJ) der mit 1000 Bootstrap Replikaten getestet wurde. An den Knotenpunkten stehen Prozent Angaben. Diese geben wieder, wie oft die nachfolgenden Einheiten bei den Baum-Replikaten in dieser Zusammensetzung vor kamen. Je höher die Zahl, desto sicherer ist es, dass diese Aufteilung von Bedeutung ist. Im dargestellten Phylogram wird Wert auf die Darstellung der genetischen Distanz (in Form von Veränderungen innerhalb des untersuchten Sequenz-Bereichs) gelegt. Deswegen findet man in der Abbildung auch einen Maßstab. Die Länge von Knotenpunkt zu Knotenpunkt bzw. zum Ende eines Zweiges ist relativ zur genetischen Distanz. Im angeführten Beispiel entspricht die Länge des Maßstabes 0.2 % genetischer Distanz. Bei einer Sequenz Länge von 500 Nucleotiden wäre das 1 Nucleotid, dass im Vergleich anders ist.
Will man mit seinem Baum besonders auf die genetische Distanz hinweisen, würde es sich anbieten, diese für die Zweige anzuzeigen und die Bootstrap Werte auszublenden. Das lässt sich bewerkstelligen indem man über das View-Menü die Optionen auswählt und im Branch-Tab die Anzeige der Statistik/Frequenz abwählt und statt dessen die Zweig-Längen anzeigen lässt.

Abb. 2: Branch Tab, Tree Options Menü von MEGA
Zur Veranschaulichung der 3 Hauptgruppen innerhalb der Bambus Gewächse habe ich diverse Gruppierungen zusammengeklappt.

Abb. 3: Modifizierter Baum aus Abb. 1 mit Schwerpunkt auf die Distanzen zwischen den Bambus Hauptgruppen Arundinarieae, Bambuseae und Olyreae.
Will man mehr auf die Gruppierungen eingehen, empfiehlt es sich den Baum als Cladogram darzustellen und Verzweigungen nur dann zu berücksichtigen, wenn die zugrunde liegenden Daten diese mit einer gewissen Sicherheit unterstützen. In MEGA lässt sich das erreichen indem man einen kondensierten Baum erstellt (Compute - Condensed Tree):

Abb. 4: Modifizierter (kondensierter) Baum aus Abb. 1 mit Schwerpunkt auf Gruppierungen (hier innerhalb der Arundinarieae) die mit mehr als 50% der Bootstrap Replikate unterstützt werden. 
Zuletzt will ich noch auf die Subtree Drawing Options hinweisen, mit denen man auf übergeordnete Gruppierungen hinweisen kann (Abb. 4, Arundinarieae).


Zusammen mit den Tree Options lässt sich so auf besondere Dinge hinweisen, die in der Rohfassung des Baumes nicht direkt ersichtlich sind.

Abb. 5: Modifizierter (kondensierter) Baum aus Abb. 1 mit Schwerpunkt auf Arundinarieae und Bambuseae einschließlich einer Blatt Charakteristik (40 X stereomikroskopische Aufnahme, getrocknertes Blatt, Unterseite).
Mehr Informationen, wie z.B. alternative Software für die Darstellung von phylogenetischen Bäumen findet man hier.

Grüße
Thomas

Sonntag, 9. August 2015

Tools der Morphometrie - Morpheus et al.

Morpheus et al.

 "Morpheus et al. is a cross-platform, general purpose software package for morphometric analysis."
  • Slice, Dennis E., 2013. Morpheus et al., Java Edition. Department of Scientific Computing, The Florida State University, Tallahassee, Florida, U.S.A. Available from http:/morphlab.sc.fsu.edu/
  • Download

Tools der Morphometrie - MorphoJ

MorphoJ


Eine umfangreiche auf Java basierte Sammlung von Werkzeugen für die Auswertung von Morphometrischen Daten.

Features
  • Variation
    • Principal Component Analysis (PCA)
      "PCA is a useful tool to display variation within a sample and to characterize the main features of shape variation. If the data contain different subgroups, PCA can be used as an ordination method, but users should be aware that PCA is not optimized to find differences among groups (for that purpose, consider canonical variate analysis)."
    • Matrix Correlation
    • Contrast Covariance Matrices
    • Procrustes ANOVA
  • Covariation
  • Comparison
    • Canonical Variate Analysis
    • Discriminant function analysis
    • Phylogenetic comparisons
    • Vector comparisons between analyses
Referenz und Programm Download

Tools der Morphometrie - Lamina

Lamina

Bylesjö, M. et al., 2008. LAMINA: a tool for rapid quantification of leaf size and shape parameters. BMC Plant Biology, 8(1), p.82.
Available at: http://www.biomedcentral.com/1471-2229/8/82 .
  • Programm basiert auf JAVA und benötigt das Java Advanced Imaging (JAI) package. Dieses ist laut Angaben der Programmierer im Download enthalten und muss nicht separat installiert werden.
  • Download der Software  (Java) über SourceForge.


Lamina hat manchmal die Eigenart, nicht mehr weiter zu arbeiten.

Winows 7

Eine Möglichkeit, die bei mir zu einer deutlichen Verbesserung geführt hat, ist folgendes:
Die installierten Verknüpfungen (z.B. C:\ProgramData\Oracle\Java\javapath\javaw.exe -Xms100m -Xmx400m -Xss48m -jar "C:\Program Files (x86)\Lamina\Lamina.jar"), die man zum Ausführen von Lamina aufruft, sind so eingestellt, dass dem Programm 100 - 400 MB Speicher zur Verfügung stehen.

Über den entsprechenden Startmenü-Eintrag gelangt man zu den Eigenschaften der Verknüpfung und kann die Lamina zur Verfügung stehende Speicher Menge erhöhen.


Windows 7, Start Menü, Eigenschaften der Lamina Verknüpfung aufrufen

Eigenschaften der Lamina Verknüpfung ändern...
ACHTUNG: Das Feld enthält mehr Informationen als man auf den ersten Blick sieht. Feld anklicken und mit linker Pfeiltaste den Cursor bewegen.
-Xmx400m verändern zu -Xmx1G
Übernehmen bzw. OK anklicken und ab sofort sollte Lamina besser arbeiten.

Windows 8

Bei Windows 8 gelangt man über die Suche des Start Screens zu den Lamina Verknüpfungen. Über die rechten Maustaste lässt dich der Speicherort öffnen. Dort angekommen kann man wie bei Windows 7 über Eigenschaften die Verknüpfung verändern.

Windows 8, Start Screen Suche nach Lamina
Windows 8, Lamina Speicherort geöffnet, Eigenschaften der Lamina Verknüpfung aufrufen

Unter Windows 8 trat nach der Modifikation allerdings ein weiteres Problem auf. Dieses kann man durch Reduzierung der "Thread Stack Size" (-Xssn) von 48m auf 24m beheben. Dazu die Option -Xss48m auf -Xss24m verändern und bestätigen.

Samstag, 8. August 2015

Morphologie - Morphometrie

Die Evolution hat viele verschiedene morphologische Phänomene hervorgebracht, die wir sehen, messen und vergleichen können. Im folgenden werden Programme vorgestellt, mit denen man entsprechende Daten erzeugen und auswerten kann.

Übersicht

ProgrammFunktionDaten
ShapeErfassung und AuswertungKonturen
LeafAnalyserErfassung und AuswertungKonturen
LaminaErfassungDimensionen, Konturen
MorphoJAuswertungKonturen
Morphomatica?Konturen
Morpheus et al?Konturen
CLICErfassung und AuswertungKonturen

Shape

Iwata, H. & Ukai, Y., 2002. SHAPE: A Computer Program Package for Quantitative Evaluation of Biological Shapes Based on Elliptic Fourier Descriptors. Journal of Heredity, 93(5), pp.384–385.
Available at: http://jhered.oxfordjournals.org/content/93/5/384.short .
  • Es handelt sich hierbei um ein Programm zur Analyse von geschlossenen Konturen.
  • Die im Paper angegebene URL , welche zum Programm Download führen sollte, funktioniert nicht. Über eine Google Suche nach "SHAPE Iwata" gelangt man aber zur derzeitigen Web Seite  auf der man das Programm runter laden kann.

LeafAnalyser

Weight, C., Parnham, D. & Waites, R., 2008. TECHNICAL ADVANCE: LeafAnalyser: a computational method for rapid and large-scale analyses of leaf shape variation. The Plant Journal, 53(3), pp.578–586.
Available at: http://dx.doi.org/10.1111/j.1365-313X.2007.03330.x .
  • Die im Paper angegebene URL , welche zum Programm Download führen sollte, funktioniert nicht. Es hat den Anschein, als wäre die Seite gehackt worden. Man findet das Programm aber bei SourceForge.

Morphomatica

"Morphomatica ist ein benutzerfreundliches Computerprogramm, dass zur morphometrischen Analyse der Konturen von Ostrakodenschalen entworfen wurde. Es wurde im Zeitraum von 2001 – 2007 von J. Linhart, W. Brauneis und W. Neubauer (Universität Salzburg) unter Verwendung der biologischen Grundlagen von Dan. L. Danielopol (Österreichische Akademie der Wissenschaften) entwickelt. Die Version Morphomatica 1.6.1 eignet sich besonders für vergleichende Studien von merkmalsarmen Ostrakodenschalen."

Collection of Landmark for Identification and Characterization (CLIC)


Freitag, 7. August 2015

Daten beschreiben und darstellen mit R und Co

Für die Arbeit mit DNA Sequenz Daten haben wir bereits Programme wie MEGA oder Jalview kennengelernt. Im folgenden sollen nun Programme vorgestellt werden, die etwas weniger speziell sind und mit anderen Daten, wie z.B. den Ausgaben von LAMINA, Smartgrain und ähnlichen Programmen umgehen können.

Tabellenkalkulation

Mit MS Excel oder dem kostenlosen OpenOffice Calc können wir ohne großen Aufwand verschiedene Diagramm Typen erstellen.
Für den etwas anspruchsvolleren Daten Jongleur lohnt es sich aber nach anderen Möglichkeiten Ausschau zu halten.

R - kostenloser Alleskönner für ... Nerds ?

R ist eine Programmiersprache für das statistische Arbeiten. Daten lassen sich in diversen Formaten einlesen, umwandeln, beschreiben, testen und darstellen. Seit 2011 gibt es für R neue Kleider, R Studio ist eine grafische Nutzeroberfläche für R.
Wer mit R (Studio) arbeiten will installiert sich R und anschließend R Studio.

How-to und Tutorials

Origin Professional

Als Student und Mitarbeiter des KIT hat man die Möglichkeit die Datenanalyse- und Grafiksoftware Origin Professional kostenlos zu nutzen. Die Professional Version beinhaltet dabei ebenfalls Multivariate Methoden wie z.B. die Principal Component Analyse.

Nach dem kostenlosen Kauf, stehen einem 3 Downloads zur Verfügung (2 mal MSI Dateien und eine EXE Datei). Mein Versuch das Programm über eine der MSI Dateien zu installieren, schlug fehl, bzw. führte dazu, dass ich beim Start des Programmes darauf hingewiesen wurde, dass die Lizenzdatei fehlt. Die Installation über die EXE Datei dagegen führte zum Erfolg. Man benötigt zur Installation den Lizensschlüssel, die Adresse und den Port des Lizensservers. Alle drei Angaben erhält man dem kostenlosen Kauf per Email zugeschickt.

Der Umgang mit Daten ist in Origin ähnlich wie in Excel und Calc. Man arbeitet mit Tabellen und der Maus anstatt mit Funktionsaufrufen über die Tatstatur. Diagramme können direkt formatiert werden. Origin bietet auch die Möglichkeit ala R mit Scripten bestimmte Arbeiten zu automatisieren.

How-to und Tutorials
To be extended...