Biostatistische Beratung

Die Abteilung Biostatistik bietet Studierenden und Mitarbeitenden der Naturwissenschaftlichen Fakultät biostatistische Beratung an.

Beratung zu statistischen Methoden, Verfahren und Auswertungen

Germination data in : R. Mead, R.N. Curnow, and A.M. Hasted. Statistical methods in agriculture and experimental biology. CRC Press, 2002.

Was wir anbieten:

  • Beratung zu Publikationsvorhaben
  • pro Person max. 4 Arbeitsstunden
  • Diskussion Ihres Versuchsdesigns und Ihrer Fragen, Empfehlung geeigneter statistischer Methoden
  • Angaben zur Durchführung vorgeschlagener Methoden in der Software R
  • Beschreibung und Erklärung der verwendeten statistischen Verfahren, Angabe von Referenzen zu den angewendeten Methoden, kurze Diskussion zur Interpretation der Ergebnisse

Was wir nicht anbieten:

  • Beratung zu Abschluss- und Zwischenberichten, B.Sc. Arbeiten, Praktika etc.
  • Beratung ohne vorherige Terminvereinbarung per E-Mail
  • Auswertung Ihrer Datensätze durch Mitarbeiter der Biostatistik
  • Fehlerbehebung in Excel, SigmaPlot, Minitab, Matlab, Statistica, Stata, SPSS, SAS, …

Empfehlungen zu Versuchsdesign, Versuchsbeschreibung und Datenstruktur

  • Versuchsdesign

    Wir raten dringend dazu, einen ersten Beratungstermin vor Beginn der Studie oder des Versuchs auszumachen, um die statistischen Aspekte der Versuchsplanung zu besprechen. Die randomisierte Wiederholung der Behandlungen von Interesse (in Versuchsanlagen) bzw. ein durchdachter Plan um zufällige Stichproben zu erhalten (in Beobachtungsstudien) ist die Grundvoraussetzung jeder statistischen Auswertung.

  • Versuchsbeschreibung

    Wenn Sie Ihre Daten beschreiben, haben Sie bitte immer die folgenden fünf Punkte im Kopf:

    1. Versuchseinheiten: Was ist die Versuchseinheit? In einem Laborversuch könnten die Versuchseinheiten z.B. einzelne Pflanzen, Tiere oder Zellkulturen in Petrischalen sein. In einem Feld- oder Gewächshausversuch sind es möglicherweise einzelne Pflanzen, Schläge oder ganze Felder.

    2. Randomisierungsstruktur: Randomisierung heißt, dass die Behandlungen von Interesse wiederholt und zufällig den einzelnen Versuchseinheiten zugeteilt werden, auf wenigstens einer Stufe des Versuchs. Benennen Sie Ihre Randomisierungsstruktur mit einem fest definierten Begriff (“vollständig randomisiert”, “Spaltanlage”, “Streifenanlage”, …) oder beschreiben Sie sie detailliert (ein Foto oder eine Skizze ist oft hilfreich). Wie wurden die Versuchseinheiten in Zeit und Raum arrangiert? Welche Substrukturen gibt es (z.B. technische Wiederholungen, Subsampling, …)?

    3. Zielgrößen: Welche Größen messen den Effekt von Interesse? Wie wurden diese gemessen (kontinuierlich, diskrete Anzahlen von Ereignissen oder Individuen, Prozentwerte/Proportionen, Quotienten zweier Variablen, …)?

    4. Einflussgrößen: Welche Variablen oder Faktoren sollten die Unterschiede in den Zielgrößen erklären? Wie viele Faktorstufen gibt es? Welche Faktoren/Variablen sind von primärem Interesse?

    5. Versuchsfrage: Erklären Sie das Ziel Ihrer Arbeit so präzise wie möglich! Wenn Sie sich nicht sicher sind, welche Versuchsfragen von Interesse sind, besprechen Sie sich zuerst mit Ihrem Betreuer! “Ich möchte herausfinden, wie sich erhöhte Stickstoffdüngung auf die Blattfläche auswirkt”, ist ein legitimes Forschungsziel. “Ich möchte signifikante p-Werte haben”, nicht.

  • Daten aufräumen
    • Wenn möglich, schicken Sie uns Ihre Daten bitte als txt- oder csv-Datei. xls-Dateien aus Excel können wir ebenfalls akzeptieren.

    • Daten, die zusammen ausgewertet werden sollen, sollten in der Regel in einer einzigen Datei stehen (bei xls-Dateien: in einem einzigen Tabellenblatt); Ausnahme: hochdimensionale Daten.

    • Notieren Sie Ihre Daten im flat file format: Jede Versuchseinheit (Pflanze, Tier, Topf, Petrischale, …) bekommt eine eigene Zeile in der Datentabelle, d.h. alle Informationen über eine bestimmte Versuchseinheit stehen in einer Zeile. Die Spalten enthalten die Werte der beobachteten Variablen und kontrollierten Faktoren und außerdem Information darüber, aus welchem Teilversuch oder welcher Randomisierungsstruktur die jeweilige Versuchseinheit stammt (z.B. in welchem Block sie stand); Ausnahme: Hochdimensionale Daten.

    • Alle Spalten sollten (kurze) Überschriften haben, die Buchstaben und Zahlen enthalten dürfen, aber keine Sonderzeichen (ä ß µ % $), mathematischen Operatoren (+ - * / ^), Klammern oder Leerzeichen. Unterstriche (nicht Unterstreichungen) sind okay.

    • Kodieren Sie fehlende Werte als “NA” und nicht mit Zahlen wie 0 oder 999.

    • Halten Sie alle Versuchsstrukturen fest, die einen Einfluss auf die Zielgrößen haben könnten, indem Sie neue Variablen (d.h. neue Spalten in der Datentabelle) einfügen, selbst wenn diese nicht von direktem Interesse sind (z.B. wenn Teile des Versuchs in aufeinander folgenden Wochen durchgeführt wurden, legen Sie eine eine neue Spalte an, die benennt, welche Beobachtung aus welcher Woche stammt).

    • Wenn Sie uns eine xls-Datei schicken, vermeiden Sie in dem Tabellenblatt mit den Daten für die statistische Auswertung bitte einige Dinge:

      • Formeln, Berechnungen und Grafiken

      • Kommentare und Erläuterungen

      • leere Zeilen, Spalten oder Zellen innerhalb der Tabelle

      • Farben, andere Schriftarten, Fettschrift usw. als einziges Unterscheidungsmerkmal für verschiedene Behandlungen, Wiederholungen o.Ä.

      • Verlinkungen zu anderen Dokumenten

      • mehrere Tabellen in einem Tabellenblatt

  • Beispiel-Datensatz

    Ein Datensatz im flat file format, bei dem alles eindeutig deklariert ist, könnte so aussehen:

    Jahr

    Ort

    Duenger

    Gewicht

    Blattflaeche

    Qualitaet

    2012

    Ruthe

    A

    22.43

    117.4

    2

    2012

    Ruthe

    B

    25.91

    129.3

    3

    2012

    Ruthe

    C

    26.11

    NA

    2

    2012

    Ruthe

    D

    29.98

    138.5

    1

    2012

    Hannover

    A

    23.57

    120.1

    3

    2012

    Hannover

    B

    26.92

    125.6

    3

    2013

    Ruthe

    A

    21.88

    118.2

    2

    2013

    Ruthe

    B

    23.56

    123.3

    3

Kontakt

Um die Beratung so effektiv wie möglich zu gestalten, bitten wir vorab um einige Informationen per E-Mail:

  • Name, Mailadresse, Telefonnummer, Institut
  • eine kurze, präzise Versuchsbeschreibung:
    • Was ist der Anlass bzw. das Ziel des Versuchs?
    • Beschreiben Sie Ihre Versuchsanlage (Versuchseinheiten, Randomisierung, Wiederholungen …)
    • Welche Variablen wurden im Versuch erhoben bzw. variiert: Zielgrößen, mögl. Einflussgrößen (Faktoren, Kovariablen)?
    • Welche Fragestellungen sollen anhand der Daten untersucht werden?
    • Bei mehreren bis vielen Fragestellungen: Ordnen Sie die Fragestellungen nach Wichtigkeit!
  • einen Datensatz (wenn möglich):
    • als Anhang in einem der üblichen Dateiformate (xlsx, csv, txt, …),
    • die einzelnen Zeilen stehen für einzelne Objekte/Beobachtungseinheiten,
    • die Spalten enthalten die verschiedenen (erhobenen) Variablen
    • (bei hochdimensionalen Daten sind Ausnahmen möglich)
  • ausgefüllte, vom Vorgesetzten unterschriebene Beratungsvereinbarung (pdf).
Biostatistische Beratung
statistische Methoden, Verfahren, Auswertung
Adresse
Institut für Zellbiologie und Biophysik
Herrenhäuser Straße 2
30419 Hannover
Biostatistische Beratung
statistische Methoden, Verfahren, Auswertung
Adresse
Institut für Zellbiologie und Biophysik
Herrenhäuser Straße 2
30419 Hannover