Beratung zu statistischen Methoden, Verfahren und Auswertungen
Was wir anbieten:
- Beratung zu Publikationsvorhaben
- pro Person max. 4 Arbeitsstunden
- Diskussion Ihres Versuchsdesigns und Ihrer Fragen, Empfehlung geeigneter statistischer Methoden
- Angaben zur Durchführung vorgeschlagener Methoden in der Software R
- Beschreibung und Erklärung der verwendeten statistischen Verfahren, Angabe von Referenzen zu den angewendeten Methoden, kurze Diskussion zur Interpretation der Ergebnisse
Was wir nicht anbieten:
- Beratung zu Abschluss- und Zwischenberichten, B.Sc. Arbeiten, Praktika etc.
- Beratung ohne vorherige Terminvereinbarung per E-Mail
- Auswertung Ihrer Datensätze durch Mitarbeiter der Biostatistik
- Fehlerbehebung in Excel, SigmaPlot, Minitab, Matlab, Statistica, Stata, SPSS, SAS, …
Empfehlungen zu Versuchsdesign, Versuchsbeschreibung und Datenstruktur
-
Versuchsdesign
Wir raten dringend dazu, einen ersten Beratungstermin vor Beginn der Studie oder des Versuchs auszumachen, um die statistischen Aspekte der Versuchsplanung zu besprechen. Die randomisierte Wiederholung der Behandlungen von Interesse (in Versuchsanlagen) bzw. ein durchdachter Plan um zufällige Stichproben zu erhalten (in Beobachtungsstudien) ist die Grundvoraussetzung jeder statistischen Auswertung.
-
Versuchsbeschreibung
Wenn Sie Ihre Daten beschreiben, haben Sie bitte immer die folgenden fünf Punkte im Kopf:
-
Versuchseinheiten: Was ist die Versuchseinheit? In einem Laborversuch könnten die Versuchseinheiten z.B. einzelne Pflanzen, Tiere oder Zellkulturen in Petrischalen sein. In einem Feld- oder Gewächshausversuch sind es möglicherweise einzelne Pflanzen, Schläge oder ganze Felder.
-
Randomisierungsstruktur: Randomisierung heißt, dass die Behandlungen von Interesse wiederholt und zufällig den einzelnen Versuchseinheiten zugeteilt werden, auf wenigstens einer Stufe des Versuchs. Benennen Sie Ihre Randomisierungsstruktur mit einem fest definierten Begriff (“vollständig randomisiert”, “Spaltanlage”, “Streifenanlage”, …) oder beschreiben Sie sie detailliert (ein Foto oder eine Skizze ist oft hilfreich). Wie wurden die Versuchseinheiten in Zeit und Raum arrangiert? Welche Substrukturen gibt es (z.B. technische Wiederholungen, Subsampling, …)?
-
Zielgrößen: Welche Größen messen den Effekt von Interesse? Wie wurden diese gemessen (kontinuierlich, diskrete Anzahlen von Ereignissen oder Individuen, Prozentwerte/Proportionen, Quotienten zweier Variablen, …)?
-
Einflussgrößen: Welche Variablen oder Faktoren sollten die Unterschiede in den Zielgrößen erklären? Wie viele Faktorstufen gibt es? Welche Faktoren/Variablen sind von primärem Interesse?
-
Versuchsfrage: Erklären Sie das Ziel Ihrer Arbeit so präzise wie möglich! Wenn Sie sich nicht sicher sind, welche Versuchsfragen von Interesse sind, besprechen Sie sich zuerst mit Ihrem Betreuer! “Ich möchte herausfinden, wie sich erhöhte Stickstoffdüngung auf die Blattfläche auswirkt”, ist ein legitimes Forschungsziel. “Ich möchte signifikante p-Werte haben”, nicht.
-
-
Daten aufräumen
-
Wenn möglich, schicken Sie uns Ihre Daten bitte als txt- oder csv-Datei. xls-Dateien aus Excel können wir ebenfalls akzeptieren.
-
Daten, die zusammen ausgewertet werden sollen, sollten in der Regel in einer einzigen Datei stehen (bei xls-Dateien: in einem einzigen Tabellenblatt); Ausnahme: hochdimensionale Daten.
-
Notieren Sie Ihre Daten im flat file format: Jede Versuchseinheit (Pflanze, Tier, Topf, Petrischale, …) bekommt eine eigene Zeile in der Datentabelle, d.h. alle Informationen über eine bestimmte Versuchseinheit stehen in einer Zeile. Die Spalten enthalten die Werte der beobachteten Variablen und kontrollierten Faktoren und außerdem Information darüber, aus welchem Teilversuch oder welcher Randomisierungsstruktur die jeweilige Versuchseinheit stammt (z.B. in welchem Block sie stand); Ausnahme: Hochdimensionale Daten.
-
Alle Spalten sollten (kurze) Überschriften haben, die Buchstaben und Zahlen enthalten dürfen, aber keine Sonderzeichen (ä ß µ % $), mathematischen Operatoren (+ - * / ^), Klammern oder Leerzeichen. Unterstriche (nicht Unterstreichungen) sind okay.
-
Kodieren Sie fehlende Werte als “NA” und nicht mit Zahlen wie 0 oder 999.
-
Halten Sie alle Versuchsstrukturen fest, die einen Einfluss auf die Zielgrößen haben könnten, indem Sie neue Variablen (d.h. neue Spalten in der Datentabelle) einfügen, selbst wenn diese nicht von direktem Interesse sind (z.B. wenn Teile des Versuchs in aufeinander folgenden Wochen durchgeführt wurden, legen Sie eine eine neue Spalte an, die benennt, welche Beobachtung aus welcher Woche stammt).
-
Wenn Sie uns eine xls-Datei schicken, vermeiden Sie in dem Tabellenblatt mit den Daten für die statistische Auswertung bitte einige Dinge:
-
Formeln, Berechnungen und Grafiken
-
Kommentare und Erläuterungen
-
leere Zeilen, Spalten oder Zellen innerhalb der Tabelle
-
Farben, andere Schriftarten, Fettschrift usw. als einziges Unterscheidungsmerkmal für verschiedene Behandlungen, Wiederholungen o.Ä.
-
Verlinkungen zu anderen Dokumenten
-
mehrere Tabellen in einem Tabellenblatt
-
-
-
Beispiel-Datensatz
Ein Datensatz im flat file format, bei dem alles eindeutig deklariert ist, könnte so aussehen:
Jahr
Ort
Duenger
Gewicht
Blattflaeche
Qualitaet
2012
Ruthe
A
22.43
117.4
2
2012
Ruthe
B
25.91
129.3
3
2012
Ruthe
C
26.11
NA
2
2012
Ruthe
D
29.98
138.5
1
2012
Hannover
A
23.57
120.1
3
2012
Hannover
B
26.92
125.6
3
…
…
…
…
…
…
2013
Ruthe
A
21.88
118.2
2
2013
Ruthe
B
23.56
123.3
3
…
…
…
…
…
…
Kontakt
Um die Beratung so effektiv wie möglich zu gestalten, bitten wir vorab um einige Informationen per E-Mail:
- Name, Mailadresse, Telefonnummer, Institut
- eine kurze, präzise Versuchsbeschreibung:
- Was ist der Anlass bzw. das Ziel des Versuchs?
- Beschreiben Sie Ihre Versuchsanlage (Versuchseinheiten, Randomisierung, Wiederholungen …)
- Welche Variablen wurden im Versuch erhoben bzw. variiert: Zielgrößen, mögl. Einflussgrößen (Faktoren, Kovariablen)?
- Welche Fragestellungen sollen anhand der Daten untersucht werden?
- Bei mehreren bis vielen Fragestellungen: Ordnen Sie die Fragestellungen nach Wichtigkeit!
- einen Datensatz (wenn möglich):
- als Anhang in einem der üblichen Dateiformate (xlsx, csv, txt, …),
- die einzelnen Zeilen stehen für einzelne Objekte/Beobachtungseinheiten,
- die Spalten enthalten die verschiedenen (erhobenen) Variablen
- (bei hochdimensionalen Daten sind Ausnahmen möglich)
- ausgefüllte, vom Vorgesetzten unterschriebene Beratungsvereinbarung (pdf).
Herrenhäuser Straße 2
30419 Hannover
Herrenhäuser Straße 2
30419 Hannover