import pandas as pd
import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
from statsmodels.formula.api import ols
from statsmodels.stats.multicomp import pairwise_tukeyhsd
import pingouin as pg
import statsmodels.api as sm
from statsmodels.formula.api import ols
from statsmodels.stats.anova import AnovaRM
import pandas as pd
import scikit_posthocs as sp
import pingouin as pg

# Excel-Datei einlesen
mitmess = pd.read_excel("mitmess.xlsx")

# Spalten bereinigen (optional)
mitmess.columns = mitmess.columns.str.strip()

# Vorschau anzeigen
print(mitmess.head())

   ID  Gewicht Zeitpunkt
0   1       82        T0
1   2       74        T0
2   3       96        T0
3   4       80        T0
4   5       99        T0

sns.displot(
    data=mitmess,
    x="Gewicht",
    col="Zeitpunkt",           # Ein Diagramm für jeden Zeitpunkt
    bins=10,                   # Anzahl der Bins im Histogramm
    kde=False,                 # Optional: Wahrscheinlichkeitsdichtekurve ausschalten
    color="purple",            # Farbe für alle Plots
    aspect=1.5                 # Aspect-Ratio der Subplots (optional)
)

plt.subplots_adjust(top=0.9)    # Abstand oben anpassen, um Titel sichtbar zu machen
plt.suptitle("Histogramme des Gewichts nach Zeitpunkt")  # Titel für alle Subplots
plt.show()

import seaborn as sns
import matplotlib.pyplot as plt

# Setzt den Stil für das gesamte Plot
sns.set(style="whitegrid")

# FacetGrid für die Aufteilung nach 'Zeitpunkt'
g = sns.FacetGrid(mitmess, col="Zeitpunkt", hue="Zeitpunkt", col_wrap=2, height=4, palette="pastel")

# Kombiniertes Histogramm und Dichteplot
g.map(sns.histplot, "Gewicht", kde=True, bins=5, alpha=0.6)

# Anpassung der Legende
g.add_legend(title="Untersuchte Zeitpunkte", label_order=["T0", "T1", "T2", "T3"])

# Setze Achsenbeschriftungen
g.set_axis_labels("Gewicht in kg", "Anzahl")

# Titel für jedes Diagramm
g.set_titles("{col_name}")

# Hintergrundfarbe und Anpassung der Gitterlinien
g.fig.set_facecolor("moccasin")  # Gesamt-Hintergrundfarbe
g.set(ylim=(0, None))  # Y-Achse von 0 bis maximaler Wert
g.set(yticks=[0, 5, 10, 15, 20])  # Festlegung der Y-Achsenmarken

# Style der Gitterlinien
for ax in g.axes.flat:
    ax.grid(True, which='both', axis='both', color='gray', linestyle='-', linewidth=0.5)  # Gitterlinien hinzufügen
    ax.set_axisbelow(True)  # Stellt sicher, dass Gitterlinien unter den Balken sind

# Setze eine Titel für das gesamte Diagramm
plt.subplots_adjust(top=0.9)  # Platz für den Haupttitel
g.fig.suptitle("Histogramme und Dichteplots nach Zeitpunkt", fontsize=16)

# Diagramm anzeigen
plt.show()

# Gruppierung nach 'Zeitpunkt' und Berechnung der deskriptiven Statistik
summary_stats = mitmess.groupby('Zeitpunkt').agg(
    Anzahl=('Gewicht', 'size'),
    Mittelwert=('Gewicht', 'mean'),
    Median=('Gewicht', 'median'),
    Standardabweichung=('Gewicht', 'std')
).round(2)  # Rundet auf 2 Dezimalstellen

# Ausgabe der deskriptiven Statistik
print(summary_stats)

           Anzahl  Mittelwert  Median  Standardabweichung
Zeitpunkt                                                
T0             73       85.97    85.0                8.82
T1             73       81.86    81.0                9.07
T2             73       77.97    77.0                9.17
T3             73       73.03    73.0                9.39

# Durchführung einer wiederholten Messungen ANOVA (gemischtes Modell)
model = ols("Gewicht ~ Zeitpunkt + (1|ID)", data=mitmess).fit()
anova_table = sm.stats.anova_lm(model, typ=2)

# Ausgabe der ANOVA-Ergebnisse
print(anova_table)

                 sum_sq     df          F        PR(>F)
Zeitpunkt   6681.791096    3.0  26.707596  2.899993e-15
1 | ID         8.275194    1.0   0.099230  7.529850e-01
Residual   23934.190560  287.0        NaN           NaN

# Steht noch an ..

dunn_results = sp.posthoc_dunn(mitmess, val_col='Gewicht', group_col='Zeitpunkt', p_adjust='holm')

print(dunn_results)

              T0        T1        T2            T3
T0  1.000000e+00  0.034682  0.000015  2.403653e-12
T1  3.468247e-02  1.000000  0.034682  5.413931e-06
T2  1.527497e-05  0.034682  1.000000  2.529000e-02
T3  2.403653e-12  0.000005  0.025290  1.000000e+00

#Folgt

# folgt

# folgt

Pakete importieren¶

Hypothese¶

Voraussetzungen der einfaktoriellen Varianzanalyse mit Messwiederholung¶

Voraussetzungsprüfung¶

Normalverteilung der Daten mithilfe des Histogrammes¶

Deskriptive Statistik¶

Mauchly-Test auf Sphärizität¶

Ergebnisse der einfaktoriellen Varianzanalyse mit Messwiederholung¶

Post-hoc-Tests¶

Problem: Alpha-Fehler-Inflation¶

Lösung: Korrektur für multiple Tests¶

Profildiagramm¶

Das partielle Eta-Quadrat¶

Berechnung der Effektstärke¶

Eine Aussage¶