• Guten Start ins Wintersemester 2024/2025

Lösungen für Aufgaben Statistik-Script

Ich verstehe das Konzept nicht. Welchen Sinn haben Übungsaufgaben, zu denen man die Lösungen nicht hat, der Lerneffekt ist doch sehr fragwürdig? Mein Vorschlag wäre, sich hier im Forum über die Aufgaben bzw. Lösungen auszutauschen.

Sally
 
Das ist eine gute Idee, und das ist sogar besser als wenn es Lösungen gäbe. Es zwingt einen, erst selbst nachzudenken, statt in die Lösung zu spinxen. In der Mathematik ist das nicht ganz unüblich, und dieser Gedanke steckt möglicherweise auch hinter den hier fehlenden Lösungen.
 
Ich habe mir die Frage auch schon gestellt. Es liegt sicher auch daran, dass man das Skript in die Klausur mitnehmen darf. Das Skript selber besteht eigentlich nur aus Formeln. Am Liebsten habe ich es immer, wenn es jeweils ein Beispiel (mit Zahlen) gäbe... hehe.
 
Ich mache mal den Anfang: Aufgabe 4 in KE 3: Teilaufgabe e) Hier soll Lambda X->Y, Lambda Y->X und Lambda X<->Y berechnet werden. Für das letzte gibt es aber keine Erklärung im Skript. Da schreiben die nur das berechne sich äquivalent zu Lambda X->Y.

Bei Lambda X->Y streiche ich ja aus den jeweiligen bedingten Verteilungen und aus der Randverteilung die Modalwerte und bestimme aus dem Rest F(+) und F(-), was muss ich denn bei X<->Y streichen?
Habe auch schon den Lehrstuhl angemailt, aber noch keine Antwort bekommen. Weiß hier jemand Hilfe oder ne Seite, wo man das nachschlagen kann?
 
Nein, die ist hier schon richtig. Es gibt im Vertiefungsskript Übungsaufgaben ohne Musterlösung. Die Lösngen sollen hier diskutiert werden.
 
Und dieses dicke Skript mit 550 Seiten dürfen wir mit in die Klausur nehmen? Wie ist dass denn, wenn man in dem Skript schon mit Textmarker unterstrichen hat???
 
Das Skript in Statistik ist sehr wichtig. Es ist zwar völlig unverständlich ABER die erste Aufgabe in den Statistikklausuren ist meistens völlig aus dem Skript zu entnehmen. Man muss dann nur die richtige Stelle im Skript finden und kann sie abschreiben. "krid" wird zwar vorschlagen es schon im Kopf zu haben, was auch völlig richtig ist, aber wenn man es dann doch nicht weiß, kann man sich so immer recht schnell 5- 10 Punkte erarbeiten. Die Aufgaben in der KE werden zusätzlich auch im Tutorium in HH gerechnet und sie sind auch teilweise sehr relevant. Habe sie alle gerechnet und es hat mir geholfen. Besonders für das Grundverständnis.
 
Der krid hat Statistik damals als Fach gewählt, weil man da so wenig auswendig lernen muss - weil man ja die Skripte in der Klausur hat.

Deshalb ist Detailwissen zu lernen einigermaßen sinnfrei, man muss aber wissen, wo es steht. Und dazu braucht man ein Grundverständnis des Themas. Wann brauche ich welche Methode und warum.

Das ist schon schwierig genug, denn natürlich ist der Lehrtext nicht so toll. Ich will dn auch gar nivht verteidigen. Es ist aber auch kein Anfängerkurs (er heißt ja Vertiefung), d.h. Es werden einige Kenntnisse vorausgesetzt. Und die fehlen offenbar recht oft. Ich hab z.B. gesehen, dass sehr oft auf den allgemeinen Grenzwertsatz Bezug genommen wird, aber falsch. Eine GG ist NICHT normalverteilt, bloß weil die aus mehr als 30 Leuten besteht.
 
Dr Franke Ghostwriter
Das kannst Du nicht nachlesen, weil es einfach nicht so ist. Die Sache ist zugegebenermaßen nicht ganz einfach.

Nimm z.B. die deutsche Bevölkerung - das sind auf jeden Fall ein paar mehr als 30. Und wenn Du Dir dann die Altersverteilung ansiehst, wirst Du feststellen, dass diese offenbar nicht normalverteilt ist, sondern irgendwie linksschief. https://de.wikipedia.org/wiki/Altersstruktur

Das gilt analog natürlich auch für Stichproben: Ich nehme an, in der aktuellen EA ist wieder diese Aufgabe mit den Bankkunden. Auch dieses Histogramm lässt nicht wirklich auf Normalverteilung der Stichprobe schließen. Es gibt mehrere Gipfel und der Verlauf des Histogramms ist von der Glockenkurve (die nur zu Vergleichszwecken darin ist und keine Aussage hat!) ziemlich verschieden. Und das soll ja auch so sein. Wenn die Stichprobe die Grundgesamtheit abbilden soll, sollte die Verteilung der Stichprobe nicht völlig anders sein als die der GG.

Was ist also die Aussage des zentralen Grenzwertsatzes? Die Aussage bezieht sich auf Summen (!) von Zufallsvariablen, also z.B. auf den Mittelwert (der ja das Ergebnis einer Summe und einer Division ist). Wenn ich aus der irgendwie verteilten (!) Grundgesamtheit viele ausreichend große Stichproben ziehe, dann ist der Mittelwert der betrachteten Zufallsvariablen approximativ normalverteilt.

In der besagten Aufgabe reicht uns dieses Wissen. Man soll ja das Konfidenzintervall für eine Zufallsvariable (das ist der Mittelwert, nicht die Variable Geburtsjahr) berechnen, und dafür muss man nur wissen, dass die Zufallsvariable normalverteilt ist.

Bei anderen Aufgaben reicht das nicht. Da muss tatsächlich die Grundgesamtheit normalverteilt sein (wenigstens ungefähr), damit das Verfahren funktioniert. Deshalb gibt es die Tests auf Normalverteilung (z.B. Chi-Quadrat-Anpassungstest, Anderson-Darling-Test, Jarque-Bera-Test). Wenn diese Tests die Normalverteilung nicht bestätigen, muss man auf alternative Verfahren (entweder eine andere Teststatistik oder ein verteilungsfreies Verfahren) ausweichen. In modernen Statistikprogrammen werden die entsprechenden Tests und Alternativergebnisse automatisch mitgeliefert.
 
Oben