• Guten Start ins Wintersemester 2024/2025

Vergleich von Korrelationkoeffizienten

Unser Sponsor SAP 4 Students
Unser Sponsor
ich schreibe gerade meine Diplomarbeit. Dabei wende ich eine Regressionsanalyse an. Um im Vorfeld festzustellen ob der Zusammenhang zwischen den Variablen linear ist möchte unter Anderem den Korrelationkoeffizient nach Pearson mit dem nach Spearman vergleichen (siehe unten). Meine Frag ist, ob das so richtig ist bzw. ob man die Korrelationskoeffizienten so verwenden kann.

Auszug Diplomarbeit:
Auch ein Vergleich des Korrelationskoeffizienten nach Pearson mit dem Korrelationskoeffizienten nach Spearman bietet einen Anhaltspunkt dafür, ob der Zusammenhang zwischen den Variablen linear ist. (...) Ist der Korrelationskoeffizient nach Spearman wesentlich höher als der Korrelationskoeffizient nach Pearson kann dies ein Hinweis für einen nicht linearen Zusammenhang zwischen den betrachteten Variablen sein.

Ich würde mich über eine schnelle Antwort oder Anregung sehr freuen.

Liebe Grüße
Sandra Nach oben
[COLOR=#000000 ! important][FONT=Arial ! important][/COLOR]
 
Hmmm, ich weiß es jetzt nicht wirklich, aber das klingt plausibel. Pearson verlangt Linearität und ist tendenziell niedrig, wenn es keine Linearität gibt. Spearman verlangt keine Linearität - wenn der also hoch ist, obwohl Pearson niedrig ist, könnte der Grund dafür die fehlende Linearität sein.

Ich hatte in meiner DA ein ähnliches Problem und hab ein paar sehr schicke Tests gemacht, die ganz zauberhaft aussehende Grafiken produziert haben...
 
kridbonn,

vielen danke für deine Antwort und ich hätte auch gleich noch einen Frage, bei der ich mich wieder sehr über eine Anregung bzw. Antwort freuen würde:

Und zwar habe ich eine Regressionsmodell erstellt, dass folgedermaße aussieht:

Log(y) = b0 + b1*log(x1) + b2*log(x2) + b3*x3 + b4*x4 + b5*x5 + e

Ich möchte b5 jetzt nicht nur bezüglich log y interpretieren sondern auf bezüglich dem untransformierten y und ich Frage mich ob das überhaupt noch möglich ist und wenn ja wie.

Der Grund für die Logarithmierung ist das x1 und x2 in multiplikativer Beziehung mit y stehen. Bei X3 X4 und X5 ist das nicht der Fall aber da log y jetzt feststand kann ich nur den Einfluss dieser Varaiblen auf die Log y interpretieren, was aus inhaltlichen Gründen schwierig bzw. uniteressant ist.
Ist ein bißchen kompliziert, aber ich hoffe es ist noch verständlich.

Liebe Grüße
Sandra
 
Naja, exp ist die Umkehrfunktion zum log. Du könntest also den Zusammenhang von exp(x5) und y diskutieren. Aber macht diese Interpretation überhaupt Sinn?
 
nein ich denke eine Interpretation ist schwierig, aber mich interessiert das einfach und ich möchte das in einer Fußnote der Diplomarbeit als Hintergrundwissen angeben.

Also sieht das ursprüngliche Modell folgendermaßen aus?

moz-screenshot-1.jpg
Y = β0* X1^(β1 ) * X2^(β2 ) * e^(β3*X3 )* e^(β4*X4 )* e^(β5*X5 )*ε
Der Grund für die Anwendung der Regressionsanalyse ist ein Vergleich der unterschiedlichen "Erklärungsbeitrage" der unabhängigen Varaiblen. Dazu kann ich auch die Loagrithmierten Größen verwenden und benötige keine Rücktransforamtion.


Über eine kurze Antwort bezüglich der Formel würde ich mich wieder sehr freuen.

Danke
Sandra
moz-screenshot.jpg
[COLOR=#000000 ! important][FONT=Arial ! important][/COLOR]
 
Oben