8 nonparametrische toetsen 1 Nonparametrische toetsen




Дата канвертавання24.04.2016
Памер49.66 Kb.
8 NONPARAMETRISCHE TOETSEN
8.1 Nonparametrische toetsen
8.2 Mann-Whitney toets

Inleiding voorbeeld

Design

Geaggregeerde data

Toetsing

Beslissing
Vergelijking met t-toets
8.3 2 - toets

Inleiding voorbeeld

Design

Geaggregeerde data

Toetsing

Beslissing
NONPARAMETRISCHE TOETSEN
Parametrische toetsen zijn toetsen waarbij wordt verondersteld dat de verdeling van de afhankelijke variabele een bepaalde vorm heeft. Meestal wordt de normaal verdeling aangenomen. Voorbeeld: Alle toetsen van GLM.
Nonparametrische toetsen zijn toetsen waarbij het niet nodig is te veronderstellen dat de afhankelijke variabele normaal verdeeld is.
Veel nonparametrische toetsen zijn rangorde toetsen. Er kunnen drie redenen zijn om een rangorde toets te gebruiken:


  1. Omdat de afhankelijke variabele niet normaal verdeeld is terwijl N  30. Met name als de verdeling erg scheef is of als er uitschieters zijn.

  2. Omdat de afhankelijke variabele bestaat uit rangscores (percentielscores) en dus niet normaal verdeeld is.

  3. Omdat je als onderzoeker vindt dat de afhankelijke variabele in rangscores moet worden omgezet.

Als voorbeeld van rangorde toetsen behandelen we de Mann-Whitney toets.



8.2 DE MANN-WHITNEY TOETS
Inleiding voorbeeld
We vergelijken twee groepen beginnende biljarters, die hebben geleerd volgens verschillende systemen. Als de ballen eenmaal dicht bij elkaar liggen, en je weet hoe je ze dicht bij elkaar moet houden, kan je score opeens heel hoog oplopen. De vraag is of de ene groep hoger scoort dan de andere.
Data

Subject

Groep

Score

1

A

5

2

A

5

3

A

4

4

A

3

5

B

8

6

B

27

7

B

8

8

B

9

9

B

8

27 = uitschieter


Design
afhankelijke variabele = score bij biljarten

(1 meting per subject)

onafhankelijke variabele = klas (A en B)

reden nonparametrisch = AV niet-normaal verdeeld, grote uitschieters zijn goed mogelijk


Geaggregeerde data
De data worden eerst omgezet in rangscores. Er zijn dan automatisch geen uitschieters meer:


Subject

Groep

Score

Rang

1

A

5

3.5

2

A

5

3.5

3

A

4

2

4

A

3

1

5

B

8

6

6

B

27

9

7

B

8

6

8

B

9

8

9

B

8

6

Vervolgens bereken je de gemiddelde rang in beide groepen.




Groep

Gemiddelde rang

A

2.5

B

7


Toetsing
Analyze > Nonparametric Tests > 2 Independent samples > Mann-Whitney


Geef de afhankelijke variabele op als Test variable.

Geef de onafhankelijke variabele op als Grouping variable.

> Exact...


Kies Exact als N < 30, Monte Carlo als dat niet lukt, Asymptotic als N > 30.



Als je Monte Carlo gebruikt:






Beslissing
p = 0.008 (exact, tweezijdig), dus verwerp H0. De gemiddelde rang is in groep B anders dan in groep A.
(Als je Monte Carlo methode had gebruikt, zou je p  .007 krijgen. Dwz. in 0.7% van de 10 000 gesimuleerde steekproeven was het verschil in gemiddelde rangen groter dan in de echte steekproef).
Vergelijking met t-toets
Als je een t-toets voor onafhankelijke steekproeven doet:

p = .113, dus met een t-toets zou je geen significant verschil hebben gevonden.



8.3 2 - toets
Deze toets gebruik je om samenhang te onderzoeken tussen twee kwalitatieve variabelen.
Inleiding voorbeeld
Is er een in Amerikaanse moordzaken een samenhang tussen

1. Het ras van het slachtoffer, en

2. Het al dan niet opleggen van de doodstraf?
Data (zwarte verdachten)

Verdachte

Ras slachtoffer

Doodstraf?

1

z

nee

2

z

nee

3

w

nee

4

z

nee

5

z

nee

6

w

ja

7

w

nee

8

z

nee

9

w

nee

10

w

nee

11

z

ja

12

z

nee

13

w

nee

14

z

nee

15

z

nee

16

z

nee

17

z

nee

Design
afhankelijke variabele = Doodstraf

(2 niveau’s: ja en nee)

onafhankelijke variabele = Ras slachtoffer

(2 niveau’s: zwart en blank; between-subject)

reden nonpar. toets = beide variabelen kwalitatief.

Hypothesen
H0: Ras slachtoffer en Doodstraf hangen in de populatie niet met elkaar samen.
Geaggregeerde data

Als het slachtoffer zwart is, wordt 1 op 11 van de veroordeelden ter dood veroordeeld. Als het slachtoffer blank is, wordt 1 op 6 van de veroordeelden ter dood veroordeeld. In deze steekproef is er dus samenhang. Moord op een zwarte persoon wordt minder vaak met de dood bestraft. Maar is deze samenhang significant?

Toetsing
Analyze > Descriptive statistics > Crosstabs
Geef de ene variabele op als Rows, de andere als Columns.
Statistics > Chi-square

Exact ... > Asymptotic, behalve als er een verwachtte frequentie < 5 uitkomt; kies dan Exact, of als dat te lang duurt: Monte Carlo.



Bij de berekening wordt voor iedere cel berekent wat de frequentie zou moeten zijn als de twee variabelen niet samenhingen. Dat is dan


verwachtte cel-frequentie =
(rij-totaal)*(kolom-totaal) / N
De geobserveerde frequenties worden daarmee vergeleken. Dit gebeurt met de toetsingsgrootheid
Chi-kwadraat = kwadraat van de afstand tussen geobserveerde en verwachtte frequenties.
Bij een grote chi-kwadraat zal de p-waarde klein zijn en moet je H0 (geen samenhang) verwerpen.

Beslissing
p = 1.000 (exact, twee-zijdig), dus behoud H0: Het opleggen van de doodstraf hang niet samen met het ras van het slachtoffer.
In werkelijkheid was de steekproef veel groter (N = 166). Zie Moore & McGabe, opgave 2.81. Dan is de samenhang wel significant.
Ander voorbeeld
Subjecten: Studenten in intensieve werkgroepen voor Statistiek II deel 1, 1999.
Onafhankelijke variabele: Aantal keer aanwezig
Afhankelijke variabele: Wel / niet geslaagd


Voor extensieve werkgroepen:











База данных защищена авторским правом ©shkola.of.by 2016
звярнуцца да адміністрацыі

    Галоўная старонка