De normale verdeling.

In 1968 werden alle jongens van 18 jaar nog gekeurd voor de toen geldende dienstplicht. In de onderstaande tabel kun je de lengte van 1000 van deze jongens aflezen.

Klasse

ondergrens

bovengrens

midden

frequentie

155

160

157,5

15

160

165

162,5

80

165

170

167,5

235

170

175

172,5

370

175

180

177,5

210

180

185

182,5

80

185

190

187,5

10

190

195

192,5

0

195

200

197,5

0

200

205

202,5

0

totaal

1000

Kiezen we aselect 1 persoon uit deze 1000, dan kunnen we, als x de kansvariabele is die de lengte van de aselect te kiezen persoon aangeeft, eenvoudig bepalen dat P(x < 170) = (235+80+15)/1000 = 0,330.

We breiden de tabel als volgt uit.

Klasse

ondergrens

bovengrens

midden

frequentie

freq. dichtheid per cm

rel. freq. dichtheid

155

160

157,5

15

3

0,003

160

165

162,5

80

16

0,016

165

170

167,5

235

47

0,047

170

175

172,5

370

74

0,074

175

180

177,5

210

42

0,042

180

185

182,5

80

16

0,016

185

190

187,5

10

2

0,002

190

195

192,5

0

0

0

195

200

197,5

0

0

0

200

205

202,5

0

0

0

totaal

1000

 

Nu kunnen we de kans P(x < 170 ) ook berekenen met behulp van de relatieve frequentiedichtheid.

P(x < 170) = 0,003 x 5 + 0,016 x 5 + 0,047 x 5 = 0,330

Kijken we in het histogram, ook wel dichtheidsfunctie genoemd, dan zien we dat de berekende kans gelijk is aan de oppervlakte van de gele staafjes. Dit is een belangrijke eigenschap van de dichtheidsfunctie.

Wanneer we het aantal jongens vergroten tot het aantal 5245, zoals in de onderstaande tabel, dan kunnen we de klassebreedte kleiner maken.

Klasse

ondergrens

bovengrens

midden

frequentie

freq. dichtheid per cm

rel. freq. dichtheid

154,5

155,5

155

7

7

0,001334604

155,5

156,5

156

10

10

0,001906578

156,5

157,5

157

10

10

0,001906578

157,5

158,5

158

14

14

0,002669209

158,5

159,5

159

20

20

0,003813155

159,5

160,5

160

41

41

0,007816969

160,5

161,5

161

59

59

0,011248808

161,5

162,5

162

73

73

0,013918017

162,5

163,5

163

108

108

0,020591039

163,5

164,5

164

131

131

0,024976168

164,5

165,5

165

180

180

0,034318398

165,5

166,5

166

218

218

0,041563394

166,5

167,5

167

242

242

0,04613918

167,5

168,5

168

288

288

0,054909438

168,5

169,5

169

306

306

0,058341277

169,5

170,5

170

346

346

0,065967588

170,5

171,5

171

370

370

0,070543375

171,5

172,5

172

379

379

0,072259295

172,5

173,5

173

353

353

0,067302193

173,5

174,5

174

345

345

0,06577693

174,5

175,5

175

304

304

0,057959962

175,5

176,5

176

298

298

0,056816015

176,5

177,5

177

241

241

0,045948522

177,5

178,5

178

222

222

0,042326025

178,5

179,5

179

177

177

0,033746425

179,5

180,5

180

138

138

0,026310772

180,5

181,5

181

105

105

0,020019066

181,5

182,5

182

82

82

0,015633937

182,5

183,5

183

59

59

0,011248808

183,5

184,5

184

35

35

0,006673022

184,5

185,5

185

27

27

0,00514776

185,5

186,5

186

19

19

0,003622498

186,5

187,5

187

19

19

0,003622498

187,5

188,5

188

10

10

0,001906578

188,5

189,5

189

9

9

0,00171592

totaal

5245

gemiddelde

172,0743565

variantie

32,33612983

standaardafwijking

5,686486598

 

Ook nu kunnen we als x de kansvariabele voor de lengte van een aselect gekozen persoon uit deze 5245 is weer berekenen dat P(x < 170) = (173 + 306 + 288 + 242 + 218 +  180 + 131 + 108 + . + 7)/5245 = 1880/5245 = 0,358.
Deze kans 0,358 kunnen we weer koppelen aan de oppervlakte onder de dichtheidsgrafiek met
x < 170.
Veel mensen zal de getoonde grafiek doen denken aan de normale verdeling. Dat klopt ook , want als we de grafiek van de normale verdeling tekenen met een gemiddelde van 172,0744 (de gemiddelde lengte van de 5245 jongens) en een standaardafwijking van 5,686487 (de standaardafwijking voor de lengte van de 5245 jongens) , dan krijgen we een vrijwel gelijke grafiek.

De hoogte van de punten van de normale verdeling kun je berekenen door de x-waarde in te vullen in de formule

met μ de gemiddelde lengte 172,07 en σ de standaardafwijking 5,686, p is het getal 3.14159 en e is  2.718282.

Zo vind je voor x = 170 de waarde 0,06564, wat goed overeenkomt met de 0,065968 uit de tabel met lengtes.

Het voordeel van de normale verdeling is, dat we alle oppervlaktes (en dus een benadering van de kansen) kunnen berekenen, terwijl alleen het gemiddelde en de standaardafwijking bekend hoeven te zijn. Hoe dat in zijn werk gaat zien we in de volgende hoofdstukken.

voor gebruik website
>