Harjutused. Toit. Dieedid. Treening. Sport

Kõige väiksem hokimängija. Hokimängijate kasv: analüüsime kõigi käesoleva sajandi maailmameistrivõistluste andmeid

10. Leo Boivin

32. aastal Ontarios sündinud Boyvinist sai üks sõjajärgse NHL-i sümboleid. Vaatamata oma tagasihoidlikule kasvule (170 cm, 80 kg) tõusis Leost tänu karmile stiilile üks NHL-i legende. Boivini lemmikkäik on "viska üle reie" – kirjeldas Bobby Orr oma raamatus:

«Kõige suurejoonelisem on võib-olla vastase vise läbi reie, kuna vastane sooritab siis tavaliselt kolmiksalto enne jääle kukkumist. Leo Boivin, turske ja jässakas kaitsja, oli selle tehnika meister kuni paar aastat tagasi pensionile minekuni. Leo kükitas tavaliselt madalal ja rullus end pahaaimamatu litrikandja taha või kõrvale, püüdis ta puusalt kinni ja viskas ta õhku.

Üks Boivini kuulsamaid jõuliigutusi on tema tabamus Frank Mahovlichi vastu, mis juhtus Leo Bostoni esituse ajal. Mõni sõna suurele Kanada kommentaatorile Foster Hewittile:

"Mahovlich jookseb vahesse, ta on Bostoni sinisel joonel, ainult Boivin on tema ja värava vahel. Suur Frank liigutab litrit vasakule, siis paremale ja üritab Bruinsi kaitsjast mööda minna. BEM! Oh oh! Boivin võttis võimsalt reiele kahekümne seitsmenda numbri. Mahovlich andis rattad. Nüüd on Boivinil litter…”

8. Eric Lindros

Üheksakümnendate alguses peeti suurekasvulist kanadalast õigustatult liiga tulevaseks staariks ning ta õigustas algul Philadelphia spetsialistide ja juhtkonna lootusi, kes 1992. aastal andsid Ericile, kes keeldus mängimast teda draftinud Quebecis. , kolossaalne kompensatsioon - 6 mängijat (sh Peter Forsberg), kaks esimese ringi valikut ja tohutu rahaline auhind. Kuid arvukad põrutused tegid kõik Lindrose katsed endisele tasemele jõuda nulli. 2006/07 hooaeg Dallases jäi Hart Trophy -95 omanikule NHL-is viimaseks.

7. Zdeno Hara

Slovakkia grenader, NHL-i võimsaima viske, Bostoni C-tähe ja 2011. aasta Stanley Cupi omanik, ei saaks lihtsalt aru, kui ta nii silmapaistvate mõõtmetega ei mängiks kõvasti ja kontakti jäähokit.

6. Aleksandr Ovetškin

Üks meie aja parimaid hokimängijaid ei vaja peaaegu mingit tutvustamist. Tema jõustiil ja sportlik kõrkus on saanud Aleksander Suure samasuguseks tunnuseks kui väravad, millest kuue aastaga on NHL-is kogunenud juba üle 300.

5. Darius Kasparaitis

Leedu päritolu kaitsja oli enne suluseisu vastaste jaoks tõeline õudusunenägu. Dariust peetakse õigustatult nõukogude kooli viimaseks kaitsjaks, kes teadis, kuidas reegleid rikkumata kehas kõvasti mängida. Kaks tema jõukäiku said legendaarseks: esimesel juhul püüdis ta kinni pea õlale langetanud Erik Lindrose ning teisel võttis hiilgavas stiilis mängust välja kanadalasest ründaja Simon Gagne.

4. Cam Neely

Üldarvestuses 9. drafti saanud Vancouver Canucksist sai tõeline Bostoni legend, kes veetis Bruinsis 10 hooaega. 1996. aastal eemaldati tema number käibelt – pärast seda pole ükski karumängija kaheksat seljas kandnud. Märkimist väärib ka see, et meie reitingu osalejast sai üks neljast hokimängijast, kes suutis korrata Wayne Gretzky rekordit, lüües põhihooaja 44 esimeses mängus 50 väravat.

3. Denis Potvin

Terve oma karjääri New York Islandersis veetnud suurepärane kaitsja oli üks neist, kes mängis suurepäraselt nii kaitses kui ka ründes. Mõttetu on loetleda tema regaliaid, rääkida statistikast, mis on kaitsja jaoks peadpööritav. Silmapaistev skooritegija, suurepärane kapten ja tõeline liider avab NHL-i kõvemate hokimängijate edetabelis esikolmiku.

2. Dion Fanuf

Calgary Flamesi esimest valikut 2003. aasta draftis peetakse vaatamata tema mitte kõige halvemale rekordile kaasaegse NHL-i üheks enim ülehinnatud mängijaks. Toronto kanadalasest kaptenile on aga võimatu keelduda võimuvõitluse läbiviimisest.

1. Scott Stevens

NHL-i enim mängitud kaitsjast seitsmes sai sajandivahetusel New Jersey võitude tõeliseks sümboliks. Karmi, kompromissitut Stevensit peeti õigustatult Devilsi jäähoki kehastuseks, mis tõi neile nelja aasta jooksul kaks Stanley karikat.




Ühel neist päevadest on lõppenud järjekordsed hoki maailmameistrivõistlused.


Idee sündis matše vaadates. Kui telekaamera näitab pauside ajal mängijaid riietusruumi astumas, on raske mitte märgata, kui suured nad on. Treenerite, meeskonnafunktsionääride, jääareeni töötajate, ajakirjanike või lihtsalt fännide taustal näevad nad tavaliselt väga efektsed välja.



Ja ma esitasin küsimusi. Kas hokimängijad on tõesti tavainimestest pikemad? Kuidas muutub hokimängijate pikkus ajas võrreldes tavainimestega? Kas riikidevahelised erinevused on püsivad?

Andmed

Jäähoki maailmameistrivõistlusi korraldav organisatsioon IIHF avaldab igal aastal osalevate meeskondade koosseisud koos teabega iga mängija pikkuse ja kaalu kohta. Arhiveeri need andmed.


Olen kokku pannud kõikide maailmameistrivõistluste andmed aastatel 2001–2016. Aasta-aastalt on esitatavate andmete vorming veidi erinev, mille puhastamine nõuab teatavat pingutust. Ei mõistnud, kuidas protsessi õigesti automatiseerida, kopeerisin kõik andmed käsitsi, mis võttis aega veidi rohkem kui 3 tundi. Ühendatud andmestik on avalikustatud.


# laadige nõutud paketid nõuda(dplyr) # andmete manipuleerimine nõuda(määrida) # lihtsad manipulatsioonid kuupäevadega nõuavad(ggplot2) # visualiseerimine nõuavad(ggthemes) # ggplot2 teemad nõuavad(cowplot) # ggplots'i kena joondus request(RColorBrewer) # genereerida värvipaletid nõuavad (texreg) # regressioonitabelite lihtne eksport nõuda(xtable) # eksportida andmeraami html-tabelisse # laadige alla IIHF-i andmekogum; probleemide korral saate # käsitsi alla laadida, kasutades stabiilset URL-i (https://dx.doi.org/10.6084/m9.figshare.3394735.v2) df<- read.csv("https://ndownloader.figshare.com/files/5303173") # color palette brbg11 <- brewer.pal(11,"BrBG")

Kas hokimängijad kasvavad? Jäme (perioodiline) võrdlus

Alustuseks võrdleme kõigi 16 maailmameistrivõistluste mängijate keskmist pikkust.



R kood. Joonis 1. Hokimängijate keskmise pikkuse muutus maailmameistrivõistlustel, 2001-2016

# meistrivõistluste keskmine pikkus df_per<- df %>% group_by(year) %>% summarise(height=mean(height)) gg_period_mean<- ggplot(df_per, aes(x=year,y=height))+ geom_point(size=3,color=brbg11)+ stat_smooth(method="lm",size=1,color=brbg11)+ ylab("height, cm")+ xlab("year of competition")+ scale_x_continuous(breaks=seq(2005,2015,5),labels=seq(2005,2015,5))+ theme_few(base_size = 15)+ theme(panel.grid=element_line(colour = "grey75",size=.25)) gg_period_jitter <- ggplot(df, aes(x=year,y=height))+ geom_jitter(size=2,color=brbg11,alpha=.25,width = .75)+ stat_smooth(method="lm",size=1,se=F,color=brbg11)+ ylab("height, cm")+ xlab("year of competition")+ scale_x_continuous(breaks=seq(2005,2015,5),labels=seq(2005,2015,5))+ theme_few(base_size = 15)+ theme(panel.grid=element_line(colour = "grey75",size=.25)) gg_period <- plot_grid(gg_period_mean,gg_period_jitter)


Positiivne trend on ilmne. Pooleteise aastakümnega on hokimängija keskmine pikkus MMil kasvanud ligi 2 sentimeetrit (vasak paneel). Tundub kerge tõus üsna suure variatsiooni taustal (parem paneel). Kas seda on palju või vähe? Küsimusele vastamiseks on vaja õigesti võrrelda rahvastikuga (aga sellest lähemalt artikli lõpus).

Kohordi analüüs

Täpsem viis pikkuse muutuse uurimiseks on võrrelda sünnikohordi järgi. Siin seisame silmitsi kurioosse nüansiga – mõni hokimängija osales rohkem kui ühel maailmameistrivõistlustel. K: Kas ma peaksin puhastama samade inimeste topeltkirjeid? Kui meid huvitab hokimängija keskmine pikkus meistriliigas (nagu ülaloleval pildil), siis pole ilmselt mõtet selgeks teha. Aga kui tahame jälgida hokimängijate kasvu muutust kui sellist, siis minu arvates oleks vale panna rohkem kaalu neile mängijatele, kes regulaarselt maailmameistrivõistlustele pääsesid. Seetõttu puhastasin edasiseks analüüsiks andmed samade mängijate korduvatest sisestustest.


R kood. Andmete ettevalmistamine kohordianalüüsiks

# eemalda topeltloendused dfu_h<- df %>% vali(aasta,nimi,riik,positsioon,sünd,kohort,pikkus) %>% spread(year,height) dfu_h$av.height<- apply(dfu_h[,6:21],1,mean,na.rm=T) dfu_h$times_participated <- apply(!is.na(dfu_h[,6:21]),1,sum) dfu_w <- df %>% vali(aasta,nimi,riik,positsioon,sünd,kohort,kaal) %>% levi(aasta,kaal) dfu_w$av.weight<- apply(dfu_w[,6:21],1,mean,na.rm=T) dfu <- left_join(dfu_h %>% select(nimi,riik,positsioon,sünd,kohort,keskm.kõrgus,osalemisajad), dfu_w %>% select(nimi,riik,positsioon,sünd,kohort,keskm.kaal), by = c("nimi"," riik","positsioon","sünd","kohort")) %>% muteeruda(bmi = keskmine kaal/(keskm.kõrgus/100)^2)


Vaatluste koguarv vähenes 6292-lt 3333-le. Kui hokimängija osales rohkem kui ühel maailmameistrivõistlustel, siis keskmistasin pikkuse ja kaalu andmed, kuna üksiku hokimängija pikkus ja (eriti) kaal võisid ajas muutuda. Mitu korda on hokimängijatel au mängida maailmameistrivõistlustel rahvusmeeskondade eest? Keskmiselt veidi vähem kui 2 korda.



R kood. Joonis 2. Hokimängijate jaotuse histogramm MM-il osalemiste arvu järgi

# maailmameistrivõistlustel osalemise sagedus keskmine(dfu$times_participated) df_part<- as.data.frame(table(dfu$times_participated)) gg_times_part <- ggplot(df_part,aes(y=Freq,x=Var1))+ geom_bar(stat="identity",fill=brbg11)+ ylab("# of players")+ xlab("times participated (out of 16 possible)")+ theme_few(base_size = 15)


Kuid on ka ainulaadseid. Vaatame, kes mängijatest osales vähemalt 10 maailmameistrivõistlustel. Selliseid mängijaid oli 14.


R kood. Tabel 1. Maailmameistrivõistlustel osalemise liidrid

# maailmameistrivõistlustel osalemise liidrid # salvestage tabel html-i liidritele<- dfu %>% filter(osalemisajad > 9) Vaata(juhid) print(xtable(leaders), type="html", file="table_leaders.html")


nimi riik positsiooni sündi kohort av.height korda_osalenud keskmine kaal bmi
1 ovechkin Aleksander EST F 1985-09-17 1985 188.45 11 98.36 27.70
2 Nielsen Daniel DEN D 1980-10-31 1980 182.27 11 79.73 24.00
3 staal kim DEN F 1978-03-10 1978 182.00 10 87.80 26.51
4 roheline morten DEN F 1981-03-19 1981 183.00 12 85.83 25.63
5 masalskis edgars LAT G 1980-03-31 1980 176.00 12 79.17 25.56
6 Ambuhl andres SUI F 1983-09-14 1983 176.80 10 83.70 26.78
7 granak dominik SVK D 1983-06-11 1983 182.00 10 79.50 24.00
8 madsen morten DEN F 1987-01-16 1987 189.82 11 86.00 23.87
9 redlihs mikelis LAT F 1984-07-01 1984 180.00 10 80.40 24.81
10 cipulis martins LAT F 1980-11-29 1980 180.70 10 82.10 25.14
11 holos joonas NOR D 1987-08-27 1987 180.18 11 91.36 28.14
12 bastiansen anders NOR F 1980-10-31 1980 190.00 11 93.64 25.94
13 küsi mortenilt NOR F 1980-05-14 1980 185.00 10 88.30 25.80
14 forsberg kristlane NOR F 1986-05-05 1986 184.50 10 87.50 25.70

Aleksander Ovechkin, 11 korda! Siinkohal tuleb aga märkida, et kõigil 16 meistrivõistlustel polnud põhimõtteliselt võimalik osaleda kõigil hokimängijatel: see sõltub sünnikohordist (kui palju mängijakarjäär ristus just selle vaatlusperioodiga), sellest, kas mängija meeskond osalenud kõigil maailmameistrivõistlustel (vt joonis 3) ja kas mängija pääses järjepidevalt rahvuskoondisse; Lõpuks on veel NHL, mis tõmbab järjekindlalt parimatest parimad maailmameistrivõistlustel osalemisest kõrvale.



R kood. Joonis 3. Rahvuskoondiste osalemine jäähoki maailmameistrivõistlustel aastatel 2001-2016

# korda osalesid riigid df_cnt_part<- df %>% select(year,country,no) %>% mute(riik=tegur(kleebi(riik))) %>% group_by(country,year) %>% summarise(value=sum(as.numeric(no))) %>% muteeruda(väärtus=1) %>% ungroup() %>% muteeruda(riik=tegur(riik, levelid = pööre(tasemed(riik))), aasta=tegur(aasta)) d_cnt_n<- df_cnt_part %>% group_by(country) %>% summarise(n=sum(value)) gg_cnt_part<- ggplot(data = df_cnt_part, aes(x=year,y=country))+ geom_point(color=brbg11,size=7)+ geom_text(data=d_cnt_n,aes(y=country,x=17.5,label=n,color=n),size=7,fontface=2)+ geom_text(data=d_cnt_n,aes(y=country,x=18.5,label=" "),size=7)+ scale_color_gradientn(colours = brbg11)+ xlab(NULL)+ ylab(NULL)+ theme_bw(base_size = 25)+ theme(legend.position="none", axis.text.x = element_text(angle = 90, hjust = 1,vjust=0.5))

Kas hokimängijad kasvavad? Regressioonanalüüs

Regressioonanalüüs võimaldab õigemini vastata küsimusele mängijate pikkuse muutuse kohta. Sel juhul ennustatakse multinomaalset lineaarset regressiooni kasutades hokimängija kasvu sõltuvalt sünnikohordist. Arvestades regressioonimudeli spetsifikatsioonis erinevaid täiendavaid (kontroll)muutujaid, saame huvitavaima koefitsiendi väärtuse "ceteris paribus". Näiteks lisades selgitavatele muutujatele lisaks sünnikohordile ka mängija positsiooni väljakul, saame kõrguse ja kohordi seose, puhastatuna positsioonist sõltuvate erinevuste mõjust; lisades kontrollmuutujatele riigid, saame tulemuse, mis on puhastatud riikidevahelistest erinevustest. Muidugi, kui kontrollmuutujad ise osutuvad oluliseks, tasub ka sellele tähelepanu pöörata.
Regressioonimudelid (eriti lineaarsed regressioonid) on kõrvalekallete suhtes väga tundlikud (vt näiteks ). Sellesse ulatuslikku teemasse süvenemata olen analüüsist eemaldanud vaid need kohordid, mille esindajaid on meil liiga vähe.


R kood. Väikeste kohortide eemaldamine

# eemalda väikeste rühmade tabel(dfu$kohort) dfuc<- dfu %>% filter(kohort<1997,cohort>1963)


Kuna ma ei tahtnud andmeid liiga palju kärpida, eemaldasin ainult 1963., 1997. ja 1998. aasta kohordid, mille jaoks on meil vähem kui 10 mängijat.


Niisiis, regressioonanalüüsi tulemused. Igas järgmises mudelis lisan ühe muutuja.
Sõltuv muutuja: hokimängija kasv.
Selgitavad muutujad: 1) sünnikohort; 2) + positsioon väljakul (võrdlus kaitsjatega); 3) + riik (võrdlus Venemaaga).


R kood. Tabel 2. Regressioonanalüüsi tulemused

# relevel country muutuja, et võrrelda Venemaaga dfuc$country<- relevel(dfuc$country,ref = "RUS") # regression models m1 <- lm(data = dfuc,av.height~cohort) m2 <- lm(data = dfuc,av.height~cohort+position) m3 <- lm(data = dfuc,av.height~cohort+position+country) # export the models to html htmlreg(list(m1,m2,m3),file = "models_height.html",single.row = T)


Statistilised mudelid
Mudel 1 Mudel 2 Mudel 3
(Katku) -10.17 (27.67) -18.64 (27.01) 32.59 (27.00)
kohort 0.10 (0.01) *** 0.10 (0.01) *** 0.08 (0.01) ***
asend F -2.59 (0.20) *** -2.59 (0.20) ***
asend G -1.96 (0.31) *** -1.93 (0.30) ***
riikAUT -0.94 (0.55)
riikBLR -0.95 (0.53)
riik CAN 1.13 (0.46) *
riikCZE 0.56 (0.49)
riikDEN -0.10 (0.56)
riikFIN 0.20 (0.50)
riikFRA -2.19 (0.69) **
riikGER -0.61 (0.51)
riikHUN -0.61 (0.86)
riikITA -3.58 (0.61) ***
riikJPN -5.24 (0.71) ***
riikKAZ -1.16 (0.57) *
riikLAT -1.38 (0.55) *
riikNOR -1.61 (0.62) **
riikPOL 0.06 (1.12)
riikSLO -1.55 (0.58) **
countrySUI -1.80 (0.53) ***
riikSVK 1.44 (0.50) **
riikSWE 1.18 (0.48) *
riikUKR -1.82 (0.59) **
riik USA 0.54 (0.45)
R2 0.01 0.06 0.13
Adj. R2 0.01 0.06 0.12
Num. obs. 3319 3319 3319
RMSE 5.40 5.27 5.10
***lk< 0.001, ** p < 0.01, * p < 0.05

Mudeli tõlgendamine

Mudel 1. Kohordi kasv ühe aasta võrra vastab hokimängijate pikkuse kasvule 0,1 cm Koefitsient on statistiliselt oluline, kuid mudel seletab vaid 1% sõltuva muutuja kõikumisest. Põhimõtteliselt pole see probleem, kuna modelleerimine on selgitava iseloomuga, ennustamise probleemi ei püstitata. Madal määramiskoefitsient viitab aga sellele, et peab olema ka teisi muutujaid, mis hokimängijate pikkuse erinevusi paremini seletavad.


Mudel 2. Kaitsjad on hoki kõige pikemad mängijad. Väravavahid on 2 cm madalamad, ründajad 2,6 cm madalamad.Kõik koefitsiendid on statistiliselt olulised. Sõltuva muutuja seletatav variatsioon tõuseb 6%-ni. Sel juhul koefitsient muutuja juures sünnikohort ei muutu.


Mudel 3. Riikide kontrollmuutujate lisamine on huvitav kahel põhjusel. Esiteks on mõned erinevused statistiliselt olulised ja omaette huvitavad. Nii et näiteks rootslased, slovakid ja kanadalased on statistiliselt oluliselt kõrgemad kui meie mängijad. Enamik rahvusi on meist palju lühemad, jaapanlased koguni 5,2 cm, itaallased - 3,6 cm, prantslased - 2,2 cm (vt ka joonis 4). Teiseks vähendab riikide kontrollmuutujate kasutuselevõtt oluliselt muutuja koefitsienti sünnikohort- kuni 0,08. See tähendab, et riikidevahelised erinevused seletavad osa sünnikohortide erinevustest. Mudeli determinatsioonikoefitsient tõuseb 13%-ni.


R kood. Joonis 4. Hokimängijate kasv riigiti


# mängija pikkus riigiti gg_av.h_country<- ggplot(dfuc ,aes(x=factor(cohort),y=av.height))+ geom_point(color="grey50",alpha=.25)+ stat_summary(aes(group=country),geom="line",fun.y = mean,size=.5,color="grey50")+ stat_smooth(aes(group=country,color=country),geom="line",size=1)+ #geom_hline(yintercept = mean(height),color="red",size=.5)+ facet_wrap(~country,ncol=4)+ coord_cartesian(ylim = c(170,195))+ scale_x_discrete(labels=paste(seq(1965,1995,10)),breaks=paste(seq(1965,1995,10)))+ theme_few(base_size = 15)+ theme(legend.position="none", panel.grid=element_line(colour = "grey75",size=.25))


Kõige täielikum mudel näitab, et hokimängijate pikkuse kasv toimub 0,08 cm aastas. See tähendab kasvu 0,8 cm kümnendi kohta ehk 2,56 cm 32 aasta jooksul aastatel 1964–1996. Pange tähele, et kui võtta arvesse kontrollmuutujaid, on hokimängijate pikkuse kasvutempo umbes poolteist korda madalam kui keskmiste väärtuste jämedama analüüsi korral (joonis 1): 0,8 cm kümnendi kohta versus umbes 1,2 cm.


Enne kui püüame lõpuks aru saada, kui oluline on kasvu kasv, tahan juhtida tähelepanu veel ühele huvitavale punktile. Kontrollmuutujate kasutuselevõtt eeldab kategooriate erinevuste fikseerimist regressioonisirge ühe kaldega (peamise selgitava muutuja jaoks üks koefitsient). See ei ole alati hea ja võib varjata olulisi erinevusi alamvalimites uuritavate muutujate seoste vahelises seoses. Nii näiteks näitab mängijate pikkuse rollist sõltuvuse eraldi modelleerimine (joonis 5), et suhe on kõige tugevam väravavahtide puhul ja kõige vähem märgatav kaitsjate puhul.




R kood. Joonis 5. Kõrguse ja kohordi vaheline korrelatsioon eraldi kaitsjate, ründajate ja väravavahtide puhul

dfuc_pos<- dfuc levels(dfuc_pos$position) <- c("Defenders","Forwards","Goalkeeprs") gg_pos <- ggplot(dfuc_pos ,aes(x=cohort,y=av.height))+ geom_jitter(aes(color=position),alpha=.5)+ stat_smooth(method = "lm", se = T,color=brbg11,size=1)+ scale_x_continuous(labels=seq(1965,1995,5),breaks=seq(1965,1995,5))+ scale_color_manual(values = brbg11)+ facet_wrap(~position,ncol=3)+ xlab("birth cohort")+ ylab("height, cm")+ theme_few(base_size = 20)+ theme(legend.position="none", panel.grid=element_line(colour = "grey75",size=.25))


R kood. Tabel 3. Mudel 3 eraldi kaitsjate, ründajate ja väravavahtide alamnäidiste jaoks

# eraldi mudelid positsioonide m3d jaoks<- lm(data = dfuc %>% filter(positsioon=="D"),keskm.kõrgus~kohort+riik) m3f<- lm(data = dfuc %>% filter(positsioon=="F"),keskm.kõrgus~kohort+riik) m3g<- lm(data = dfuc %>% filter(position=="G"),av.height~kohort+riik) htmlreg(loend(m3d,m3f,m3g),file = "2016/160500 Hokimängijad/models_height_pos.html",single.row = T, custom.model.names = c("mudel 3 D", "mudel 3 F", "mudel 3 G"))


Statistilised mudelid
Mudel 3D Mudel 3F Mudel 3G
(Katku) 108.45 (46.46) * 49.32 (36.73) -295.76 (74.61) ***
kohort 0.04 (0.02) 0.07 (0.02) *** 0.24 (0.04) ***
riikAUT 0.14 (0.96) -2.01 (0.75) ** 0.47 (1.47)
riikBLR 0.30 (0.87) -1.53 (0.73) * -2.73 (1.55)
riik CAN 1.55 (0.78) * 0.39 (0.62) 3.45 (1.26) **
riikCZE 0.87 (0.84) 0.30 (0.67) 0.63 (1.36)
riikDEN -0.60 (0.95) 0.10 (0.75) -0.19 (1.62)
riikFIN -0.55 (0.89) -0.04 (0.67) 2.40 (1.32)
riikFRA -3.34 (1.15) ** -2.06 (0.93) * 1.39 (2.07)
riikGER 0.48 (0.85) -1.40 (0.72) -0.65 (1.33)
riikHUN -1.32 (1.47) -0.70 (1.16) 0.65 (2.39)
riikITA -2.08 (1.08) -4.78 (0.82) *** -2.02 (1.62)
riikJPN -4.13 (1.26) ** -6.52 (0.94) *** -2.27 (1.98)
riikKAZ -1.23 (0.95) -1.82 (0.79) * 1.79 (1.58)
riikLAT -0.73 (0.95) -1.39 (0.75) -3.42 (1.49) *
riikNOR -3.25 (1.07) ** -1.06 (0.85) -0.10 (1.66)
riikPOL 0.82 (1.89) -0.58 (1.55) 0.37 (2.97)
riikSLO -1.57 (0.99) -1.54 (0.79) -2.25 (1.66)
countrySUI -1.98 (0.91) * -2.36 (0.71) *** 1.12 (1.47)
riikSVK 2.94 (0.87) *** 0.81 (0.67) -0.70 (1.50)
riikSWE 0.75 (0.81) 1.24 (0.65) 1.37 (1.33)
riikUKR -1.37 (1.01) -1.77 (0.80) * -3.71 (1.66) *
riik USA 0.76 (0.78) -0.08 (0.62) 2.58 (1.26) *
R2 0.09 0.10 0.24
Adj. R2 0.07 0.09 0.20
Num. obs. 1094 1824 401
RMSE 5.08 5.08 4.87
***lk< 0.001, ** p < 0.01, * p < 0.05

Eraldi modelleerimine näitab, et 1964-1996 sündinud kohortides kasvas aastatel 2001-2016 maailmameistrivõistlustel osalenud hokimängijate keskmine pikkus kaitsjatel 0,4 cm, ründajatel 0,7 cm ja (!) 2,4. cm väravavahtidele. Kolme aastakümne jooksul on väravavahtide keskmine pikkus kasvanud 7 cm!


On aeg võrrelda neid muutusi rahvastiku keskmiste näitajatega.

Rahvastiku võrdlus

Regressioonanalüüsi tulemused fikseerivad olulisi riikidevahelisi erinevusi. Seetõttu on mõttekas võrrelda riigiti: teatud riigi hokimängijaid sama riigi meessoost elanikkonnaga.


Hokimängijate kasvu võrdlemiseks keskmise meespopulatsiooniga kasutasin vastavasisulise teadusartikli (PDF) andmeid. Kopeerisin artikli andmed (kasutades imelist tabula programmi) ja postitasin ka avalikku omandisse.


R kood. Hatton, T. J. ja Bray, B. E. (2010) andmete laadimine ja analüüsiks ettevalmistamine

# laadige alla andmed Hatton, T. J. ja Bray, B. E. (2010). # Pikaajalised trendid Euroopa meeste kõrgustes, 19.–20. # Economics & Human Biology, 8(3), 405–413. # http://doi.org/10.1016/j.ehb.2010.03.001 # stabiilne URL, kopeeritud andmed (https://dx.doi.org/10.6084/m9.figshare.3394795.v1) df_hb<- read.csv("https://ndownloader.figshare.com/files/5303878") df_hb <- df_hb %>% koguda("riik","h_pop",2:16) %>% muteeruda(periood=kleebi(periood)) %>% separat(periood,c("t1","t2"),sept = "/" )%>% transmute(kohort=(as.numeric(t1)+as.numeric(t2))/2,country,h_pop) # arvutage hokimängijate" kohordi pikkuse keskmised iga riigi kohta df_hoc<- dfu %>% group_by(country,cohort) %>% summarise(h_hp=mean(av.height)) %>% ungroup()


Kahjuks kattuvad andmed rahvastiku kasvu dünaamika kohta ainult 8 riigiga minu hokiandmestikust: Austria, Taani, Soome, Prantsusmaa, Saksamaa, Itaalia, Norra, Rootsi.


R kood. Kattuvad andmed

# riiki mõlemas andmekogumis both_cnt<- levels(factor(df_hb$country)) both_cnt




R kood. Joonis 6. Meesrahvastiku ja hokimängijate kasvudünaamika võrdlus. Märkus: roheline värv - meessoost populatsioon; pruun värv - hokimängijad.

gg_hoc_vs_pop<- ggplot()+ geom_path(data = df_hb %>% filter(riik %in% mõlemad_cnt), aes(x=kohort,y=h_pop), color=brbg11,size=1)+ geom_point(andmed = df_hb %>% filter(riik %in% mõlemad_cnt), aes(x =kohort,y=h_pop), color=brbg11,size=2)+ geom_point(andmed = df_hb %>% filter(riik %in% both_cnt), aes(x=kohort,y=h_pop), color="valge" ,size=1.5)+ geom_point(andmed = df_hoc %>% filter(riik %in% mõlemad_cnt), aes(x=kohort,y=h_hp), color=brbg11,size=2,pch=18)+ stat_smooth(data = df_hoc %>% filter(riik %in% mõlemad_cnt), aes(x=kohort,y=h_hp), method="lm",se=F,color=brbg11,size=1)+ facet_wrap(~country,ncol =2)+ ylab("kõrgus, cm")+ xlab("sünnikohort")+ teema_paar(base_suurus = 15)+ teema(paneel.ruudustik=element_line(värv = "hall75",suurus=.25))


Kõigis analüüsitud riikides on hokimängijad statistilistest meestest 2-5 cm pikemad, kuid see pole üllatav - spordialadel on valik märkimisväärne.
Tähelepanu väärib veel midagi. Maailma arenenud riikides toimus meessoost rahvastiku kasvu eriti kiire kasv 20. sajandi esimesel keskpaigal. Umbes 1960. aastatel sündinud kohortide puhul lähenes meeste kasv platoole ja lakkas kiiremast kasvust. Hokimängijate keskmise pikkuse trend kõikides riikides (välja arvatud millegipärast Taanis) näis jätkavat kogu meespopulatsiooni peatatud pikaajalist trendi.
20. sajandi esimesel poolel sündinud eurooplaste kohortide puhul jäi keskmise pikkuse kasvutempo vahemikku 1,18–1,74 cm kümnendi kohta, olenevalt riigist (joonis 7). Alates 1960. aastatest on see näitaja 10 aastaga langenud 0,15-0,80 tasemele.

Zdeno sündis 18. märtsil 1977 Tšehhoslovakkias Trencinis. Ta mängib Boston Bruinsi hokiklubis ja on selle kapten. Mängib klubis alates 1. juulist 1996. Tal on kaitsja roll. Ta on mitmekordne NHL-i tähtede mängija. 2009. aastal sai ta James Norrise trofee, mis antakse NHL-i hooaja parimale kaitsjale. 2011. aastal sai temast koos teiste klubi liikmetega Stanley karika omanik.

Lisaks on Hara NHL-i tugevaima viske omanik. Tema rekord on 175 km/h. 25. märtsil 2012 pidas hokimängija oma tuhandenda kohtumise rahvaliigas. Koos Slovakkia koondisega võitis ta 2000. ja 2012. aasta maailmameistrivõistlustel hõbemedalid. Hara räägib selliseid keeli nagu slovaki, vene, inglise, tšehhi, saksa, rootsi ja poola keel.

Vassili Košechkin

Vassili sündis 27. märtsil 1983 Toljatis. Ta on lõpetanud hokiklubi Lada. Profikarjääri alustas ta 2002. aastal. Ta mängis hokiklubides Ak Bars ja Severstal. Alates 1. maist 2013 mängib ta Magnitogorski Metallurgis. Leping sõlmiti 4 aastaks. Košechkin on väravavaht.

Vassili osales viiel maailmameistrivõistlusel ja temast sai igat tüüpi meistrivõistluste medalite omanik. Ta võitis oma klubiga 2006. ja 2008. aastal kontinentaalkarika. Ja 2014. aastal võitis ta koos teiste Metallurg hokimängijatega Gagarini karika. Tal on sellised tiitlid ja auhinnad nagu rahvusvahelise klassi austatud meister, Venemaa spordimeister ja Vene Föderatsiooni presidendi tänu.

Üldine informatsioon

Hoki on spordiala, kus kaks võistkonda püüavad keppide abil vastast litriga või palliga lüüa. Jäähokit on mitut tüüpi: litter, pall, muru, kelguhoki ja saalihoki.

NHL on rahvuslik hokiliiga, mis ühendab Kanada ja Ameerika Ühendriikide klubisid. Liiga asutati 1917. aastal. NHL-i peamine trofee on Stanley karikas. Liigas on kolmkümmend meeskonda 29 linnast Kanadas ja Ameerika Ühendriikides.

KHL on kontinentaalne jäähokiliiga, milles mängivad Venemaa, Kasahstani, Slovakkia, Soome, Valgevene, Horvaatia ja Läti klubid. Hooajal 2014-2015 mängib KHL-is 28 klubi 27 linnast. Tulevikus plaanitakse liigat laiendada 32 meeskonnani. Esimesed meistrivõistlused peeti 2008. aastal. Liiga karikas on Gagarini karikas. Kaasani Ak Barsist sai selle esimene omanik. KHL lahkus rahaliste raskuste tõttu Praha hokiklubist "Lev", Ukraina "Donbassist" ja Moskva "Spartakist".




Ühel neist päevadest on lõppenud järjekordsed hoki maailmameistrivõistlused.


Idee sündis matše vaadates. Kui telekaamera näitab pauside ajal mängijaid riietusruumi astumas, on raske mitte märgata, kui suured nad on. Treenerite, meeskonnafunktsionääride, jääareeni töötajate, ajakirjanike või lihtsalt fännide taustal näevad nad tavaliselt väga efektsed välja.



Ja ma esitasin küsimusi. Kas hokimängijad on tõesti tavainimestest pikemad? Kuidas muutub hokimängijate pikkus ajas võrreldes tavainimestega? Kas riikidevahelised erinevused on püsivad?

Andmed

Jäähoki maailmameistrivõistlusi korraldav organisatsioon IIHF avaldab igal aastal osalevate meeskondade koosseisud koos teabega iga mängija pikkuse ja kaalu kohta. Arhiveeri need andmed.


Olen kokku pannud kõikide maailmameistrivõistluste andmed aastatel 2001–2016. Aasta-aastalt on esitatavate andmete vorming veidi erinev, mille puhastamine nõuab teatavat pingutust. Ei mõistnud, kuidas protsessi õigesti automatiseerida, kopeerisin kõik andmed käsitsi, mis võttis aega veidi rohkem kui 3 tundi. Ühendatud andmestik on avalikustatud.


# laadige nõutud paketid nõuda(dplyr) # andmete manipuleerimine nõuda(määrida) # lihtsad manipulatsioonid kuupäevadega nõuavad(ggplot2) # visualiseerimine nõuavad(ggthemes) # ggplot2 teemad nõuavad(cowplot) # ggplots'i kena joondus request(RColorBrewer) # genereerida värvipaletid nõuavad (texreg) # regressioonitabelite lihtne eksport nõuda(xtable) # eksportida andmeraami html-tabelisse # laadige alla IIHF-i andmekogum; probleemide korral saate # käsitsi alla laadida, kasutades stabiilset URL-i (https://dx.doi.org/10.6084/m9.figshare.3394735.v2) df<- read.csv("https://ndownloader.figshare.com/files/5303173") # color palette brbg11 <- brewer.pal(11,"BrBG")

Kas hokimängijad kasvavad? Jäme (perioodiline) võrdlus

Alustuseks võrdleme kõigi 16 maailmameistrivõistluste mängijate keskmist pikkust.



R kood. Joonis 1. Hokimängijate keskmise pikkuse muutus maailmameistrivõistlustel, 2001-2016

# meistrivõistluste keskmine pikkus df_per<- df %>% group_by(year) %>% summarise(height=mean(height)) gg_period_mean<- ggplot(df_per, aes(x=year,y=height))+ geom_point(size=3,color=brbg11)+ stat_smooth(method="lm",size=1,color=brbg11)+ ylab("height, cm")+ xlab("year of competition")+ scale_x_continuous(breaks=seq(2005,2015,5),labels=seq(2005,2015,5))+ theme_few(base_size = 15)+ theme(panel.grid=element_line(colour = "grey75",size=.25)) gg_period_jitter <- ggplot(df, aes(x=year,y=height))+ geom_jitter(size=2,color=brbg11,alpha=.25,width = .75)+ stat_smooth(method="lm",size=1,se=F,color=brbg11)+ ylab("height, cm")+ xlab("year of competition")+ scale_x_continuous(breaks=seq(2005,2015,5),labels=seq(2005,2015,5))+ theme_few(base_size = 15)+ theme(panel.grid=element_line(colour = "grey75",size=.25)) gg_period <- plot_grid(gg_period_mean,gg_period_jitter)


Positiivne trend on ilmne. Pooleteise aastakümnega on hokimängija keskmine pikkus MMil kasvanud ligi 2 sentimeetrit (vasak paneel). Tundub kerge tõus üsna suure variatsiooni taustal (parem paneel). Kas seda on palju või vähe? Küsimusele vastamiseks on vaja õigesti võrrelda rahvastikuga (aga sellest lähemalt artikli lõpus).

Kohordi analüüs

Täpsem viis pikkuse muutuse uurimiseks on võrrelda sünnikohordi järgi. Siin seisame silmitsi kurioosse nüansiga – mõni hokimängija osales rohkem kui ühel maailmameistrivõistlustel. K: Kas ma peaksin puhastama samade inimeste topeltkirjeid? Kui meid huvitab hokimängija keskmine pikkus meistriliigas (nagu ülaloleval pildil), siis pole ilmselt mõtet selgeks teha. Aga kui tahame jälgida hokimängijate kasvu muutust kui sellist, siis minu arvates oleks vale panna rohkem kaalu neile mängijatele, kes regulaarselt maailmameistrivõistlustele pääsesid. Seetõttu puhastasin edasiseks analüüsiks andmed samade mängijate korduvatest sisestustest.


R kood. Andmete ettevalmistamine kohordianalüüsiks

# eemalda topeltloendused dfu_h<- df %>% vali(aasta,nimi,riik,positsioon,sünd,kohort,pikkus) %>% spread(year,height) dfu_h$av.height<- apply(dfu_h[,6:21],1,mean,na.rm=T) dfu_h$times_participated <- apply(!is.na(dfu_h[,6:21]),1,sum) dfu_w <- df %>% vali(aasta,nimi,riik,positsioon,sünd,kohort,kaal) %>% levi(aasta,kaal) dfu_w$av.weight<- apply(dfu_w[,6:21],1,mean,na.rm=T) dfu <- left_join(dfu_h %>% select(nimi,riik,positsioon,sünd,kohort,keskm.kõrgus,osalemisajad), dfu_w %>% select(nimi,riik,positsioon,sünd,kohort,keskm.kaal), by = c("nimi"," riik","positsioon","sünd","kohort")) %>% muteeruda(bmi = keskmine kaal/(keskm.kõrgus/100)^2)


Vaatluste koguarv vähenes 6292-lt 3333-le. Kui hokimängija osales rohkem kui ühel maailmameistrivõistlustel, siis keskmistasin pikkuse ja kaalu andmed, kuna üksiku hokimängija pikkus ja (eriti) kaal võisid ajas muutuda. Mitu korda on hokimängijatel au mängida maailmameistrivõistlustel rahvusmeeskondade eest? Keskmiselt veidi vähem kui 2 korda.



R kood. Joonis 2. Hokimängijate jaotuse histogramm MM-il osalemiste arvu järgi

# maailmameistrivõistlustel osalemise sagedus keskmine(dfu$times_participated) df_part<- as.data.frame(table(dfu$times_participated)) gg_times_part <- ggplot(df_part,aes(y=Freq,x=Var1))+ geom_bar(stat="identity",fill=brbg11)+ ylab("# of players")+ xlab("times participated (out of 16 possible)")+ theme_few(base_size = 15)


Kuid on ka ainulaadseid. Vaatame, kes mängijatest osales vähemalt 10 maailmameistrivõistlustel. Selliseid mängijaid oli 14.


R kood. Tabel 1. Maailmameistrivõistlustel osalemise liidrid

# maailmameistrivõistlustel osalemise liidrid # salvestage tabel html-i liidritele<- dfu %>% filter(osalemisajad > 9) Vaata(juhid) print(xtable(leaders), type="html", file="table_leaders.html")


nimi riik positsiooni sündi kohort av.height korda_osalenud keskmine kaal bmi
1 ovechkin Aleksander EST F 1985-09-17 1985 188.45 11 98.36 27.70
2 Nielsen Daniel DEN D 1980-10-31 1980 182.27 11 79.73 24.00
3 staal kim DEN F 1978-03-10 1978 182.00 10 87.80 26.51
4 roheline morten DEN F 1981-03-19 1981 183.00 12 85.83 25.63
5 masalskis edgars LAT G 1980-03-31 1980 176.00 12 79.17 25.56
6 Ambuhl andres SUI F 1983-09-14 1983 176.80 10 83.70 26.78
7 granak dominik SVK D 1983-06-11 1983 182.00 10 79.50 24.00
8 madsen morten DEN F 1987-01-16 1987 189.82 11 86.00 23.87
9 redlihs mikelis LAT F 1984-07-01 1984 180.00 10 80.40 24.81
10 cipulis martins LAT F 1980-11-29 1980 180.70 10 82.10 25.14
11 holos joonas NOR D 1987-08-27 1987 180.18 11 91.36 28.14
12 bastiansen anders NOR F 1980-10-31 1980 190.00 11 93.64 25.94
13 küsi mortenilt NOR F 1980-05-14 1980 185.00 10 88.30 25.80
14 forsberg kristlane NOR F 1986-05-05 1986 184.50 10 87.50 25.70

Aleksander Ovechkin, 11 korda! Siinkohal tuleb aga märkida, et kõigil 16 meistrivõistlustel polnud põhimõtteliselt võimalik osaleda kõigil hokimängijatel: see sõltub sünnikohordist (kui palju mängijakarjäär ristus just selle vaatlusperioodiga), sellest, kas mängija meeskond osalenud kõigil maailmameistrivõistlustel (vt joonis 3) ja kas mängija pääses järjepidevalt rahvuskoondisse; Lõpuks on veel NHL, mis tõmbab järjekindlalt parimatest parimad maailmameistrivõistlustel osalemisest kõrvale.



R kood. Joonis 3. Rahvuskoondiste osalemine jäähoki maailmameistrivõistlustel aastatel 2001-2016

# korda osalesid riigid df_cnt_part<- df %>% select(year,country,no) %>% mute(riik=tegur(kleebi(riik))) %>% group_by(country,year) %>% summarise(value=sum(as.numeric(no))) %>% muteeruda(väärtus=1) %>% ungroup() %>% muteeruda(riik=tegur(riik, levelid = pööre(tasemed(riik))), aasta=tegur(aasta)) d_cnt_n<- df_cnt_part %>% group_by(country) %>% summarise(n=sum(value)) gg_cnt_part<- ggplot(data = df_cnt_part, aes(x=year,y=country))+ geom_point(color=brbg11,size=7)+ geom_text(data=d_cnt_n,aes(y=country,x=17.5,label=n,color=n),size=7,fontface=2)+ geom_text(data=d_cnt_n,aes(y=country,x=18.5,label=" "),size=7)+ scale_color_gradientn(colours = brbg11)+ xlab(NULL)+ ylab(NULL)+ theme_bw(base_size = 25)+ theme(legend.position="none", axis.text.x = element_text(angle = 90, hjust = 1,vjust=0.5))

Kas hokimängijad kasvavad? Regressioonanalüüs

Regressioonanalüüs võimaldab õigemini vastata küsimusele mängijate pikkuse muutuse kohta. Sel juhul ennustatakse multinomaalset lineaarset regressiooni kasutades hokimängija kasvu sõltuvalt sünnikohordist. Arvestades regressioonimudeli spetsifikatsioonis erinevaid täiendavaid (kontroll)muutujaid, saame huvitavaima koefitsiendi väärtuse "ceteris paribus". Näiteks lisades selgitavatele muutujatele lisaks sünnikohordile ka mängija positsiooni väljakul, saame kõrguse ja kohordi seose, puhastatuna positsioonist sõltuvate erinevuste mõjust; lisades kontrollmuutujatele riigid, saame tulemuse, mis on puhastatud riikidevahelistest erinevustest. Muidugi, kui kontrollmuutujad ise osutuvad oluliseks, tasub ka sellele tähelepanu pöörata.
Regressioonimudelid (eriti lineaarsed regressioonid) on kõrvalekallete suhtes väga tundlikud (vt näiteks ). Sellesse ulatuslikku teemasse süvenemata olen analüüsist eemaldanud vaid need kohordid, mille esindajaid on meil liiga vähe.


R kood. Väikeste kohortide eemaldamine

# eemalda väikeste rühmade tabel(dfu$kohort) dfuc<- dfu %>% filter(kohort<1997,cohort>1963)


Kuna ma ei tahtnud andmeid liiga palju kärpida, eemaldasin ainult 1963., 1997. ja 1998. aasta kohordid, mille jaoks on meil vähem kui 10 mängijat.


Niisiis, regressioonanalüüsi tulemused. Igas järgmises mudelis lisan ühe muutuja.
Sõltuv muutuja: hokimängija kasv.
Selgitavad muutujad: 1) sünnikohort; 2) + positsioon väljakul (võrdlus kaitsjatega); 3) + riik (võrdlus Venemaaga).


R kood. Tabel 2. Regressioonanalüüsi tulemused

# relevel country muutuja, et võrrelda Venemaaga dfuc$country<- relevel(dfuc$country,ref = "RUS") # regression models m1 <- lm(data = dfuc,av.height~cohort) m2 <- lm(data = dfuc,av.height~cohort+position) m3 <- lm(data = dfuc,av.height~cohort+position+country) # export the models to html htmlreg(list(m1,m2,m3),file = "models_height.html",single.row = T)


Statistilised mudelid
Mudel 1 Mudel 2 Mudel 3
(Katku) -10.17 (27.67) -18.64 (27.01) 32.59 (27.00)
kohort 0.10 (0.01) *** 0.10 (0.01) *** 0.08 (0.01) ***
asend F -2.59 (0.20) *** -2.59 (0.20) ***
asend G -1.96 (0.31) *** -1.93 (0.30) ***
riikAUT -0.94 (0.55)
riikBLR -0.95 (0.53)
riik CAN 1.13 (0.46) *
riikCZE 0.56 (0.49)
riikDEN -0.10 (0.56)
riikFIN 0.20 (0.50)
riikFRA -2.19 (0.69) **
riikGER -0.61 (0.51)
riikHUN -0.61 (0.86)
riikITA -3.58 (0.61) ***
riikJPN -5.24 (0.71) ***
riikKAZ -1.16 (0.57) *
riikLAT -1.38 (0.55) *
riikNOR -1.61 (0.62) **
riikPOL 0.06 (1.12)
riikSLO -1.55 (0.58) **
countrySUI -1.80 (0.53) ***
riikSVK 1.44 (0.50) **
riikSWE 1.18 (0.48) *
riikUKR -1.82 (0.59) **
riik USA 0.54 (0.45)
R2 0.01 0.06 0.13
Adj. R2 0.01 0.06 0.12
Num. obs. 3319 3319 3319
RMSE 5.40 5.27 5.10
***lk< 0.001, ** p < 0.01, * p < 0.05

Mudeli tõlgendamine

Mudel 1. Kohordi kasv ühe aasta võrra vastab hokimängijate pikkuse kasvule 0,1 cm Koefitsient on statistiliselt oluline, kuid mudel seletab vaid 1% sõltuva muutuja kõikumisest. Põhimõtteliselt pole see probleem, kuna modelleerimine on selgitava iseloomuga, ennustamise probleemi ei püstitata. Madal määramiskoefitsient viitab aga sellele, et peab olema ka teisi muutujaid, mis hokimängijate pikkuse erinevusi paremini seletavad.


Mudel 2. Kaitsjad on hoki kõige pikemad mängijad. Väravavahid on 2 cm madalamad, ründajad 2,6 cm madalamad.Kõik koefitsiendid on statistiliselt olulised. Sõltuva muutuja seletatav variatsioon tõuseb 6%-ni. Sel juhul koefitsient muutuja juures sünnikohort ei muutu.


Mudel 3. Riikide kontrollmuutujate lisamine on huvitav kahel põhjusel. Esiteks on mõned erinevused statistiliselt olulised ja omaette huvitavad. Nii et näiteks rootslased, slovakid ja kanadalased on statistiliselt oluliselt kõrgemad kui meie mängijad. Enamik rahvusi on meist palju lühemad, jaapanlased koguni 5,2 cm, itaallased - 3,6 cm, prantslased - 2,2 cm (vt ka joonis 4). Teiseks vähendab riikide kontrollmuutujate kasutuselevõtt oluliselt muutuja koefitsienti sünnikohort- kuni 0,08. See tähendab, et riikidevahelised erinevused seletavad osa sünnikohortide erinevustest. Mudeli determinatsioonikoefitsient tõuseb 13%-ni.


R kood. Joonis 4. Hokimängijate kasv riigiti


# mängija pikkus riigiti gg_av.h_country<- ggplot(dfuc ,aes(x=factor(cohort),y=av.height))+ geom_point(color="grey50",alpha=.25)+ stat_summary(aes(group=country),geom="line",fun.y = mean,size=.5,color="grey50")+ stat_smooth(aes(group=country,color=country),geom="line",size=1)+ #geom_hline(yintercept = mean(height),color="red",size=.5)+ facet_wrap(~country,ncol=4)+ coord_cartesian(ylim = c(170,195))+ scale_x_discrete(labels=paste(seq(1965,1995,10)),breaks=paste(seq(1965,1995,10)))+ theme_few(base_size = 15)+ theme(legend.position="none", panel.grid=element_line(colour = "grey75",size=.25))


Kõige täielikum mudel näitab, et hokimängijate pikkuse kasv toimub 0,08 cm aastas. See tähendab kasvu 0,8 cm kümnendi kohta ehk 2,56 cm 32 aasta jooksul aastatel 1964–1996. Pange tähele, et kui võtta arvesse kontrollmuutujaid, on hokimängijate pikkuse kasvutempo umbes poolteist korda madalam kui keskmiste väärtuste jämedama analüüsi korral (joonis 1): 0,8 cm kümnendi kohta versus umbes 1,2 cm.


Enne kui püüame lõpuks aru saada, kui oluline on kasvu kasv, tahan juhtida tähelepanu veel ühele huvitavale punktile. Kontrollmuutujate kasutuselevõtt eeldab kategooriate erinevuste fikseerimist regressioonisirge ühe kaldega (peamise selgitava muutuja jaoks üks koefitsient). See ei ole alati hea ja võib varjata olulisi erinevusi alamvalimites uuritavate muutujate seoste vahelises seoses. Nii näiteks näitab mängijate pikkuse rollist sõltuvuse eraldi modelleerimine (joonis 5), et suhe on kõige tugevam väravavahtide puhul ja kõige vähem märgatav kaitsjate puhul.




R kood. Joonis 5. Kõrguse ja kohordi vaheline korrelatsioon eraldi kaitsjate, ründajate ja väravavahtide puhul

dfuc_pos<- dfuc levels(dfuc_pos$position) <- c("Defenders","Forwards","Goalkeeprs") gg_pos <- ggplot(dfuc_pos ,aes(x=cohort,y=av.height))+ geom_jitter(aes(color=position),alpha=.5)+ stat_smooth(method = "lm", se = T,color=brbg11,size=1)+ scale_x_continuous(labels=seq(1965,1995,5),breaks=seq(1965,1995,5))+ scale_color_manual(values = brbg11)+ facet_wrap(~position,ncol=3)+ xlab("birth cohort")+ ylab("height, cm")+ theme_few(base_size = 20)+ theme(legend.position="none", panel.grid=element_line(colour = "grey75",size=.25))


R kood. Tabel 3. Mudel 3 eraldi kaitsjate, ründajate ja väravavahtide alamnäidiste jaoks

# eraldi mudelid positsioonide m3d jaoks<- lm(data = dfuc %>% filter(positsioon=="D"),keskm.kõrgus~kohort+riik) m3f<- lm(data = dfuc %>% filter(positsioon=="F"),keskm.kõrgus~kohort+riik) m3g<- lm(data = dfuc %>% filter(position=="G"),av.height~kohort+riik) htmlreg(loend(m3d,m3f,m3g),file = "2016/160500 Hokimängijad/models_height_pos.html",single.row = T, custom.model.names = c("mudel 3 D", "mudel 3 F", "mudel 3 G"))


Statistilised mudelid
Mudel 3D Mudel 3F Mudel 3G
(Katku) 108.45 (46.46) * 49.32 (36.73) -295.76 (74.61) ***
kohort 0.04 (0.02) 0.07 (0.02) *** 0.24 (0.04) ***
riikAUT 0.14 (0.96) -2.01 (0.75) ** 0.47 (1.47)
riikBLR 0.30 (0.87) -1.53 (0.73) * -2.73 (1.55)
riik CAN 1.55 (0.78) * 0.39 (0.62) 3.45 (1.26) **
riikCZE 0.87 (0.84) 0.30 (0.67) 0.63 (1.36)
riikDEN -0.60 (0.95) 0.10 (0.75) -0.19 (1.62)
riikFIN -0.55 (0.89) -0.04 (0.67) 2.40 (1.32)
riikFRA -3.34 (1.15) ** -2.06 (0.93) * 1.39 (2.07)
riikGER 0.48 (0.85) -1.40 (0.72) -0.65 (1.33)
riikHUN -1.32 (1.47) -0.70 (1.16) 0.65 (2.39)
riikITA -2.08 (1.08) -4.78 (0.82) *** -2.02 (1.62)
riikJPN -4.13 (1.26) ** -6.52 (0.94) *** -2.27 (1.98)
riikKAZ -1.23 (0.95) -1.82 (0.79) * 1.79 (1.58)
riikLAT -0.73 (0.95) -1.39 (0.75) -3.42 (1.49) *
riikNOR -3.25 (1.07) ** -1.06 (0.85) -0.10 (1.66)
riikPOL 0.82 (1.89) -0.58 (1.55) 0.37 (2.97)
riikSLO -1.57 (0.99) -1.54 (0.79) -2.25 (1.66)
countrySUI -1.98 (0.91) * -2.36 (0.71) *** 1.12 (1.47)
riikSVK 2.94 (0.87) *** 0.81 (0.67) -0.70 (1.50)
riikSWE 0.75 (0.81) 1.24 (0.65) 1.37 (1.33)
riikUKR -1.37 (1.01) -1.77 (0.80) * -3.71 (1.66) *
riik USA 0.76 (0.78) -0.08 (0.62) 2.58 (1.26) *
R2 0.09 0.10 0.24
Adj. R2 0.07 0.09 0.20
Num. obs. 1094 1824 401
RMSE 5.08 5.08 4.87
***lk< 0.001, ** p < 0.01, * p < 0.05

Eraldi modelleerimine näitab, et 1964-1996 sündinud kohortides kasvas aastatel 2001-2016 maailmameistrivõistlustel osalenud hokimängijate keskmine pikkus kaitsjatel 0,4 cm, ründajatel 0,7 cm ja (!) 2,4. cm väravavahtidele. Kolme aastakümne jooksul on väravavahtide keskmine pikkus kasvanud 7 cm!


On aeg võrrelda neid muutusi rahvastiku keskmiste näitajatega.

Rahvastiku võrdlus

Regressioonanalüüsi tulemused fikseerivad olulisi riikidevahelisi erinevusi. Seetõttu on mõttekas võrrelda riigiti: teatud riigi hokimängijaid sama riigi meessoost elanikkonnaga.


Hokimängijate kasvu võrdlemiseks keskmise meespopulatsiooniga kasutasin vastavasisulise teadusartikli (PDF) andmeid. Kopeerisin artikli andmed (kasutades imelist tabula programmi) ja postitasin ka avalikku omandisse.


R kood. Hatton, T. J. ja Bray, B. E. (2010) andmete laadimine ja analüüsiks ettevalmistamine

# laadige alla andmed Hatton, T. J. ja Bray, B. E. (2010). # Pikaajalised trendid Euroopa meeste kõrgustes, 19.–20. # Economics & Human Biology, 8(3), 405–413. # http://doi.org/10.1016/j.ehb.2010.03.001 # stabiilne URL, kopeeritud andmed (https://dx.doi.org/10.6084/m9.figshare.3394795.v1) df_hb<- read.csv("https://ndownloader.figshare.com/files/5303878") df_hb <- df_hb %>% koguda("riik","h_pop",2:16) %>% muteeruda(periood=kleebi(periood)) %>% separat(periood,c("t1","t2"),sept = "/" )%>% transmute(kohort=(as.numeric(t1)+as.numeric(t2))/2,country,h_pop) # arvutage hokimängijate" kohordi pikkuse keskmised iga riigi kohta df_hoc<- dfu %>% group_by(country,cohort) %>% summarise(h_hp=mean(av.height)) %>% ungroup()


Kahjuks kattuvad andmed rahvastiku kasvu dünaamika kohta ainult 8 riigiga minu hokiandmestikust: Austria, Taani, Soome, Prantsusmaa, Saksamaa, Itaalia, Norra, Rootsi.


R kood. Kattuvad andmed

# riiki mõlemas andmekogumis both_cnt<- levels(factor(df_hb$country)) both_cnt




R kood. Joonis 6. Meesrahvastiku ja hokimängijate kasvudünaamika võrdlus. Märkus: roheline värv - meessoost populatsioon; pruun värv - hokimängijad.

gg_hoc_vs_pop<- ggplot()+ geom_path(data = df_hb %>% filter(riik %in% mõlemad_cnt), aes(x=kohort,y=h_pop), color=brbg11,size=1)+ geom_point(andmed = df_hb %>% filter(riik %in% mõlemad_cnt), aes(x =kohort,y=h_pop), color=brbg11,size=2)+ geom_point(andmed = df_hb %>% filter(riik %in% both_cnt), aes(x=kohort,y=h_pop), color="valge" ,size=1.5)+ geom_point(andmed = df_hoc %>% filter(riik %in% mõlemad_cnt), aes(x=kohort,y=h_hp), color=brbg11,size=2,pch=18)+ stat_smooth(data = df_hoc %>% filter(riik %in% mõlemad_cnt), aes(x=kohort,y=h_hp), method="lm",se=F,color=brbg11,size=1)+ facet_wrap(~country,ncol =2)+ ylab("kõrgus, cm")+ xlab("sünnikohort")+ teema_paar(base_suurus = 15)+ teema(paneel.ruudustik=element_line(värv = "hall75",suurus=.25))


Kõigis analüüsitud riikides on hokimängijad statistilistest meestest 2-5 cm pikemad, kuid see pole üllatav - spordialadel on valik märkimisväärne.
Tähelepanu väärib veel midagi. Maailma arenenud riikides toimus meessoost rahvastiku kasvu eriti kiire kasv 20. sajandi esimesel keskpaigal. Umbes 1960. aastatel sündinud kohortide puhul lähenes meeste kasv platoole ja lakkas kiiremast kasvust. Hokimängijate keskmise pikkuse trend kõikides riikides (välja arvatud millegipärast Taanis) näis jätkavat kogu meespopulatsiooni peatatud pikaajalist trendi.
20. sajandi esimesel poolel sündinud eurooplaste kohortide puhul jäi keskmise pikkuse kasvutempo vahemikku 1,18–1,74 cm kümnendi kohta, olenevalt riigist (joonis 7). Alates 1960. aastatest on see näitaja 10 aastaga langenud 0,15-0,80 tasemele.

Kas meeldis artikkel? Jaga sõpradega!
Kas see artikkel oli abistav?
Jah
Mitte
Täname tagasiside eest!
Midagi läks valesti ja teie häält ei arvestatud.
Aitäh. Sinu sõnum on saadetud
Kas leidsite tekstist vea?
Valige see, klõpsake Ctrl+Enter ja me teeme selle korda!