NON FAQ

Nepoložené otázky, ktoré môžu ušetriť veľa času.

Aj nepoložené otázky vyžadujú odpovede. Počas posledných 22 rokov analýzy dát z empirických výskumov sme sa často stretávali s takýmito názormi alebo domnienkami. Vyslovené ako oznamovacie vety, ale predstavujú otázky do diskusie. 

Ako najčastejšie uvažujeme

Prečo to nie je správne?

Mám tému, stačí nájsť nejaký dotazník, vzťahujúci sa k téme a získať dáta. Výskumné otázky a hypotézy naformulujem podľa toho, čo mi ukážu dáta … Správny je postup, keď tému diplomovej práce po štúdiu dostupných zdrojov dekomponujeme (konkretizujeme) pomocou výskumných otázok. Potom naformulovať východiskové výskumné hypotézy.

Dobré je aj uvažovať o tom, akými štatistickými metódami budeme analyzovať dáta. Potom môžeme zodpovedať otázku aký má byť dotazník, na čo sa máme pýtať respondentov, aby sme získali odpoveď na naše výskumné otázky a aby sme mohli overiť naše výskumné hypotézy a mohli použiť predpokladané výskumné metódy.

Predvýskumom môžeme zistiť, či dotazník prinesie nám odpovede na otázky, ktoré sme položili a či je šanca overiť naše výskumné hypotézy a tiež či premenné sú vhodné pre predpokladané štatistické metódy, ktoré chceme použiť.

Máme možnosť spresňovať pracovné výskumné otázky, preformulovať výskumné hypotézy, formulovať iné výskumné hypotézy, uvažovať aj o iných metódach analýzy dát. Ak už máme zozbierané dáta – potom už môžeme pracovať iba s tým, čo dáta umožňujú, dáta sú v tomto prípade limitujúce.

Často sa stáva, že chceme zodpovedať výskumné otázky a overiť výskumné hypotézy, ktoré dáta neumožňujú. Stáva sa, že po vyhodnotení opisných štatistík (a konzultáciach) nás vyplynie, že treba urobiť ešte lineárnu regresiu, ale v dátach nemáme premenné, ktoré by to umožňovali.

Ale tento dotazník je už overený,  prečo by nemal  poskytnúť možnosť overiť si výskumné hypotézy? Diplomové práce pracujú s pomerne malými výberovými súbormi (malým počtom respondentov ( v lepšom prípade okolo 300, v horšom prípade od 50 do 100).

Náhodný výber z cieľovej populácie je takmer nemožný a v praxi nerealizovateľný. Vyberajú sa celé triedy, zamestnanci jednej spoločnosti, teda relatívne kompaktné skupiny. To čo vyjde v jednom relatívnom malom (nereprezentatívnom) výbere nemusí vyjsť v inom relatívne malom výbere.

Veď  otázky v ňom sa týkajú aj mojej témy a  idú konkrétne k veci, prečo by nemohli byť použité na overenie  mojich výskumných hypotéz? Jedna vec je na čo sa chceme spýtať a iná vec je ako sa spýtame, aká bude otázka v dotazníku. V komunikácii môžu byť prinajmenšom tri rôzne významy:

  1. význam, zamýšľaný diplomantom
  2. význam, ktorý z otázky vyrozumie respondent
  3. konvenčný význam, teda taký vyrozumie z otázky väčšina opýtaných ľudí

Ak sú otázky príliš osobné pre respondenta, respondent bude váhať na ne odpovedať. Ak v jednej otázke sa pýtame na dve rozličné veci (aj takáto otázka je priamo k veciam), potom nebudeme vedieť, na ktorú časť otázky nám odpovedal respondent. Ak respondent z otázky vyrozumel niečo iné ako zamýšľal diplomant, potom získame bezcennú odpoveď.

Preto je dobré formuláciu otázok overiť predvýskumom.

Táto otázka je jasná, každý jej rozumie, prečo by mala mať ešte aj nejakú inštrukciu pre respondenta? Napríklad otázka „Na ktorých miestach sa v škole šikanuje?“ je jasná. Spravidla sa šikanuje na viacerých miestach. V tom lepšom prípade to budú 2 tri miesta, v horšom prípade to môže byť 5 a viac miest, kde je možné šikanovať. Pri takýchto otázkach je najlepšie umožniť respondentovi ku každému možnému miestu šikanovania sa vyjadriť dichotomicky – áno – nie.

Môžu byť aj otázky, kde chceme umožniť maximálne iba tri viacnásobné odpovede. Niekedy je na mieste požadovať od respondenta iba jednu odpoveď.

Je dobré uviesť stručnú inštrukciu k otázke, ako má respondent odpovedať.

Ak na otázku s viacnásobnou správnou odpoveďou , dostaneme iba jednu  odpoveď , je otázka zle sformulovaná.

O možnosti viacnásobnej odpovede som ešte nepočul, je to zložité, neviem čo s tým, takto radšej nepoužijem… Otázka, ktorá je typická pre viacnásobnú odpoveď, je uvedená v predchádzajúcej otázke. Viacnásobné odpovede na takú otázku sa korektne vyhodnotia metódou „Multiple Response“. Vypočítajú sa percentá odpovedí z dvoch základov- z počtu odpovedajúcich respondentov a z celkového počtu odpovedí.
Prečo treba mať viac variantov odpovedí na otázku, nestačí áno a nie? V tomto prípade je odpoveď zložitejšia a závisí od toho, čo potrebujeme zistiť, aký typ premennej chceme použiť, aké štatistické metódy sa dajú využiť pre analýzu odpovedí, či je to sólo otázka, alebo batéria otázok.
Napríklad, potrebujeme z batérie otázok vypočítať premennú „ Vybavenosť jednotlivca či domácnosti informačnými technológiami“ ,môžeme položiť respondentom batériu otázok týkajúcich sa smartfónu, tabletu, stacionárneho PC, notebooku, mediálneho centra a podobne. V tomto prípade stačí odpoveď áno a nie. Spočítame kladné odpovede a máme premennú, ktorá meria úroveň vybavenosti informačnými technológiami. Každá položka informačných technológii vo vypočítanej premennej bude mať rovnakú váhu.Ak potrebujeme merať mieru spokojnosti klienta, potom je lepšie vytvoriť batériu otázok s Likertovou škálou: 1.veľmi nespokojný, 2 nespokojný, 3.ani nespokojný ani spokojný, 4. spokojný, 5.veľmi spokojný. V tomto prípade váha jednotlivých položiek spokojnosti bude rôzna od 1 až po 5. Ak formulujeme sólo otázku, a uvažujeme o použití binomického testu potom stačí dichotomická odpoveď áno – nie.Ak chceme použiť neparametrické testy pre analýzu odpovedí, potom použijeme vyššie spomínanú Likertovu škálu, alebo škálu od 1 do 10, kde 1 bude znamenať najmenej spokojný a 10 najviac spokojný.
Načo sa pýtať na jednu vec viacerými otázkami v dotazníku? Nestačí iba jedna otázka? Nechcem respondentov otráviť… Máme na mysli otázky dotazníka, ktorými zisťujeme názory a postoje a pocity respondentov.  Ak sa na to budeme pýtať viacerými otázkami, je väčší predpoklad že dostaneme vyčerpávajúcu a presnejšiu odpoveď.

Napríklad vo výskume zamestnaneckej spokojnosti môžeme sa pýtať všeobecne: „Ako ste spokojný so svojím súčasným zamestnaním?“ Ale môžeme sa pýtať aj batériou otázok, ktoré sa pýtajú na konkrétne stránky zamestnaneckej spokojnosti, napríklad môžeme sa pýtať na to, ako je zamestnanec spokojný s využitím svojej kvalifikácie, s pracovným prostredím, s možnosťou kariérneho rastu, s benefitmi, ktoré spoločnosť ponúka a podobne.

Podobne by sme sa mohli pýtať batériou otázok na spokojnosť žiakov s digitálnym vyučovaním a na iné témy.

Prečo preferovať intervalové prípadne poradové premenné? Mne stačia jednoduché kategorické (kategoriálne)… Ak chceme z dát získať maximálne množstvo informácií, potom musíme sa rozhodnúť pre premenné vyššej úrovne (pomerové a intervalové), ktoré to umožňujú.

Merajú presnejšie a umožňujú použiť viac štatistických metód. Napríklad v našom prostredí tradične sa používa pre meranie vzdelania klasická poradová premenná:

  1. základné
  2. stredoškolské
  3. vysokoškolské vzdelanie

Výhodnejšie je merať počet rokov školského vzdelania, ako to bežne robia v USA.

Počet rokov berie do úvahy absolvované certifikované vzdelávanie po základnej škole, postmaturitné aj postgraduálne aj doktorandské štúdium.

Nepodarilo sa mi zozbierať viac dotazníkov ako 50(?), na t testy to bohato stačí… Dnes už máme špeciálne programy (aj voľne šíriteľné), ktoré nám vypočítajú aká má byť minimálna veľkosť našej výskumnej vzorky. Stačí len zadať aký test použijeme, akú hladinu významnosti testu si zvolíme, akú veľkosť efektu chceme a akú silu testu požadujeme.

Konkrétne pre t test určitého skóre (úspešnosti, spokojnosti a podobne) napríklad podľa pohlavia pre hladinu významnosti testu alfa=0,05, pre veľkosť efektu=0,5 a pre silu testu=0,95 potrebujeme 88 chlapcov a rovnaký počet dievčat pre vyvážený výskumný dizajn.

Ak by sme nemohli použiť t test ale jeho neparametrický ekvivalent Mann-Whitneyho test potom ten počet musí byť ešte vyšší až 92 chlapcov a rovnaký počet dievčat. Čo sa stane, ak takto vypočítaný počet respondentov nebudeme mať?  Stane sa to, že testovaný rozdiel nebude štatisticky významný, hoci pri vypočítanom minimálnom počte by významný bol.

 O použitých štatistických metódach pre analýzu mojich dát som ešte nerozmýšľal, to budem riešiť, až keď dotazníky (dáta) budú zozbierané … Použitie jednotlivých štatistických metód je viazané na splnenie určitých podmienok, ktorým naše dáta musia vyhovovať. Napríklad parametrické metódy ako je t test,  ANOVA-analýza rozptylu,  klasická lineárna regresia vyžadujú obyčajne normálne rozdelenie početností. Medzi ďalšie požiadavky podľa druhu štatistickej metódy môže patriť aj rovnaký skupinový rozptyl (ANOVA).

Pre akceptovateľný výsledok klasickej lineárnej regresie požadujeme, aby model ako celok bol štatisticky významný, aby vysvetľoval aspoň 30% variability, mal čo najmenšiu štandardnú chybu a vysvetľujúce (nezávislé) premenné premenné mali štatisticky významný regresný koeficient, aby reziduá boli normálne rozdelené a podobne.

Preto musíme ešte pred definitívnou verziou nášho dotazníka uvažovať o tom, či také premenné v dotazníku máme, ktoré by mohli splniť kritériá tej ktorej štatistickej metódy. Preto sa odporúča aj predvýskum, aby sme mohli posúdiť, do akej miery dáta zodpovedajú požiadavkám predpokladaných štatistických metód, ktoré chceme použiť

 Čo je to vyvážený model, a načo je dobré mať približne rovnaký počet chlapcov a dievčat? Rovnaký počet variantov skupinovej premennej, ktorý sa nazýva vyváženým výskumným dizajnom má svoj význam. Niekedy sa nám podarí získať dáta, v ktorých máme extrémne nevyvážený výskumný dizajn.

Napríklad chceme testovať rozdiely školskej úspešnosti medzi žiakmi podľa kritéria, či majú doma Internet. Keď zozbierame dáta s prekvapením zistíme, že až 92 % žiakov (v Bratislave) žiakov má doma Internet. A chceme overiť výskumnú hypotézu „Predpokladáme, že žiaci, ktorí majú doma internet budú v škole úspešnejší“.

Načo mám mať toľko socio-demografických údajov? To ani nevyužijem v mojej práci… Ak zisťujeme štatisticky významné rozdiely medzi rôznymi demografickými skupinami, je dobré mať viacero socio-demografických znakov v dotazníku.

Čo ak nenájdeme významné rozdiely tam, kde to očakávame, napríklad medzi pohlaviami? Čo ak tie rozdiely sú závislé od lokality, alebo od úplnosti rodiny, či od počtu súrodencov v rodine, prípadne od toho či rodičia sú zamestnaní, alebo či spolupracujú so školou?

Čo ak medzipohlavné rozdiely budú síce štatisticky významné, ale veľkosť zisteného efektu je veľmi malý, a sila testu je nedostatočná?

Ak máme viac socio-demografických premenných, tak je väčšia pravdepodobnosť, že nejaké významné medzi-skupinové rozdiely nájdeme.

Stačí mi zozbierať údaje v jednej spoločnosti (na jednej škole), to je najjednoduchšie, čo je na tom zlé Každý respondent zo základného súboru, koho vyberieme zo základného súboru do našej výskumnej vzorky by mal mať rovnakú šancu, aby bol vybratý. V praxi to znamená, že ak chceme skúmať napríklad názory študentov gymnázií Bratislavy, tak náhodne by sme mali vybrať študentov z každého gymnázia tak, aby sme splnili požadované minimum veľkosti vzorky.

Čo znamená náhodne?
Náhodne vybrať triedy, potom náhodne vybrať žiakov z tried, napríklad losovaním poradových čísel ako sú žiaci zapísaní v triednej knižke. Takto ideálne to vždy nejde. Ale štatistické metódy používané pre výberové skúmania predpokladajú náhodný výber, alebo kombináciu náhodného výberu s inými metódami výberu.