Farmaceutische data-analyse

Examenvragen (prof. Verbeke)

Meerkeuzevragen

  • Vergelijken van 2 soorten oogdruppels A en B obv een continue respons. Er worden 2 groepen gemaakt van 250 patiënten. De ene groep krijgt behandeling A op het linkeroog en B op het rechter oog. De andere groep omgekeerd. De respons op beide ogen wordt gemeten. Welke analyse techniek wordt gebruikt?
    • Ongepaarde t-test om beide groepen te vergelijken
    • 2 ongepaarde t-testen, 1e groep L met R vergelijken en tweede groep L met R vgl.
    • Gepaarde t-test, A vgl met B onafhankelijk van welk oog
    • Geen van bovenstaande
  • Welke uitspraak is fout?
    • Het significantieniveau is de kans op een type I fout
    • Als H0: µ=µ0 en Ha: µ≠µ0. Dan wordt H0 verworpen als het steekproefgemiddelde te ver afligt van nul
    • De p-waarde is de kans dat de nulhypothese juist is
    • Als de p-waarde kleiner is dan alfa dan is de nulhypothese fout
  • Het gewicht van mannelijke lopers is normaal verdeeld zonder gekend gemiddelde en met standaarddeviatie 5 kg. Er wordt een steekproef genomen van 25 mannen waarbij het gemiddelde 60 kg is. Hiervan wordt een 95% betrouwbaarheidsinterval genomen. Daarna wordt er een steekproef genomen van 100 mannen en ook hiervan wordt een betrouwbaarheidsinterval gemaakt. Welke uitspraak geldt over dit BI?
    • Het nieuwe interval is smaller
    • Het nieuwe interval is soms smaller en soms breder afhankelijk van de standaarddeviatie van de populatie
    • Het nieuw interval is breder
    • Bij een grote steeprof is er minder variabiliteit in de populatie dus is het interval smaller
  • Welke uitspraak is fout?
    • Een causaal verband kan niet worden ge onden als de proefpersonen niet random zijn ingedeeld in de behandelingsgroepen
    • Bij blok randomisatie is de kans kleiner dan bij simpele randomisatie dat er een groot verschil is in aantal proefpersonen per behandelingsgroep
    • Als er niet de mogelijkheid is om te randomiseren kan men een historische controlegroep gebruiken
    • Bij klassieke enkelvoudige randomisatie is de kans op toevallig even grote behandelingsgroepen zeer klein
  • Men wil het effect nagaan van muziek op de melkproductie bij koeien. Bij de controle groep wordt geenmuziek gespeeld. Het 94% betrouwbaarheidsinterval  oor het verschil van de gemiddelden is [1,3-3,2]. Wat betekent dit?
    • 0 zit niet in het betrouwbaarheidsinterval dus we weten met 95% zekerheid dat de ware toename voor alle koeien positief is
    • 95% van de koeien hebben een verhoging van de melkproductie tussen 1,3-3,2 L
    • We zijn 95% zeker dat de gemiddelde toename in de steekproef tussen 1,3 en 3,2 ligt
    • Geen van bovenstaande
  • Men wil de relatie nagaan tussen depressief zijn en het hebben van gescheiden ouders. Hiervoor selecteert met 2 groepen, een met gescheiden ouders en een zonder, en kijkt men naar het al dan niet depressief zijn. Welke analyse kan je hiervoor gebruiken?
    • Fisher exact test
    • Ongepaarde t-test
    • Gepaarde t-test
    • Mc Nemar test
  • Welke stelling is correct?
    • Het probleem bij multiple testing stelt zich alleen als minstens 1 test significant is
    • Het probleem bij multiple testing stelt zich alleen als alle testen significant zijn
    • Het probleem bij multiple testing stelt zich als minstens twee resultaten significant zijn
    • Het probleem bij multiple testing stelt zich als minstens drie resultaten significant zijn
  • Vraag over een artikel ivm power
  • Het gemiddelde en de standaarddeviatie worden beïnvloed door outliers. Daarom is het beter om altijd de mediaan en IQR te gebruiken. Waarom wel waarom niet?
    • Akkoord bij symmetrische gegevens komen de mediaan en IQR overeen met gemiddelde en standaarddeviatie
    • Niet akkoord, mediaan en IQR zijn niet voor alle veranderlijken zinvol
    • Ja voor kleine steekproeven, nee voor grote die altijd symmetrisch zijn
    • Geen van bovenstaande
  • In een steekproef liggen alle waarden vrij gegroepeerd met enkele waarden die veel groter zijn. Wat kunnen we zeggen over gemiddelde en mediaan en de vorm van het histogram?
    • Het gemiddelde is kleiner dan de mediaan en het histogram is assymetrisch met een staart naar links
    • Het gemiddelde is groter dan de mediaan en het histogram is assymetrisch met een staart naar rechts
    • Het gemiddelde is groter dan de mediaan en het histogram is asymmetrisch met een staart naar links
    • Het gemiddelde is kleiner dan de mediaan en het histogram is asymmetrisch met een staart naar rechts 4
  • 2 orale behandelingen worden getest op 3000 patiënten. 1500 patiënten krijgen de ene behandeling, de andere behandeling wordt gegeven aan de overige 1500. Welke stelling is correct?
    • Door enkelvoudige randomisatie is een willekeurige indeling in twee groepen van 1500 onmogelijk
    • Door gestratifieerde randomisatie is een willekeurige indeling in twee groepen van 1500 onmogelijk
    • Door blok randomisatie is een willekeurige indeling in twee groepen van 1500 onmogelijk
    • Geen van bovenstaande
  • Welke stelling in niet correct?
    • Random steekproef garandeert correcte besluiten
    • Een random steekproef reflecteert de populatie
    • Een random steekproef laat toe de resultaten te veralgemenen naar de populatie
    • Een random steekproef heeft dezelfde in- en exclusie criteria als de populatie
  • Rank sum berekenen van een gegeven dataset
  • X-Y scatterplot met een gekromde stijgende grafiek (puntjes) wat kunnen we besluiten?
    • De pearson correlatie coëfficiënt is groter dan de spearman
    • De pearson correlatie coëfficiënt is kleiner dan de spearman
    • Pearson en spearman zijn even groot
    • Onmogelijk om te zeggen obv dit scatterplot
  • Uitslag van een ongepaarde t-test gegeven. P=0,0132, 95% BI [2,1;14,1] Wat is correct?
    • P is klein, dit geeft voldoende evidentie om te zeggen dat de populatiegemiddelden gelijk zijn
    • P is klein dit geeft voldoende evidentie om te zeggen dat de steekproefgemiddelden gelijk zijn
    • BI bevat nul niet dus is er evidentie dat de populatiegemiddelden niet gelijk zijn
    • Geen van bovenstaande
  • Bewijs tegen H0
    • Laag significantieniveau
    • Hoog significantieniveau
    • Lage p waarden
    • Hoge p waarden
  • Het slagen in eerste zit op het vak statistiek wordt vergeleken tussen studenten die op kot zitten en studenten die pendelen. De steekproef bevat 83 studenten die op kot zitten waarvan 63 slagen in eerste zit en 31 die pendelen waarvan 25 slagen in eerste zit. De Fisher-exact test heeft een waarde van 0,8 en de chi kwadraat test 0,62. Welke uitspraak is mogelijks fout?
    • Er is geen verschil tussen studenten die op kot zitten en zij die pendelen
    • De odds ratio is niet gelijk aan 1
    • De Fisher test mag geïnterpreteerd worden ook als zijn de aantallen vrij groot
    • De kans op slagen in 1e zit is in deze steekproef groter voor de studenten die pendelen
  • Welke uitspraak is geldig?
    • Er is geen direct verband tussen de hypothese toets en het betrouwbaarheidsinterval
    • Als p-waarde kleiner is dan alfa is H0 fout
    • Als de p-waarde net groter is dan alfa is er een grote kans dat de nulhypothese fout is
    • De hypothese toets en het betrouwbaarheidsinterval kunnen elkaar tegenspreken
  • Het effect van passief roken op ontwikkeling kanker wordt nagegaan. Er worden 518 kanker patiënten gekozen en 518 niet kanker patiënten als controles. Hierbij wordt nagegaan of hun partner rookt of niet. Hoe kunnen we het risico kwantificeren?
    • Relatief risico
    • Odds ratio
    • Pearson correlatie
    • Geen van bovenstaande
  • Relatie nagaan tussen laag geboortegewicht en bloeddrukproblemen. Daarom wordt in een ziekenhuis van alle pasgeborenen de bloeddruk bepaald in de eerste levensweek en zo worden ze ingedeeld in twee groepen: hoge en lage bloeddruk. Binnen deze groepen wordt er een indeling gemaakt obv geboortegewicht (hoog, laag). Welk type test is dit met zekerheid?
    • Cross-sectioneel
    • Case-control
    • Klinisch
    • Geen van bovenstaande
  • H0: µ=5, Ha: µ≠5 p=0,0063. Wat betekent dit?
    • Het resultaat is significant
    • Een gemiddelde minstens zo extreem als het geobserveerde gemiddelde komt in minder dan 1% van de experimenten voor als µ=5
    • Voldoende evidentie om nulhypothese te verwerpen
    • Het BI bevat 5
  • Figuur van normale verdeling (dichtheidsfunctie) ernaast een histogram van eens steekproef met staart naar links. Welke uitspraak is nooit geldig?
    • Steekproef is niet willekeurig genomen
    • Populatie gemiddelde is strikt kleiner dan populatie mediaan
    • De verdeling is symmetrisch maar de steekproef is te klein om dit weer te geven
    • De steekproef is willekeurig
  • Hoeveel procent van de gegevens ligt minder dan 1 standaardafwijking van het gemiddelde in een normale verdeling
    • 34
    • 95
    • 99
    • 68
  • Twee groepen astmapatiënten worden vergeleken. Ze krijgen elk een andere puffer als behandeling. De longfunctie op het begin en op het einde wordt gemeten en de verandering in beide groepen wordt vergeleken.
    • Mc Nemar als beide groepen voldoende groot
    • Gepaarde metingen dus gepaarde t-test als voorwaarden voldaan
    • Twee onafhankelijke groepen dus ongepaarde t-test als voorwaarden voldaan
    • Geen van bovenstaande
  • Men wil onderzoeken of anti rook campagnes een effect hebben. Hiervoor bekijkt met 400 vrouwen in 1992, waarvan 175 rookten. Ook neemt men 540 vrouwen uit 2002 waarvan 192 bleken te roken. Welke analyse kunnen we gebruiken om te kijken of het rookgedrag is veranderd?
    • Gepaarde t-test
    • Mc Nemar test
    • Chi kwadraat test
    • Geen van bovenstaande
  • Als er niets gekend is over een continue verdeling welke locatiemaat is dan het meest geschikt als er een erg grote steekproef is
    • Mediaan want deze is ook geschikt bij scheve verdeling
    • Gemiddelde owv de CLT zijn grote steekproeven symmetrisch
    • De modus
    • De 3 zijn in grote steekproeven gelijk
  • Er wordt een studie gedaan naar patiëntveiligheid in Nederlandse ziekenhuizen. In de helft van de ziekenhuizen is het onveiliger dan gemiddeld. Welke uitspraak is fout?
    • Uitkomst normaal verdeeld
    • Uitkomst normaal na log transformatie
    • Niet symmetrisch
    • Kan onmogelijk symmetrisch zijn
  • Type A, B, C van een banden worden vergeleken op het 5% betrouwbaarheidsniveau. Hiervoor wordt 3x een wilcoxon test gedaan. Wat is fout?
    • Kans onterecht H0 verwerpen altijd 5%
    • Als na log transformatie de assumpties van een ongepaarde t-test voldaan zijn verkiezen we dit omdat er dan meer kans is op het detecteren van reële verschillen
    • Als na log transformatie de assumpties van een ongepaarde t-test voldaan zijn verkiezen we dit omdat er dan minder kans is om H0 onterecht te verwerpen
    • Geen van bovenstaande
  • Effect van roken op ontwikkeling hartinfarct nagaan. Twee groepen vergeleken. Groep 1 bevat 2000 rokers waarvan 40 binnen de 2j een hartinfarct krijgen. Groep 2 bevat 1000 ex-rokers waarvan 10 een hartinfarct ontwikkelen binnen de 2 jaar. Hoe kunnen we het voorkomen van hartinfarct vergelijken?
    • Fisher exact test
    • Ongepaarde t-test
    • Mc nemar test
    • Gepaarde t-test
  • Correlatie tussen lengte en gewicht van 21 jarige mannen. Hiervoor nemen we twee mannen. Lengte 178cm en 175cm, gewicht 72,6kg en 74,4kg. Wat kunnen we zeggen over de correlatie coëfficiënt?
    • R = -1
    • R tussen -1 en 0
    • R = 0
    • R tussen 0 en 1
  • Twee verschillende dieet mogelijkheden testen en vergelijken. Eerst worden 2 groepen van 20 personen getest. Dit geeft p = 0,657 wat groter is dan alfa. Een tweede experiment wordt uitgevoerd met 100 personen per groep. Dit geeft een p = 0,005 wat kleiner is dan alfa. Wat is een verklaring hiervoor?
    • 2e experiment is het werkelijke behandelingseffect groter
    • 2e experiment meer variabiliteit in populatie
    • Type I fout groter in experiment 2
    • Geen van bovenstaande
  • Gewicht van mannelijke loper is normaal verdeeld met ongekend gemiddelde en standaarddeviatie. In een steekproef van 25 lopers is het gemiddeld gewicht 60kg. Hiervoor wordt een 95% BI opgesteld. Daarna neemt men 100 lopers en maakt men hier een 95%BI voor. Wat geldt?
    • Het BI is half zo lang
    • Het BI is vier x minder lang
    • Het BI is vier x langer
    • Geen van bovenstaande
  • Welke uitspraak is duidelijk fout?
    • 2 normale verdelingen hebben dezelfde vorm als ze dezelfde variantie hebben
    • Als we het gemiddelde van een normale verdeling veranderen verandert de locatie
    • De geslachtsverdeling in een erg grote steekproef is normaal verdeed
    • Bij een normale verdeling zijn variantie en gemiddelde niet gerelateerd
  • Figuur van normale verdeling (dichtheidsfunctie) ernaast een histogram van eens steekproef met staart naar links. Wat kunnen we met zekerheid zeggen?
    • Steekproef niet willekeurig
    • Steekproef geeft evidentie dat de verdeling niet symmetrisch is
    • De verdeling is symmetrisch maar de steekproef is te klein om dit weer te geven
    • Geen van bovenstaande
  • Men wil de loonsverandering in het afgelopen jaar nagaan. Hiervoor wordt het loon in januari vergeleken met dat van december van 100 werknemers. Welke niet parametrische test kan hiervoor gebruikt worden?
    • Mann Whitney U test
    • Spearman correlatie
    • Wilcoxon voor 2 onafhankelijke groepen
    • Geen van bovenstaande
  • H0: µ is kleiner dan of gelijk aan 10, Ha: µ groter dan 10. Welke uitspraak is mogelijks fout?
    • H accepteren als het gemiddelde lager dan 10
    • H0 accepteren als het gemiddelde lager dan 0
    • H0 verwerpen als gemiddelde ver boven 10
    • H0 verwerpen als gemiddelde tussen 0 en 10
  • Geslacht (0= mannelijk, 1= vrouwelijk), gewicht (g), dosis (nihil, laag, hoog), aantal tumoren
    Welke uitspraak is fout?

    • Gewicht is kwantitatief
    • Geslacht is discreet en gewicht is continu
    • Het aantal tumoren is discreet
    • De dosis is kwantitatief en discreet