Puuttuvat tiedot Mechanisms

Kuten melkein kaikki tutkija voi todistaa, puuttuvat tiedot ovat laajalle levinnyt ongelma. Tiedot tutkimuksista, kokeista ja toissijaisista lähteistä usein puuttuu joitakin tietoja. Vaikutus puuttuvat tiedot tuloksista tilastollinen analyysi riippuu mekanismi, joka aiheutti tiedot puuttuvan ja tapa, jolla tiedot analyytikko käsittelee sitä. Tämä on ensimmäinen sarjan kolme artikkeleita, jotka käsitellään kysymyksiä, jotka liittyvät puuttuvat tiedot. Tässä artikkelissa kuvataan mekanismeja puuttuvien tietojen ja joidenkin niiden vaikutusten. Myöhemmät artikkeleita selittää yhteinen mutta ongelmallista ratkaisuja puuttuvat tiedot, uusia ja parempia ratkaisuja, ja ohjelmisto saatavilla toteuttamiseen näitä ratkaisuja.

tiedot puuttuvat monista syistä. Aiheita Pitkittäistutkimukset usein pudottaa pois ennen tutkimuksen valmistuttua, koska he ovat muuttaneet pois alueelta, kuoli, ei enää näe henkilökohtaista hyötyä osallistuville tai eivät pidä vaikutuksia hoidon. Kyselyjä kärsivät puuttuvat tiedot osallistujat kieltäytyvät, tai eivät tiedä vastausta tai vahingossa ohittaa kohteen. Jotkut tutkimus tutkijat jopa suunnitella tutkimus, jotta muutamia kysymyksiä kysytään vain osajoukko osallistujia. Kokeelliset tutkimukset ovat puuttuvat tiedot tutkija ei yksinkertaisesti pysty keräämään havainto. Huonot sääolosuhteet voivat tehdä havainto mahdotonta kenttäkokeissa. Tutkija sairastuu tai lakkaa toimimasta. Tietoja voidaan puuttuu jonkin tutkimuksen onnettomuuden vuoksi tai tietojen syöttö virhe. Tutkija tippaa tarjotin koeputkia. Tiedosto korruptoituu. Useimmat tutkijat ovat hyvin tuttuja yksi (tai useampi) näistä tilanteista.

Puuttuvat tiedot ovat ongelmallisia, koska useimmat tilastollisia menetelmiä vaativat arvon jokaiselle muuttujan. Kun tietojoukko on epätäydellinen, tiedot analyytikko on päätettävä, miten käsitellä sitä. Yleisin päätös on käyttää täydellinen tapauksessa analyysi (kutsutaan myös listwise poistetaan) - analysoidaan vain tapauksissa täydelliset tiedot. Yksilöiden tietoja puuttuu tahansa muuttujia pudotetaan analyysi. Se on etuja - se on helppo käyttää, on hyvin yksinkertainen, ja on oletuksena useimmissa tilastollinen paketteja. Mutta se on rajoituksia. Se voi merkittävästi alentaa otoskoko, joka johtaa vakavaan tehottomuudesta. Tämä pätee erityisesti, jos on olemassa monia muuttujia analyysiin, joista jokaisella on puuttuvat tiedot muutamassa tapauksessa. Se voi myös johtaa puolueellisia tuloksia, riippuen miksi tiedot puuttuvat.

Kaikki syistä puuttuvien tietojen sopivat neljään luokkaan, jotka perustuvat suhde puuttuvat tiedot mekanismi ja puuttuvat ja havaitut arvot. Nämä luokat ovat tärkeitä ymmärtää, koska aiheuttamat ongelmat puuttuvat tiedot ja ratkaisuja näihin ongelmiin ovat erilaisia ​​neljään luokkaan.

Ensimmäinen on kateissa täysin Random (MCAR). MCAR tarkoittaa, että puuttuvat tiedot mekanismi ei liity arvoja tahansa muuttujien, onko puuttuvat tai havaittu. Tiedot puuttuvat koska tutkija putosi koeputket tai vastanneista vahingossa ohitetaan kysymykset ovat todennäköisesti MCAR. Jos havaitut arvot ovat olennaisesti satunnaisotos kaikkia tietoja, täydellinen tapauskohtaisen analyysin antaa samat tulokset kuin kaikkia tietoja olisi. Valitettavasti useimmat puuttuvat tiedot eivät ole MCAR.

vastakkaisessa ääripäässä on Non-ignorable (NI). NI tarkoittaa, että puuttuvat tiedot mekanismi liittyy puuttuvat arvot. Se yleensä tapahtuu, kun ihmiset eivät halua paljastaa jotain hyvin henkilökohtaista tai epäsuosittu itsestään. Jos esimerkiksi yksilöiden korkeampi tulotaso eivät todennäköisesti paljastaa niitä kyselyn kuin ovat yksilöiden pienituloisia, puuttuvat tiedot mekanismi tulot kuin ignorable. Onko tulot puuttuu tai havaitaan liittyy sen arvo. Täydellinen tapauksessa analyysi voi antaa erittäin puolueellinen haulle NI puuttuvat tiedot. Jos suhteellisesti enemmän alhainen ja maltillinen tulotason yksilöt jätetään otoksen ulkopuolelle, koska korkean tulotason ihmiset puuttuu, arvio mediaanitulosta on pienempi kuin todellinen populaation keskiarvon.

näiden kahden ääripään välillä puuttuu satunnaisessa (MAR) ja kovariaattina Dependent (CD). Molemmat näistä luokista edellyttää, että syy puuttuvien tietojen ei liity puuttuvia arvoja, mutta se voi liittyä havaitun arvojen muiden muuttujien mukaan. MAR tarkoittaa, että puuttuvat arvot liittyvät joko havaittu kovariaattien tai vastemuuttujan, kun taas CD tarkoittaa, että puuttuvat arvot koskevat vain kovariaatit. Esimerkkinä CD tietoja puuttuu, puuttuvat tulot data voi olla liity todellinen tulo arvoja, mutta liittyvät koulutukseen. Ehkä ihmiset enemmän koulutetut eivät todennäköisesti paljastaa tulonsa kuin vähemmän koulutusta.

keskeinen ero on se mekanismi on ignorable (eli MCAR, CD, tai MAR) tai ei-ignorable. On erinomaiset käsittelyssä menetelmiä ignorable puuttuvat tiedot. Ei-ignorable puuttuvat tiedot ovat haastavampia ja edellyttävät erilaista lähestymistapaa.
.

business Consulting

  1. Tärkeitä asioita tietää Mitä aikana yrityksen nimi Registration.
  2. Tallentaa YouTube-video muutamalla Steps
  3. Online RSG kursseja tarjolla uhkapeli, ruoka ja majoitus Industries
  4. Franchise Brokers voi todella Lisää Value
  5. Vakaus liiketoiminnan ja marketing
  6. Office Phone Systems
  7. Hanki mahdollisuus rakentaa tehokkaita kampanjoita avulla mainokset seurantakeskuksen Techniques
  8. Merkitys sosiaalisen median online marketing
  9. Mikä on etsittävä apteekki kauppias tilit?
  10. Voiko Paikalliset yritykset kauppa Kansainvälisesti apua Google Places