Johdanto Logistic Regression

Tutkijat ovat usein kiinnostuneita luomaan malli analysoida suhdetta jotkut ennustavia (eli riippumattomia muuttujia) ja vaste (eli riippuva muuttuja). Lineaarista regressiota käytetään yleisesti silloin, kun vaste muuttuja on jatkuva. Yksi oletus lineaarinen malleja on, että jäljellä virheet noudattaa normaalijakaumaa. Tämä oletus epäonnistuu, kun vastemuuttuja on ehdoton, joten tavallinen lineaarinen malli ei ole tarkoituksenmukaista. Tämä tiedote esittelee regressiomallin vastauksen muuttuja, joka on kaksijakoinen ottaa kahteen ryhmään. Esimerkkejä ovat yleisiä: onko kasvi elää tai kuolee, onko tutkimus vastaaja suostuu tai eri mieltä lausuman, vai riskiryhmään lapsi tutkinnon tai putoaa pois lukiosta.

tavallinen lineaarinen regressio, vastaus muuttuja (Y) on lineaarinen funktio kertoimien (B0, B1, jne.), jotka vastaavat ennustajan muuttujat (X1, X2, jne.). Tyypillinen malli näyttäisi:

Y = A0 + B1 * X1 + B2 * X2 + B3 * X3 + ... + E

dikotominen vastemuuttuja, voisimme perustaa samanlainen lineaarinen malli ennustaa yksilöiden luokkaan jäsenyydet jos numeerisia arvoja käytetään edustamaan kahteen ryhmään. Mielivaltainen arvot 1 ja 0 valitaan matemaattisen mukavuutta. Käyttäen ensimmäinen esimerkki, olisimme antaa Y = 1, jos kasvi elää ja Y = 0, jos kasvi kuolee.

Tämä lineaarinen malli ei toimi hyvin muutamia syitä. Ensimmäinen vaste arvot, 0 ja 1, ovat mielivaltaisia, niin mallinnus todelliset arvot Y ei ole täsmälleen kiinnostavia. Toiseksi, se on todella todennäköisyys, että kukin väestön yksilön vastaa 0 tai 1, että olemme kiinnostuneita mallinnus. Esimerkiksi, voimme todeta, että kasvit korkea sieni-infektion (X1) kuuluvat luokkaan "kasvi elää" (Y) harvemmin kuin kasveja alhainen infektio. Siten infektion taso nousee, todennäköisyys kasvi elävä pienenee.

Näin voisimme harkita mallinnus P, todennäköisyys, kun vastemuuttuja. Jälleen on ongelmia. Vaikka yleinen lasku todennäköisyys liittyy yleisesti lisääntynyt infektio tasolla, me tiedämme, että P, kuten kaikki todennäköisyydet, voi vain pudota rajoissa 0 ja 1. Näin ollen on parempi olettaa, että suhde X1 ja P on sigmoidinen (S: n muotoinen), sen sijaan, että suora viiva.

On mahdollista, kuitenkin, löytää lineaarinen suhde X1 ja funktio P. Vaikka useat toiminnot toimivat, yksi hyödyllistä on logit toiminto. Se on luonnollinen logaritmi ja kertoimet, että Y on yhtä suuri kuin 1, joka on yksinkertaisesti suhde todennäköisyys, että Y on 1 jaetaan todennäköisyys, että Y on 0 suhde logit-P: n ja P: itsessään on sigmoidinen muodoltaan . Regressioyhtälö joka johtaa on:

ln [P /(1-P)] = B0 + B1 * X1 + B2 * X2 + ...

Vaikka vasemmalla puolella tämä yhtälö näyttää uhkaavan, tämä tapa ilmaista todennäköisyys tuloksia oikealla puolella yhtälö on lineaarinen ja etsivät tuttu. Tämä auttaa meitä ymmärtämään regressiokertoimia. Kertoimet voidaan helposti muuntaa siten, että niiden tulkinta on järkeä.

logistinen regressioyhtälöä voidaan ulottaa kyseessä dikotomisten vastaus muuttuja tapauksiin määräsi luokkiin ja polytymous luokat (yli kahteen ryhmään).
.

business Consulting

  1. Esimerkki Remora Marketing joka käynnisti valtakunnallisen ketjun Drug Store Boom
  2. Miksi Määrä katsastajat Needed
  3. Paranna Business Marketing vuonna 2013 - Viisi Things to Do
  4. Piirteet & Ominaisuudet Onnistunut Consultants
  5. Hyväntekeväisyys antaminen ja avustusjärjestöille Charity
  6. Getting Suuri Mielipiteitä voi Boost Your Reputation
  7. Lyijy sukupolvien Call Center Service
  8. Maailma technology
  9. Miten lainata rahaa, osa 2
  10. Kilpailu on onnistuneen markkinoinnin lannoitteina hedelmällistä Agriculture