MSE-häviötä käytetään regressiotehtävissä. Kuten nimestä voi päätellä, tämä tappio lasketaan ottamalla keskiarvo potenssiin erot todellisten (tavoite)ja ennustettujen arvojen.
esimerkki
esimerkiksi meillä on neuroverkko, joka ottaa talodataa ja ennustaa talon hintaa. Tällöin voidaan käyttää MSE
lossia. Periaatteessa, jos lähtö on reaaliluku, sinun pitäisi käyttää tätä tappio funktio.
Binääriristeytystä
eaa. Jos käytät BCE
häviöfunktiota, tarvitset vain yhden ulostulosolmun luokittelemaan tiedot kahteen luokkaan. Lähtöarvo tulee siirtää sigmoidin aktivointifunktion kautta ja lähtöalue on (0 – 1).
esimerkki
esimerkiksi meillä on neuroverkko, joka ottaa ilmakehätietoa ja ennustaa, sataako vai ei. Jos lähtö on suurempi kuin 0,5, verkko luokittelee sen arvoksi rain
ja jos lähtö on alle 0,5, verkko luokittelee sen arvoksi not rain
. (se voisi olla päinvastainen riippuen siitä, miten koulutat verkon). Enemmän todennäköisyys pisteet arvo, enemmän Mahdollisuus sataa.
verkkoa koulutettaessa verkkoon syötetyn tavoitearvon tulisi olla 1, Jos muuten sataa 0.
Huomautus 1
yksi tärkeä asia, jos käytät BCE
lossifunktiota, solmun ulostulon tulee olla välillä (0-1). Se tarkoittaa, että sinun täytyy käyttää sigmoid aktivointi toiminto lopulliseen lähtöön. Koska sigmoid muuntaa mitään todellista arvoa välillä (0-1).
Huomautus 2
mitä jos et käytä sigmoid-aktivaatiota lopullisella tasolla? Tällöin voidaan siirtää argumentti from logits
kuten true
tappiofunktiolle ja se soveltaa sisäisesti sigmoidia lähtöarvoon.
kategorinen Risteytystehtävä
kun meillä on moniluokkainen luokittelutehtävä, yksi tappiofunktio, jonka voi edetä, on tämä. Jos käytät CCE
häviöfunktiota, on lähdön solmuja oltava yhtä monta kuin luokkia. Ja lopullinen kerros ulostulo on läpäistävä softmax aktivointi niin, että jokainen solmu ulostulo todennäköisyysarvo välillä (0-1).
esimerkki
esimerkiksi meillä on neuroverkko, joka ottaa kuvan ja luokittelee sen kissaksi tai koiraksi. Jos kissa solmu on suurella todennäköisyydellä pisteet niin kuva luokitellaan kissa muuten koira. Periaatteessa riippumatta siitä, kumpi luokkasolmu on suurin todennäköisyyspistemäärä, kuva luokitellaan kyseiseen luokkaan.
tavoitearvon syöttämiseksi harjoitushetkellä meidän on koodattava ne yhdellä kuumalla. Jos Kuva on kissa, kohdevektori olisi (1, 0) ja jos Kuva on koira, kohdevektori olisi (0, 1). Periaatteessa kohdevektori olisi yhtä suuri kuin luokkien lukumäärä ja todellista luokkaa vastaava indeksiasento olisi 1 ja kaikki muut olisivat nolla.
Huomautus
mitä jos emme käytä softmax-aktivointia lopullisella tasolla? Sitten voit siirtää argumentin from logits
kuten true
tappiofunktiolle ja se soveltaa sisäisesti softmaxia lähtöarvoon. Sama kuin yllä olevassa tapauksessa.
harva kategorinen risteys
tämä häviöfunktio on lähes samanlainen kuin CCE
yhtä muutosta lukuun ottamatta.
kun käytämme SCCE
häviöfunktiota, kohdevektoria ei tarvitse yhden hot-koodata. Jos kohdekuva on kissa, ohitat yksinkertaisesti 0, muuten 1. Periaatteessa, oli luokka mikä tahansa, läpäiset vain kyseisen luokan indeksin.