neuroverkkojen erilaisten Häviöfunktioiden ymmärtämistä

MSE-häviötä käytetään regressiotehtävissä. Kuten nimestä voi päätellä, tämä tappio lasketaan ottamalla keskiarvo potenssiin erot todellisten (tavoite)ja ennustettujen arvojen.

esimerkki

esimerkiksi meillä on neuroverkko, joka ottaa talodataa ja ennustaa talon hintaa. Tällöin voidaan käyttää MSE lossia. Periaatteessa, jos lähtö on reaaliluku, sinun pitäisi käyttää tätä tappio funktio.

binääriluokitustehtävissä käytetään keskimääräistä Neliövirhettä

Binääriristeytystä

eaa. Jos käytät BCE häviöfunktiota, tarvitset vain yhden ulostulosolmun luokittelemaan tiedot kahteen luokkaan. Lähtöarvo tulee siirtää sigmoidin aktivointifunktion kautta ja lähtöalue on (0 – 1).

esimerkki

esimerkiksi meillä on neuroverkko, joka ottaa ilmakehätietoa ja ennustaa, sataako vai ei. Jos lähtö on suurempi kuin 0,5, verkko luokittelee sen arvoksi rain ja jos lähtö on alle 0,5, verkko luokittelee sen arvoksi not rain. (se voisi olla päinvastainen riippuen siitä, miten koulutat verkon). Enemmän todennäköisyys pisteet arvo, enemmän Mahdollisuus sataa.

Binääriristeys

verkkoa koulutettaessa verkkoon syötetyn tavoitearvon tulisi olla 1, Jos muuten sataa 0.

Huomautus 1

yksi tärkeä asia, jos käytät BCE lossifunktiota, solmun ulostulon tulee olla välillä (0-1). Se tarkoittaa, että sinun täytyy käyttää sigmoid aktivointi toiminto lopulliseen lähtöön. Koska sigmoid muuntaa mitään todellista arvoa välillä (0-1).

Huomautus 2

mitä jos et käytä sigmoid-aktivaatiota lopullisella tasolla? Tällöin voidaan siirtää argumentti from logits kuten true tappiofunktiolle ja se soveltaa sisäisesti sigmoidia lähtöarvoon.

kategorinen Risteytystehtävä

kun meillä on moniluokkainen luokittelutehtävä, yksi tappiofunktio, jonka voi edetä, on tämä. Jos käytät CCE häviöfunktiota, on lähdön solmuja oltava yhtä monta kuin luokkia. Ja lopullinen kerros ulostulo on läpäistävä softmax aktivointi niin, että jokainen solmu ulostulo todennäköisyysarvo välillä (0-1).

esimerkki

esimerkiksi meillä on neuroverkko, joka ottaa kuvan ja luokittelee sen kissaksi tai koiraksi. Jos kissa solmu on suurella todennäköisyydellä pisteet niin kuva luokitellaan kissa muuten koira. Periaatteessa riippumatta siitä, kumpi luokkasolmu on suurin todennäköisyyspistemäärä, kuva luokitellaan kyseiseen luokkaan.

kategorinen Ristikontropia

tavoitearvon syöttämiseksi harjoitushetkellä meidän on koodattava ne yhdellä kuumalla. Jos Kuva on kissa, kohdevektori olisi (1, 0) ja jos Kuva on koira, kohdevektori olisi (0, 1). Periaatteessa kohdevektori olisi yhtä suuri kuin luokkien lukumäärä ja todellista luokkaa vastaava indeksiasento olisi 1 ja kaikki muut olisivat nolla.

Huomautus

mitä jos emme käytä softmax-aktivointia lopullisella tasolla? Sitten voit siirtää argumentin from logits kuten true tappiofunktiolle ja se soveltaa sisäisesti softmaxia lähtöarvoon. Sama kuin yllä olevassa tapauksessa.

harva kategorinen risteys

tämä häviöfunktio on lähes samanlainen kuin CCE yhtä muutosta lukuun ottamatta.

kun käytämme SCCE häviöfunktiota, kohdevektoria ei tarvitse yhden hot-koodata. Jos kohdekuva on kissa, ohitat yksinkertaisesti 0, muuten 1. Periaatteessa, oli luokka mikä tahansa, läpäiset vain kyseisen luokan indeksin.

Harvaan Kategorinen Risteytyminen

Vastaa

Sähköpostiosoitettasi ei julkaista.

Previous post Cheek Augmentation: your Guide to Cheek Implant Surgery
Next post Helppo Mississippi-mutavyöryn resepti aikuisille