Taimehaiguste tuvastamine masinõppe abil: 6 sammu
Taimehaiguste tuvastamine masinõppe abil: 6 sammu
Anonim
Kuidas tuvastada taimehaigusi masinõppe abil
Kuidas tuvastada taimehaigusi masinõppe abil

Haigete taimede avastamise ja äratundmise protsess on alati olnud käsitsi ja tüütu protsess, mis nõuab inimestelt taime keha visuaalset kontrollimist, mis võib sageli põhjustada vale diagnoosi. Samuti on ennustatud, et kuna kliimamuutuste tõttu hakkavad globaalsed ilmastikutingimused muutuma, muutuvad põllukultuuride haigused tõenäoliselt raskemaks ja laialdasemaks. Seetõttu on oluline välja töötada süsteemid, mis analüüsivad kiiresti ja hõlpsalt põllukultuure ning tuvastavad konkreetse haiguse, et piirata edasist põllukultuuride kahjustamist.

Selles juhendis uurime masinõppe kontseptsiooni, mida tuntakse kui "Transfer Learning", et klassifitseerida haigete riisitaimede pilte. Sama meetodit saab kasutada ka muude piltide klassifitseerimise probleemide puhul.

Samm: riisihaiguste tüübid

Riisihaiguste tüübid
Riisihaiguste tüübid

Riis on üks populaarsemaid põhitoidukultuure, mida kasvatatakse peamiselt Aasias, Aafrikas ja Lõuna -Ameerikas, kuid mis on vastuvõtlik erinevatele kahjuritele ja haigustele. Füüsikalisi omadusi, näiteks lehtede värvimuutust, saab kasutada mitmete haiguste tuvastamiseks, mis võivad riisisaaki mõjutada. Näiteks seenhaiguse Brown-Spot puhul, mis mõjutab lehtede kaitsekesta, on lehed kaetud mitme väikese ovaalse pruuni täpiga, millel on hallid keskused, samas kui Leaf-Blast puhul on lehed kaetud. suuremate pruunide kahjustustega. Samamoodi saab Rice Hispa kahjurist mõjutatud lehti ära tunda pikkade jälgede järgi, mis arenevad lehe pinnal.

Samm: kuidas varasemad meetodid haigusi tuvastasid?

Kuidas varasemad meetodid haigusi tuvastasid?
Kuidas varasemad meetodid haigusi tuvastasid?

Varasemad meetodid haigete taimede kujutiste automaatseks klassifitseerimiseks, näiteks reeglipõhised klassifikaatorid, mida kasutati artiklis [1], tuginevad kindlale reeglite kogumile, mis jaotab lehe kahjustatud ja mõjutamata piirkondadeks. Mõned funktsioonide eraldamise reeglid hõlmavad mõjutatud ja mõjutamata piirkondade värvide keskmise ja standardhälbe muutuste jälgimist. Kujundifunktsioonide eraldamise reeglid hõlmavad mitmete primitiivsete kujundite individuaalset asetamist mõjutatud piirkonna peale ja kuju tuvastamist, mis katab kahjustatud piirkonna maksimaalse ala. Kui funktsioonid on piltidelt eraldatud, kasutatakse piltide klassifitseerimiseks kindlaid reegleid, sõltuvalt haigusest, mis võis taime mõjutada. Sellise klassifikaatori peamine puudus on see, et see nõuab iga haiguse jaoks mitmeid fikseeritud reegleid, mis omakorda võivad muuta selle vastuvõtlikuks mürarikastele andmetele. Ülaltoodud piltidel on näidatud, kuidas saab reeglipõhist otsustuspuud kasutada pildi jagamiseks kaheks piirkonnaks.

1. Santanu Phadikar jt, „Riisihaiguste klassifikatsioon funktsioonide valiku ja reeglite genereerimise tehnikaid kasutades”, Computers and Electronics in Agriculture, kd. 90, jaanuar 2013.

3. samm: ülekandeõpe

Ülekandeõpe
Ülekandeõpe

Selles juhendis kirjeldatud kujutiste klassifitseerimise tehnikas kasutatakse CNN -i põhistruktuuri, mis koosneb mitmest konvolutsioonilisest kihist, ühenduskihist ja lõplikult täielikult ühendatud kihist. Konvolutsioonilised kihid toimivad filtrite komplektina, mis eraldavad pildi kõrgetasemelisi omadusi. Maksimaalne koondamine on üks levinumaid meetodeid, mida kasutatakse kihtide koondamisel, et vähendada ekstraheeritud tunnuste ruumilist suurust, vähendades seeläbi iga kihi kaalude arvutamiseks vajalikku arvutusvõimsust. Lõpuks juhitakse ekstraheeritud andmed läbi täielikult ühendatud kihi koos softmax aktiveerimisfunktsiooniga, mis määrab pildi klassi.

Kuid kohandatud CNN -ide koolitamine nullist ei pruugi anda soovitud tulemusi ja neil võib olla väga pikk koolitusaeg.

Koolituspiltide omaduste tundmaõppimiseks kasutame meetodit, mida nimetatakse ülekandeõppeks, kus eelnevalt koolitatud mudeli ülemised kihid eemaldatakse ja asendatakse kihtidega, mis suudavad õppida koolitusandmete spetsiifilisi funktsioone. Ülekandeõpe vähendab koolitusaega, võrreldes mudelitega, mis kasutavad juhuslikult lähtestatud kaalu. Meie meetod kasutab kuut erinevat eelnevalt koolitatud mudelit, nimelt AlexNet, GoogLeNet, ResNet-50, Inception-v3, ShuffleNet ja MobileNet-v2.

Pildil on kujutatud GoogLeNeti arhitektuuri, kus konvolutsioonikihtide jaoks kasutatakse sinist, kihtide koondamiseks punast, softmax kihtide jaoks kollast ja konkataatkihtide jaoks rohelist värvi. CNN -i sisemise töö kohta saate lisateavet siit.

Riisihaiguste andmekogum koosneb piltidest nii tervete kui ka haigete riisitaimede lehtedest. Pilte saab liigitada nelja erinevasse klassi, nimelt pruun-täpp, riis Hispa, lehtpuhasti ja tervislik. Andmekogum koosneb 2092 erinevast pildist, millest igaüks sisaldab 523 pilti. Iga pilt koosneb ühest tervest või haigest lehest, mis on paigutatud valgele taustale.

Jagasime pildiandmete kogumi koolitusteks, valideerimiseks ja pildikomplektide testimiseks. Liigse paigaldamise vältimiseks suurendame treeningkujutisi, suurendades ja pöörates koolituspilte, et suurendada treeningproovide koguarvu.

Kood ja sõltuvused on avatud lähtekoodiga ja leiate siit: GitHubi kood

Erinevate pildiklassifitseerimisrakenduste puhul saame lihtsalt muuta koolituspildi andmestikku.

4. samm: mudeli koolitamine

Mudeli koolitamine
Mudeli koolitamine
Mudeli koolitamine
Mudeli koolitamine
Mudeli koolitamine
Mudeli koolitamine

Sõltuvalt iga mudeli nõutavast mälumahust liigitatakse eelkoolitatud mudelid suuremateks ja väiksemateks mudeliteks. Väiksemad mudelid tarbivad vähem kui 15 MB ja sobivad seetõttu paremini mobiilirakenduste jaoks.

Suuremate mudelite hulgas oli Inception-v3 pikim treeninguaeg, umbes 140 minutit, samas kui AlexNetil oli lühim treeninguaeg, umbes 18 minutit. Väiksematest mobiilile orienteeritud mudelitest oli MobileNet-v2 pikim treeninguaeg umbes 73 minutit, samas kui ShuffleNetil oli lühim treeninguaeg, umbes 38 minutit.

Samm: mudeli testimine

Mudeli testimine
Mudeli testimine
Mudeli testimine
Mudeli testimine
Mudeli testimine
Mudeli testimine

Suuremate mudelite hulgas oli Inception-v3 kõrgeim testimistäpsus, ligikaudu 72,1%, samas kui AlexNetil oli madalaim testimistäpsus, umbes 48,5%. Väiksematest mobiilile orienteeritud mudelitest oli MobileNet-v2 kõrgeim testimistäpsus-62,5%, samas kui ShuffleNet-kõige madalam-58,1%.

MobileNet-v2 toimis Brown-Spot, Leaf-Blast ja Healthy lehtede piltide klassifitseerimisel märkimisväärselt hästi, tehes samal ajal Rice Hispa jaoks mitu vale liigitust täpsusega 46,15%.

Inception-v3 näitas sarnaseid klassifitseerimistulemusi kui MobileNet-v2.

6. samm: täiendavad testid

Täiendavad testid
Täiendavad testid
Täiendavad testid
Täiendavad testid

Ülaltoodud pilt näitab, kuidas MobileNet-v2 mudel liigitab valge taustal oleva murulehe pildi valesti riisi Hispaks.

Samuti testisime MobileNet-v2 täpsust Rice Hispa kärbitud piltidel, kus valge taust oli minimeeritud nii, et leht hõivab pildil maksimaalse ala. Rice Hispa kärbitud piltide puhul täheldasime täpsust ligikaudu 80,81%, st Rice Hispa kärbitud piltide puhul täheldasime klassifitseerimistäpsuse olulist suurenemist võrreldes kärpimata testproovidega. Seetõttu teeme ettepaneku, et riisihaiguste avastamise reaalsed rakendused konvolutsiooniliste närvivõrkude abil peavad täpsuse parandamiseks taustmüra eemaldamiseks kärpima testpilte.