Sisukord:
2025 Autor: John Day | [email protected]. Viimati modifitseeritud: 2025-01-13 06:57
Põhikomponentide analüüs on statistiline meetod, mis teisendab võimalike korreleeruvate muutujate kogumi lineaarselt korreleerimata väärtuste kogumiks, kasutades ortogonaalseid teisendusi. Lihtsamalt öeldes, kui anda mitme mõõtmega andmestik, aitab see vähendada mõõtmete arvu, muutes seega andmed hõlpsamini loetavaks.
Samm: esialgsed plaanid
Tulin sellesse klassi mõttega, et soovin aru saada ja loodetavasti kirjutada algoritmi, mis võimaldaks piltidega varustamisel teha näotuvastust. Mul polnud eelnevat kogemust ega teadmisi näotuvastusega seotud asjade kohta ega olnud aimugi, kui raske on midagi sellist saavutada. Pärast vestlust professor Mallochiga mõistsin, et pean õppima palju asju, enne kui suudan täielikult mõista ülesannet, mille lõpuks plaanisin täita.
Pärast väikest uurimistööd otsustasin lõpuks, et rohkem kui midagi muud on mul vaja lineaarse algebra ja masinõppe põhitõdede õppimiseks ning otsustasin selle klassi eesmärgiks PCA (põhikomponentide analüüs).
2. samm: uurige
Esimene samm oli külastada raamatukogu ja leida mõni raamat, mis tutvustas mulle masinõpet ja täpsemalt pilditöötlust. See osutus palju raskemaks, kui ma arvasin, ja ma ei saanud sellest suurt midagi. Otsustasin siis küsida sõbralt, kes töötas Vision Labis, kes palus mul uurida lineaarset algebrat ja täpsemalt omavektoreid ja omaväärtusi. Mul oli mõningane kogemus lineaarse algebraga klassist, mille olin õppinud teisel kursusel, kuid ei saanud aru, kuidas omavektorid või omaväärtused võivad piltidega tegelemisel kasulikud olla. Kui ma rohkem uurisin, mõistsin, et pildid ei ole muud kui tohutud andmekogumid ja neid saab seetõttu käsitleda maatriksitena, ning mulle sai veidi selgemaks, miks omavektorid olid minu tegemistega seotud. Siinkohal otsustasin, et peaksin õppima pythonit kasutades piltide lugemist, kuna kavatsen oma projekti jaoks pythoni kasutada. Algselt alustasin piltide lugemiseks CV2.imreadi kasutamisega, kuid see osutus tõesti aeglaseks ja seetõttu otsustasin selleks kasutada glo ja PIL.image.open, kuna see on palju kiirem. See protsess paberil tundub suhteliselt aeganõudev, kuid tegelikult võttis see palju aega, kuna pidin õppima erinevate teekide PyCharmi (IDE) installimist ja importimist ning seejärel iga raamatukogu veebis dokumentatsiooni lugema. Seda tehes õppisin ka käsureal kasutama pip install avaldusi.
Pärast seda oli järgmine samm välja selgitada, mida ma täpselt soovin pilditöötluses teha ja õppida ning esialgu plaanisin malli sobitamist, kuid selle uurimise käigus sain teada PCA -st ja leidsin, et see on huvitavam, nii et otsustasin minge PCA asemel. Esimene termin, mis pidevalt esile kerkis, oli K-NN (K-lähim naaber) algoritm. See oli minu esimene kokkupuude masinõppe algoritmiga. Sain teada koolitus- ja testimisandmetest ning sellest, mida tähendab algoritmi koolitus. K-NN algoritmi mõistmine oli samuti keeruline, kuid see oli väga rahuldav, et lõpuks aru saada, kuidas see töötab. Praegu töötan selle nimel, et K-NN-i kood töötaks ja olen valmimisele väga lähedal.
3. samm: raskused ja saadud õppetunnid
Esimene suur raskus oli projekti enda ulatus. See oli pigem teadusuuringutele suunatud kui füüsiline. Mõne nädala möödudes vaatasin eakaaslaste edusamme ja tundsin, et ma ei tee piisavalt või et ma ei tee piisavalt kiiresti edusamme ja see oli mõnikord väga motiveeriv. Rääkimine professor Mallochiga ja lihtsalt enda kinnitamine, et ma tõesti õpin asju, mis olid minu jaoks väga uued, aitasid mul edasi minna. Teine probleem oli see, et teoreetiliste asjade tundmine ja nende rakendamine on kaks erinevat asja. Kuigi ma teadsin, mida pean, oli selle pythonis kodeerimine hoopis teine lugu. Siin aitas lihtsalt tegevuskava lõpuks välja mõelda lihtsalt veebis dokumentide lugemine ja seda rohkem tundvate sõprade küsimine.
Ma isiklikult arvan, et suurem raamatute ja dokumentide kogu M5 -s võib aidata inimesi, kes töötavad projektidega. Samuti on M5 jaoks hea mõte omada reaalajas digitaalset salvestust projektidest, mida õpilased teevad, et teised õpilased ja töötajad saaksid seda vaadata ja kaasa lüüa, kui see neile huvi pakub.
Projekti lõppedes olen nii lühikese ajaga nii palju õppinud. Olen omandanud masinõppest väga toimivad teadmised ja tunnen, et olen astunud esimesed sammud, et sellega rohkem tegeleda. Olen aru saanud, et mulle meeldib arvutinägemine ja võib -olla tahaksin sellega tegeleda ka tulevikus. Kõige tähtsam on see, et ma olen õppinud, mis on PCA, miks see nii oluline on ja kuidas seda kasutada.
Samm: järgmised sammud
Minu jaoks oli see lihtsalt millegi palju laiema ja tänapäeva maailmas väga olulise asja kriimustamine, st masinõpe. Plaanin lähiajal osaleda masinõppega seotud kursustel. Kavatsen ka näotuvastuseni jõuda, sest kogu see projekt sai alguse. Mul on ka ideid turvasüsteemiks, mis kasutab kombineeritud funktsioone (üks neist on inimese nägu), et muuta see tõeliselt turvaliseks, ja see on asi, millega tahan tulevikus töötada, kui saan asjadest laiemalt aru..
Kõigile minusugustele, kes on huvitatud masinõppest ja pilditöötlusest, kuid kellel pole eelnevat kogemust, soovitaksin esmalt õppida ja mõista lineaarset algebrat koos statistikaga (eriti jaotustega). Teiseks soovitaksin lugeda Christopher M. Bishopi mustrite äratundmist ja masinõpet. See raamat aitas mul mõista põhitõdesid, millesse ma sattusin, ja see on väga hästi üles ehitatud.