Python- ekin datu zientzien arloan , zalantzarik gabe, NumPy liburutegia topatu duzu. Python liburutegi indartsu hau oso ezaguna den beste liburutegi batzuek erabiltzen dute, hala nola Pandas, scikit-learn, matplotlib eta datu zientzien arlora bideratutako liburutegi gehienek . Baina ba al dakizu zehazki zer egiten duen?
Artikulu honetan NumPy Python paketeari, bere datu-egiturei, bere abantailei buruz pixka bat ulertuko dugu eta liburutegi hau erabiltzeko lehen urratsei buruzko tutorial labur bat jarraituko dugu.
Zer ikusiko dugu
Zeintzuk dira NumPy Python erabiltzearen abantailak?
Nondik hasi?
2005ean Travis Oliphant-ek sortua, NumPy C Mailako Zerrenda Exekutiboa proiektua Numeric eta Numarray proiektuetan oinarritzen zen, komunitatea array prozesatzeko esparru bakar baten inguruan biltzeko helburuarekin. Hori dela eta, NumPy paketea, Numerical Python-en laburduraren izenaz, dimentsio anitzeko matrizeetan eragiketak egiteko diseinatutako kode irekiko liburutegia da, liburutegi honetan ndarray deitzen dena.
Bere eraikuntza eta funtzionalitateak ndarray datu-egituran oinarritzen direnez, liburutegiak eragiketa azkarrak eskaintzen ditu datuak prozesatzeko eta garbitzeko, azpimultzoen sorrera eta iragazketa, estatistika deskribatzaileak, datu erlazionalak manipulatzea, datuak taldeka manipulatzea, beste prozesamendu mota batzuen artean. .
Datuak aztertzeko aplikazioetara bideratuago dauden baliabideez gain, NumPy Python-en funtzio matematikoak ere aurkituko dituzu matrizeetan eragiketa bizkorrak egiteko, begiztak idazteko beharrik gabe, aljebra linealaren baliabideak, ausazko zenbakien sorrera, Fourier transformazioak, lan egiteko tresnak. memorian mapatutako datuak, baita NumPy Python C, C++ eta FORTRAN idatzitako liburutegietara konektatzeko API bat ere.
NumPy Python liburutegiak funtzionalitate zientifiko edo modelatzailerik eskaintzen ez badu ere, pakete hau eta bere egitura nagusia, array-a, ulertzea ezinbestekoa da arrayetan oinarritutako tresnak eta liburutegiak modu eraginkorragoan erabiltzeko, Pandas liburutegia adibidez .
NumPy Python-en instalatzen
Beno, orain arte dagoeneko ikus dezakezu NumPy Python paketea egitura zentral oso garrantzitsu batean oinarritzen dela. Baina azken finean, zer dira array horiek?
Array bat dimentsio anitzeko egitura bat da, gure ordenagailuaren cmb directory memorian datuak gordetzeko aukera ematen diguna, egitura horretan kokatutako elementu bakoitza indexazio-eskema baten bidez aurkitu ahal izateko. NumPy Python-ek egitura honi ndarray deitzen dio, N dimentsioko matrizearen laburpena.
ndarray-k formatu berean gordetzen ditu beti elementuak, eta horregatik datu-egitura homogeneo gisa ezagutzen da, aplikazioak edo garatzaileak zehaztutako dimentsioetan. NumPy liburutegiko persuasive copywriting: 10 tips for writing (truly) compelling texts dimentsioak ardatz gisa ezagutzen dira.
Bi dimentsioko ndarray egitura, bi ardatz dituena, datuen kalkulu orri batekin erlazionatzeko matrize bat da, zutabe eta errenkadekin.
Hiru dimentsioko egitura, hau da, hiru ardatz, informazioa hiru dimentsiotan gordetzen duen egitura da. Egitura honen posizio bakoitzean
altuera, zabalera eta sakonera (x, y eta z) buruzko informazioa gordetzen dugula lotu dezakegu. Egituraketa mota hau oso ohikoa da irudiekin lan egiten dugunean, adibidez, RGB kolore-kanalekin erlazionatutako pixelen altuera, zabalera eta sakonera dutenak.
Zeintzuk dira NumPy Python erabiltzearen abantailak?
Aurreko atalean, NumPy-ren egitura nagusia ikusi genuen, baina Python-en garatzaileak galdetuko diozu zergatik ez erabili hizkuntzaren jatorrizko egiturak datuak gordetzeko. Galdera honen erantzuna NumPy matrizeetan eraginkorra izateko diseinatu zelako da, beraz:
⦁ Memoria gutxiago okupatzen du: NumPy-ko datuak memoria bloke jarraitu batean gordetzen dira, Python-eko beste objektu batzuek ez bezala. Honela liburutegiak datu horietara sartu eta era eraginkorrean alda dezake, informatikan erreferentziako lokaltasuna deritzon kontzeptua. Gainera, NumPy matrizeak sekuentzia txertatuak ez direnez memoria kopuru txikiagoa erabiltzen dute;
⦁ Azkarragoak dira: NumPyk eskaintzen dituen eragiketak datu multzoetan prozesamendu konplexuak egiteko gai dira, begiztak beharrik gabe. Horregatik, NumPy erabiltzen duten aplikazioak, oro har, 10 eta 100 aldiz azkarragoak dira Python jatorrizko egitura/eragiketak erabiltzen dituzten aplikazioekin alderatuta;