Pandas бол мэдээллийн бүтэц, функцийг хангадаг нээлттэй эх сурвалжийн мэдээллийн дүн шинжилгээ, манипуляцийн хэрэгсэл юм.
Пандасыг 2008 онд AQR Capital Management-ийн Wes McKinney компани санхүүгийн аналитик хэрэглээний хэргийг үүсгэн байгуулсан.
Энэ нь 2009 онд нээлттэй эх үүсвэртэй төсөл хэлбэрээр гарсан бөгөөд мэдээллийн шинжлэх ухааны нийгэмд нэр хүндтэй болсон.
Түүнээс хойш номын сан шинэ онцлог, сайжруулалттайгаар тасралтгүй шинэчлэгдэж, хамгийн сүүлийн үеийн тогтвортой хувилбар 1.3.3 хувилбар болжээ.
Питон дахь тоон тооцооллын номын сан. Пандас нь NumPy-ийн орой дээр барьдаг.
Питон дахь аналитик хийх уян хатан зэрэгцээ тооцоолох номын сан.
Мэдээллийн сантай холбогдох боломжийг олгодог Python-ийн SQL багаж хэрэгсэл ба обьект-харилцааны зураглал (ORM) номын сан.
Өөр өөр төрлийн багана бүхий хоёр хэмжээст хүснэгт шиг өгөгдлийн бүтэц.
Тэмдэглэгдсэн индекс бүхий нэг хэмжээст өгөгдлийн бүтэц.
CSV файлаас өгөгдлийг pandas.DataFrame болгон унших функц.
Нийтлэг дүр төрхийг бий болгох функц бүхий модуль.
DataFrame нь хоёр хэмжээст хүснэгт шиг өгөгдлийн бүтэц бөгөөд шошго бүхий багана ба мөр, харин цуврал нь ямар ч төрлийн өгөгдлийг хадгалах боломжтой нэг хэмжээст шошготой массив юм.
Тийм ээ, pandas нь Excel файлаас өгөгдлийг DataFrame-д уншихын тулд 'read_excel' гэсэн функцийг өгдөг.
Pandas нь санах ойн өгөгдлийг боловсруулахад оновчтой бөгөөд том өгөгдлийн програмд тохирохгүй байж магадгүй юм. Гэсэн хэдий ч энэ нь том өгөгдөл боловсруулах чадвартай Dask, Apache Spark гэх мэт бусад хэрэгслүүдтэй сайн нэгтгэдэг.
Pandas нь хуулбарыг арилгах, дутуу утгыг харьцуулах, өгөгдлийн төрлийг хөрвүүлэх гэх мэт олон нийтлэг өгөгдлийг цэвэрлэх ажилд ашиглаж болно.
Pandas-ийн гүйцэтгэл нь тоон үйлдлийн хувьд NumPy гэх мэт доод түвшний хэрэгслүүдээс удаан байж болно. Гэсэн хэдий ч энэ нь бусад өгөгдлийн шинжилгээний хэрэгслүүдтэй харьцуулахад өгөгдөл цэвэрлэх, бэлтгэх ажилд илүү үр дүнтэй байж болох өндөр түвшний интерфейсийг өгдөг.