Pandas

pandas, veri işlemesi ve analizi için Python programlama dilinde yazılmış olan bir yazılım kütüphanesidir. Bu kütüphane temel olarak zaman etiketli serileri ve sayısal tabloları işlemek için bir veri yapısı oluşturur ve bu şekilde çeşitli işlemler bu veri yapısı üzerinde gerçekleştirilebilir olur. Yazılım ücretsizdir ve bir çeşit BSD ile lisansına sahiptir.[2] Yazılım ismini bir ekonometri terimi olan veri panelinden almıştır. Bir veri paneli birçok zaman aralığı içinde farklı gözlemlerin işlenebildiği yapıyı tarif eder.[3]

pandas
Pandas logosu
Orijinal yazar(lar) Wes McKinney
Geliştirici(ler) Topluluk
İlk yayınlanma 11 Ocak 2008) (2008-01-11)
Güncel sürüm 1.0.3[1] / 17 Mart 2020) (2020-03-17)
Programlama dili Python, CPython, C
İşletim sistemi Çapraz platform yazılımı
Lisans Yeni BSD lisansı
Resmî sitesi pandas.pydata.org
Kod deposu

Kütüphane özellikleri

  • İndeksli DataFrame (veri iskeleti) objeleri ile veri işlemesi yapabilmek.
  • Hafızadaki veya farklı türlerde bulunan veriyi okuyabilmek ve yazabilmek için araçlar sağlamak.
  • Veri sıralama ve bütünleşik kayıp veri senaryolarına karşı esnek imkanlar sunması.
  • Veri setlerinin tekrardan boyutlandırılması veya döndürülmesi.
  • Etiket bazlı dilimleme, özel indeksleme ve büyük veri setlerini ayrıştırma özelliği.
  • Veri iskeletine sütun ekleme veya var olan sütunu çıkarma.
  • Veri gruplama özelliği ile ayırma-uygulama-birleştirme uygulamalarının yapılabilmesi.
  • Veri setlerinin birleştirilmesi ve birbirine eklenmesi.
  • Hiyerarşik eksenleri indeksleme özelliğiyle birlikte çok boyutlu veriden, daha az boyutlu veri elde edilebilmesi.
  • Zaman serisi özelliği: Zaman aralığı oluşturma[4] ve sıklık çevrimleri yapma, hareketli aralık istatistik fonksiyonları, tarih öteleme ve geciktirme.
  • Veri filtrelemesi yapabilmek.

Kütüphane performans konusunda yüksek derecede en iyilenmiştir. Bu yüzden kütüphanenin önemli parçaları CPython ve C üzerinde yazılmışlardır.[5]

Dataframes (Veri İskeletleri)

Pandas temel olarak makine öğrenmesi uygulamalarında kullanılmaktadır. Bu uygulamalarda en öne çıkan özelliği de veri isketleridir. Pandas ayrıca birçok farklı formattan (csv, excel gibi) veri içe aktarması gerçekleştirebilir. Pandas çok farklı veri işleme yöntemlerini uygulayabilir; örneğin gruplama, ekleme, birleştirme, kaynaştırma, bir araya getirme. Ayrıca bu kütüphane veri temizleme için veri doldurma, değiştirme ve varsayma özelliklerine de sahiptir.

Geçmişi

Geliştirici Wes McKinney pandas için çalışmaya 2008 yılında, AQR Capital isimli şirkette çalışırken başladı. Bu uygulamayı geliştirme sebepleri yüksek performans ve esnek araçlar ile finansal analizler gerçekleştirebilmekti. Kendisi AQR şirketinden ayrılmadan önce yöneticilerini bu kütüphaneyi açık kaynak yapmaya ikna etmiştir.

Bir diğer AQR çalışanı, Change She, 2012 yılında kütüphaneye ana katkı yapan geliştirici olarak katılmıştır.

2015 yılında pandas, NumFOCUS tarafından finansal olarak desteklenmiştir. NumFOCUS, Birleşik Devletlerde kurulu olan bir kâr amacı gütmeyen bir vakıftır.[6]

Ayrıca bakınız

Kaynakça

  1. "What's new in 1.0.3". pandas. 17 Mart 2020. 18 Mart 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 18 Mart 2020.
  2. "License – Package overview – pandas 1.0.0 documentation". pandas. 28 Ocak 2020. 14 Şubat 2012 tarihinde kaynağından arşivlendi. Erişim tarihi: 30 Ocak 2020.
  3. Wes McKinney (2011). "pandas: a Foundational Python Library for Data Analysis and Statistics" (PDF). 13 Mayıs 2015 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 2 Ağustos 2018.
  4. "pandas.date_range – pandas 1.0.0 documentation". pandas. 29 Ocak 2020. 29 Mart 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 30 Ocak 2020.
  5. "Python Data Analysis Library – pandas: Python Data Analysis Library". pandas. 13 Şubat 2012 tarihinde kaynağından arşivlendi. Erişim tarihi: 13 Kasım 2017.
  6. "NumFOCUS – pandas: a fiscally sponsored project". NumFOCUS. 4 Nisan 2018 tarihinde kaynağından arşivlendi. Erişim tarihi: 3 Nisan 2018.

Literatür

  • Chen, Daniel Y. (2018). Pandas for Everyone : Python Data Analysis. Boston: Addison-Wesley. ISBN 978-0-13-454693-3.
  • McKinney, Wes (2017). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (2nd bas.). Sebastopol: O'Reilly. ISBN 978-1-4919-5766-0.
  • VanderPlas, Jake (2016). "Data Manipulations with Pandas". Python Data Science Handbook: Essential Tools for Working with Data. O'Reilly. ss. 97-216. ISBN 978-1-4919-1205-8.

Dış bağlantılar

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.