Mit der Veröffentlichung der Version 3.0.0 der Pandas-Bibliothek zur Datenanalyse und -bearbeitung für Python entfernen die Entwickler viele veraltete Funktionen. Zu den wichtigsten Änderungen zählen ein dedizierter String-Typ (str) und ein neues „Copy-on-Write”-Verhalten.
Die nun entfernten Funktionen galten schon in früheren Versionen bereits als veraltet. Interessierte finden hier eine Übersicht dazu. Wegen der Aufräumaktion empfehlen die Entwickler zunächst ein Upgrade auf Pandas 2.3, um sicherzustellen, dass Code von Nutzern ohne Warnungen funktioniert. Erst dann sollte das Upgrade auf Pandas 3.0 erfolgen.
Zur Einführung von dedizierten String-Typen heißt es, dass historisch gesehen Pandas-Zeichenkettenspalten mit dem NumPy-Objektdatentyp dargestellt wurden. Diese Darstellung berge zahlreiche Probleme, heißt es in der Ankündigung: Sie sei nicht spezifisch für Zeichenketten (jedes Python-Objekt kann in einem Objekt-dtype-Array gespeichert werden, nicht nur Zeichenketten) und oft nicht sehr effizient (sowohl hinsichtlich der Leistung als auch der Speichernutzung).
Ab Pandas 3.0 sei standardmäßig ein dedizierter String-Datentyp aktiviert (unterstützt durch PyArrow, sofern installiert, andernfalls wird auf NumPy-Objekt-dtype zurückgegriffen). Das bedeute, dass Pandas bei der Erstellung von Pandas-Objekten, etwa in Konstruktoren oder I/O-Funktionen, Spalten mit String-Daten als neuen str-Datentyp interpretiert.





