panda's

Gegevens plotten in Panda's Python

Gegevens plotten in Panda's Python
Datavisualisatie speelt een belangrijke rol bij data-analyse. Pandas is een sterke data-analysebibliotheek in Python voor datawetenschap. Het biedt verschillende opties voor datavisualisatie met: .plot() methode. Zelfs als je een beginner bent, kun je eenvoudig je gegevens plotten met behulp van de Pandas-bibliotheek. U moet de panda's en matplotlib importeren.pyplot-pakket voor datavisualisatie.

In dit artikel zullen we verschillende methoden voor het plotten van gegevens onderzoeken met behulp van de Pandas-python. We hebben alle voorbeelden in de pycharm-broncode-editor uitgevoerd met behulp van de matplotlib.pyplot pakket.

Plotten in Panda's Python

In Panda's, de .plot() heeft verschillende parameters die u kunt gebruiken op basis van uw behoeften. Meestal kunt u met behulp van de parameter 'soort' bepalen welk type plot u gaat maken.

De syntaxis voor het plotten van gegevens met Panda's Python

De volgende syntaxis wordt gebruikt om een ​​DataFrame in Pandas Python te plotten:

# importeer panda's en matplotlib.pyplot-pakketten
panda's importeren als pd
matplotlib importeren.pyplot als plt
# Gegevens voorbereiden om DataFrame te maken
data_frame =
'Kolom1': ['veld1', 'veld2', 'veld3', 'veld4',… ],
'Kolom2': ['veld1', 'veld2', 'veld3', 'veld4',… ]

var_df= pd.DataFrame(data_frame, columns=['Kolom1', 'Kolom2])
print(variabele)
# staafdiagram plotten
var_df.verhaal.bar(x='Kolom1', y='Kolom2')
plt.tonen()

U kunt het plottype ook als volgt definiëren door de parameter soort te gebruiken:

var_df.plot(x='Kolom1', y='Kolom2', kind='balk')

Pandas DataFrames-objecten hebben de volgende plotmethoden voor het plotten:

Als een gebruiker alleen de methode plot() gebruikt zonder een parameter te gebruiken, wordt de standaard lijngrafiek gemaakt.

We zullen nu enkele belangrijke soorten plotten in detail uitwerken met behulp van enkele voorbeelden.

Scatterplotten in Panda's

In dit type plot hebben we de relatie tussen twee variabelen weergegeven. Laten we een voorbeeld nemen.

Voorbeeld

We hebben bijvoorbeeld gegevens over de correlatie tussen twee variabelen GDP_growth en Oil_price. Om de relatie tussen twee variabelen te plotten, hebben we het volgende stuk code uitgevoerd in onze broncode-editor:

matplotlib importeren.pyplot als plt
panda's importeren als pd
gdp_cal= pd.DataFrame(
'BBP_groei': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Olieprijs': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame(gdp_cal, columns=['Olieprijs', 'GDP_growth'])
afdrukken (df)
df.plot(x='Olieprijs', y='GDP_growth', soort = 'spreiding', kleur= 'rood')
plt.tonen()

Lijndiagrammen plotten in Panda's  

De lijndiagramplot is een basistype plotten waarin bepaalde informatie wordt weergegeven in een reeks gegevenspunten die verder zijn verbonden door segmenten van rechte lijnen. Met behulp van de lijndiagrammen kunt u ook de trends van informatie overuren weergeven.

Voorbeeld

In het onderstaande voorbeeld hebben we de gegevens over de inflatie van het afgelopen jaar genomen. Bereid eerst de gegevens voor en maak vervolgens DataFrame. De volgende broncode geeft de lijngrafiek van de beschikbare gegevens weer:

panda's importeren als pd
matplotlib importeren.pyplot als plt
infl_cal = 'Jaar': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame(infl_cal, kolommen=['Jaar', 'Infl_Rate'])
data_frame.plot(x='Jaar', y='Infl_Rate', kind='line')
plt.tonen()

In het bovenstaande voorbeeld moet u de soort= 'line' instellen voor het plotten van lijndiagrammen.

Methode 2# Plot gebruiken.line() methode

Het bovenstaande voorbeeld kunt u ook implementeren met behulp van de volgende methode:

panda's importeren als pd
matplotlib importeren.pyplot als plt
inf_cal = 'Jaar': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame(inf_cal, kolommen=['Inflation_Rate'], index=[2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.verhaal.lijn()
plt.title('Samenvatting inflatiepercentage van de afgelopen 11 jaar')
plt.ylabel('Inflation_Rate')
plt.xlabel('Jaar')
plt.tonen()

De volgende lijngrafiek wordt weergegeven na het uitvoeren van de bovenstaande code:

Staafdiagram plotten in Panda's

Het plotten van het staafdiagram wordt gebruikt om de categorische gegevens weer te geven. In dit type plot worden de rechthoekige staven met verschillende hoogtes geplot op basis van de gegeven informatie. Het staafdiagram kan in twee verschillende horizontale of verticale richtingen worden geplot.

Voorbeeld

We hebben de alfabetiseringsgraad van verschillende landen in het volgende voorbeeld genomen:. Er worden dataframes gemaakt waarin 'Country_Names' en 'literacy_Rate' de twee kolommen van een DataFrame zijn. Met Panda's kunt u de informatie als volgt in de vorm van een staafdiagram plotten:

panda's importeren als pd
matplotlib importeren.pyplot als plt
lit_cal =
'Country_Names': ['Pakistan', 'USA', 'China', 'India', 'UK', 'Oostenrijk', 'Egypte', 'Oekraïne', 'Saoedi', 'Australië',
'Maleisië'],
'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame(lit_cal, columns=['Country_Names', 'litr_Rate'])
print(data_frame)
data_frame.verhaal.bar(x='Country_Names', y='litr_Rate')
plt.tonen()

U kunt het bovenstaande voorbeeld ook implementeren met behulp van de volgende methode:. Stel de kind="bar" in voor het plotten van staafdiagrammen in deze regel:

data_frame.plot(x='Country_Names', y='litr_Rate', kind='bar')
plt.tonen()

Horizontale staafdiagram plotten

U kunt de gegevens ook op horizontale balken plotten door de volgende code uit te voeren:

matplotlib importeren.pyplot als plt
panda's importeren als pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame(data_chart, columns=['litr_Rate'], index=['Pakistan', 'USA', 'China', 'India', 'UK', 'Oostenrijk', 'Egypte', 'Oekraïne', 'Saoedistan' , 'Australië',
'Maleisië'])
df.verhaal.bah()
plt.title('Alfabetiseringsgraad in verschillende landen')
plt.ylabel('Landnamen')
plt.xlabel('litr_Rate')
plt.tonen()

in df.verhaal.barh(), de barh wordt gebruikt voor horizontaal plotten. Nadat de bovenstaande code is uitgevoerd, wordt het volgende staafdiagram in het venster weergegeven:

Cirkeldiagram plotten in Panda's

Een cirkeldiagram geeft de gegevens weer in een cirkelvormige grafische vorm waarin gegevens worden weergegeven in segmenten op basis van de opgegeven hoeveelheid.

Voorbeeld

In het volgende voorbeeld hebben we de informatie over 'Earth_material' weergegeven in verschillende segmenten in het cirkeldiagram. Maak eerst het DataFrame en geef vervolgens, met behulp van de panda's, alle details in de grafiek weer.

panda's importeren als pd
matplotlib importeren.pyplot als plt
material_per = 'Aarde_Part': [71,18,7,4]
dataframe = pd.DataFrame(material_per,columns=['Earth_Part'],index = ['Water','Mineral','Zand','Metalen'])
dataframe.verhaal.taart(y='Earth_Part',figsize=(7, 7),autopct='%1.1f%%', sterhoek=90)
plt.tonen()

De bovenstaande broncode geeft de taartgrafiek van de beschikbare gegevens weer:

Conclusie

In dit artikel heb je gezien hoe je DataFrames plot in Pandas python. In het bovenstaande artikel worden verschillende soorten plotten uitgevoerd. Om meer soorten te plotten, zoals box, hexbin, hist, kde, density, area, etc., je kunt dezelfde broncode gebruiken door het plottype te veranderen.

Hoe u uw gamesessie op Linux kunt vastleggen en streamen
In het verleden werd het spelen van games alleen als een hobby beschouwd, maar met de tijd zag de game-industrie een enorme groei in termen van techno...
Beste spellen om te spelen met handtracking
Oculus Quest introduceerde onlangs het geweldige idee van handtracking zonder controllers. Met een steeds toenemend aantal games en activiteiten die f...
OSD-overlay tonen in Linux-apps en -games op volledig scherm
Het spelen van games op volledig scherm of het gebruik van apps in de modus volledig scherm zonder afleiding kan u afsnijden van relevante systeeminfo...