In dit artikel zullen we verschillende methoden voor het plotten van gegevens onderzoeken met behulp van de Pandas-python. We hebben alle voorbeelden in de pycharm-broncode-editor uitgevoerd met behulp van de matplotlib.pyplot pakket.
Plotten in Panda's Python
In Panda's, de .plot() heeft verschillende parameters die u kunt gebruiken op basis van uw behoeften. Meestal kunt u met behulp van de parameter 'soort' bepalen welk type plot u gaat maken.
De syntaxis voor het plotten van gegevens met Panda's Python
De volgende syntaxis wordt gebruikt om een DataFrame in Pandas Python te plotten:
# importeer panda's en matplotlib.pyplot-pakkettenpanda's importeren als pd
matplotlib importeren.pyplot als plt
# Gegevens voorbereiden om DataFrame te maken
data_frame =
'Kolom1': ['veld1', 'veld2', 'veld3', 'veld4',… ],
'Kolom2': ['veld1', 'veld2', 'veld3', 'veld4',… ]
var_df= pd.DataFrame(data_frame, columns=['Kolom1', 'Kolom2])
print(variabele)
# staafdiagram plotten
var_df.verhaal.bar(x='Kolom1', y='Kolom2')
plt.tonen()
U kunt het plottype ook als volgt definiëren door de parameter soort te gebruiken:
var_df.plot(x='Kolom1', y='Kolom2', kind='balk')Pandas DataFrames-objecten hebben de volgende plotmethoden voor het plotten:
- Scatterplotten: verhaal.verstrooien()
- Bar plotten: verhaal.bar() , plot.barh() waarbij h de plot van horizontale staven voorstelt.
- Lijn plotten: verhaal.lijn()
- Taart plotten: verhaal.taart()
Als een gebruiker alleen de methode plot() gebruikt zonder een parameter te gebruiken, wordt de standaard lijngrafiek gemaakt.
We zullen nu enkele belangrijke soorten plotten in detail uitwerken met behulp van enkele voorbeelden.
Scatterplotten in Panda's
In dit type plot hebben we de relatie tussen twee variabelen weergegeven. Laten we een voorbeeld nemen.
Voorbeeld
We hebben bijvoorbeeld gegevens over de correlatie tussen twee variabelen GDP_growth en Oil_price. Om de relatie tussen twee variabelen te plotten, hebben we het volgende stuk code uitgevoerd in onze broncode-editor:
matplotlib importeren.pyplot als pltpanda's importeren als pd
gdp_cal= pd.DataFrame(
'BBP_groei': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Olieprijs': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame(gdp_cal, columns=['Olieprijs', 'GDP_growth'])
afdrukken (df)
df.plot(x='Olieprijs', y='GDP_growth', soort = 'spreiding', kleur= 'rood')
plt.tonen()
Lijndiagrammen plotten in Panda's
De lijndiagramplot is een basistype plotten waarin bepaalde informatie wordt weergegeven in een reeks gegevenspunten die verder zijn verbonden door segmenten van rechte lijnen. Met behulp van de lijndiagrammen kunt u ook de trends van informatie overuren weergeven.
Voorbeeld
In het onderstaande voorbeeld hebben we de gegevens over de inflatie van het afgelopen jaar genomen. Bereid eerst de gegevens voor en maak vervolgens DataFrame. De volgende broncode geeft de lijngrafiek van de beschikbare gegevens weer:
panda's importeren als pdmatplotlib importeren.pyplot als plt
infl_cal = 'Jaar': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(infl_cal, kolommen=['Jaar', 'Infl_Rate'])
data_frame.plot(x='Jaar', y='Infl_Rate', kind='line')
plt.tonen()
In het bovenstaande voorbeeld moet u de soort= 'line' instellen voor het plotten van lijndiagrammen.
Methode 2# Plot gebruiken.line() methode
Het bovenstaande voorbeeld kunt u ook implementeren met behulp van de volgende methode:
panda's importeren als pdmatplotlib importeren.pyplot als plt
inf_cal = 'Jaar': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(inf_cal, kolommen=['Inflation_Rate'], index=[2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.verhaal.lijn()
plt.title('Samenvatting inflatiepercentage van de afgelopen 11 jaar')
plt.ylabel('Inflation_Rate')
plt.xlabel('Jaar')
plt.tonen()
De volgende lijngrafiek wordt weergegeven na het uitvoeren van de bovenstaande code:
Staafdiagram plotten in Panda's
Het plotten van het staafdiagram wordt gebruikt om de categorische gegevens weer te geven. In dit type plot worden de rechthoekige staven met verschillende hoogtes geplot op basis van de gegeven informatie. Het staafdiagram kan in twee verschillende horizontale of verticale richtingen worden geplot.
Voorbeeld
We hebben de alfabetiseringsgraad van verschillende landen in het volgende voorbeeld genomen:. Er worden dataframes gemaakt waarin 'Country_Names' en 'literacy_Rate' de twee kolommen van een DataFrame zijn. Met Panda's kunt u de informatie als volgt in de vorm van een staafdiagram plotten:
panda's importeren als pdmatplotlib importeren.pyplot als plt
lit_cal =
'Country_Names': ['Pakistan', 'USA', 'China', 'India', 'UK', 'Oostenrijk', 'Egypte', 'Oekraïne', 'Saoedi', 'Australië',
'Maleisië'],
'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(lit_cal, columns=['Country_Names', 'litr_Rate'])
print(data_frame)
data_frame.verhaal.bar(x='Country_Names', y='litr_Rate')
plt.tonen()
U kunt het bovenstaande voorbeeld ook implementeren met behulp van de volgende methode:. Stel de kind="bar" in voor het plotten van staafdiagrammen in deze regel:
data_frame.plot(x='Country_Names', y='litr_Rate', kind='bar')plt.tonen()
Horizontale staafdiagram plotten
U kunt de gegevens ook op horizontale balken plotten door de volgende code uit te voeren:
matplotlib importeren.pyplot als pltpanda's importeren als pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame(data_chart, columns=['litr_Rate'], index=['Pakistan', 'USA', 'China', 'India', 'UK', 'Oostenrijk', 'Egypte', 'Oekraïne', 'Saoedistan' , 'Australië',
'Maleisië'])
df.verhaal.bah()
plt.title('Alfabetiseringsgraad in verschillende landen')
plt.ylabel('Landnamen')
plt.xlabel('litr_Rate')
plt.tonen()
in df.verhaal.barh(), de barh wordt gebruikt voor horizontaal plotten. Nadat de bovenstaande code is uitgevoerd, wordt het volgende staafdiagram in het venster weergegeven:
Cirkeldiagram plotten in Panda's
Een cirkeldiagram geeft de gegevens weer in een cirkelvormige grafische vorm waarin gegevens worden weergegeven in segmenten op basis van de opgegeven hoeveelheid.
Voorbeeld
In het volgende voorbeeld hebben we de informatie over 'Earth_material' weergegeven in verschillende segmenten in het cirkeldiagram. Maak eerst het DataFrame en geef vervolgens, met behulp van de panda's, alle details in de grafiek weer.
panda's importeren als pdmatplotlib importeren.pyplot als plt
material_per = 'Aarde_Part': [71,18,7,4]
dataframe = pd.DataFrame(material_per,columns=['Earth_Part'],index = ['Water','Mineral','Zand','Metalen'])
dataframe.verhaal.taart(y='Earth_Part',figsize=(7, 7),autopct='%1.1f%%', sterhoek=90)
plt.tonen()
De bovenstaande broncode geeft de taartgrafiek van de beschikbare gegevens weer:
Conclusie
In dit artikel heb je gezien hoe je DataFrames plot in Pandas python. In het bovenstaande artikel worden verschillende soorten plotten uitgevoerd. Om meer soorten te plotten, zoals box, hexbin, hist, kde, density, area, etc., je kunt dezelfde broncode gebruiken door het plottype te veranderen.