Gegevenswetenschap

Python Seaborn-zelfstudie

Python Seaborn-zelfstudie
In deze les over Python Seaborn-bibliotheek zullen we kijken naar verschillende aspecten van deze datavisualisatiebibliotheek die we met Python kunnen gebruiken om mooie en intuïtieve grafieken te genereren die gegevens kunnen visualiseren in een vorm die bedrijven van een platform willen. Om deze les compleet te maken, behandelen we de volgende onderdelen:

Dit lijkt veel om te dekken. Laten we nu beginnen.

Wat is Python Seaborn-bibliotheek??

Seaborn-bibliotheek is een Python-pakket waarmee we infographics kunnen maken op basis van statistische gegevens. Omdat het bovenop matplotlib is gemaakt, is het er inherent compatibel mee. Bovendien ondersteunt het de gegevensstructuur van NumPy en Panda, zodat plotten direct vanuit die verzamelingen kan worden gedaan.

Het visualiseren van complexe data is een van de belangrijkste zaken waar Seaborn voor zorgt. Als we Matplotlib met Seaborn zouden vergelijken, kan Seaborn die dingen gemakkelijk maken die moeilijk te bereiken zijn met Matplotlib. Het is echter belangrijk op te merken dat: Seaborn is geen alternatief voor Matplotlib, maar een aanvulling ervan. In deze les zullen we ook gebruik maken van Matplotlib-functies in de codefragmenten. U kiest ervoor om met Seaborn te werken in de volgende gebruikssituaties:

Een opmerking voordat we beginnen, is dat we voor deze les een virtuele omgeving gebruiken die we met het volgende commando hebben gemaakt:

python -m virtualenv seaborn
bron zeegeboren/bin/activeren

Zodra de virtuele omgeving actief is, kunnen we de Seaborn-bibliotheek in de virtuele omgeving installeren, zodat de voorbeelden die we vervolgens maken, kunnen worden uitgevoerd:

pip install seaborn

Je kunt ook Anaconda gebruiken om deze voorbeelden uit te voeren, wat gemakkelijker is. Als je het op je computer wilt installeren, kijk dan naar de les die beschrijft "Hoe Anaconda Python op Ubuntu 18 te installeren".04 LTS” en deel uw feedback. Laten we nu verder gaan met verschillende soorten percelen die kunnen worden gebouwd met Python Seaborn.

Pokemon-gegevensset gebruiken

Om deze les praktisch te houden, gebruiken we de Pokemon-dataset die kan worden gedownload van Kaggle. Om deze dataset in ons programma te importeren, gebruiken we de Pandas-bibliotheek. Hier zijn alle importen die we in ons programma uitvoeren:

panda's importeren als pd
van matplotlib importeer pyplot als plt
importeer zeegeboren als sns

Nu kunnen we de dataset in ons programma importeren en enkele voorbeeldgegevens met Panda's weergeven als:

df = pd.read_csv('Pokemon'.csv', index_col=0)
df.hoofd()

Merk op dat om het bovenstaande codefragment uit te voeren, de CSV-gegevensset aanwezig moet zijn in dezelfde map als het programma zelf. Nadat we het bovenstaande codefragment hebben uitgevoerd, zien we de volgende uitvoer (in het notitieboek van Anaconda Jupyter):

Lineaire regressiecurve plotten

Een van de beste dingen van Seaborn zijn de intelligente plotfuncties die het biedt, die niet alleen de dataset visualiseren die we aan Seaborn leveren, maar er ook regressiemodellen omheen bouwen. Het is bijvoorbeeld mogelijk om een ​​lineaire regressieplot te construeren met een enkele regel code. Hier is hoe dit te doen:

sns.lmplot(x='Aanval', y='Verdediging', data=df)

Nadat we het bovenstaande codefragment hebben uitgevoerd, zien we de volgende uitvoer:

We hebben enkele belangrijke dingen opgemerkt in het bovenstaande codefragment:

Wees niet bang als je dacht dat we geen plot kunnen hebben zonder die regressielijn. Wij kunnen ! Laten we nu een nieuw codefragment proberen, vergelijkbaar met het vorige:

sns.lmplot(x='Aanval', y='Verdediging', data=df, fit_reg=False)

Deze keer zullen we de regressielijn niet zien in onze plot:

Dit is nu veel duidelijker (als we de lineaire regressielijn niet nodig hebben). Maar dit is nog niet voorbij. Seaborn stelt ons in staat om dit plot anders te maken en dat is wat we zullen doen.

Boxplots maken

Een van de beste functies in Seaborn is hoe het gemakkelijk Panda's Dataframes-structuur accepteert om gegevens te plotten. We kunnen eenvoudig een dataframe doorgeven aan de Seaborn-bibliotheek, zodat het er een boxplot van kan maken:

sns.boxplot(data=df)

Nadat we het bovenstaande codefragment hebben uitgevoerd, zien we de volgende uitvoer:

We kunnen de eerste lezing van het totaal verwijderen, omdat dat er een beetje ongemakkelijk uitziet als we hier afzonderlijke kolommen plotten:

stats_df = df.drop(['Totaal'], axis=1)
# Nieuwe boxplot met stats_df
sns.boxplot(data=stats_df)

Nadat we het bovenstaande codefragment hebben uitgevoerd, zien we de volgende uitvoer:

Zwermplot met Seaborn

We kunnen een intuïtief ontwerp Swarm-plot maken met Seaborn. We zullen opnieuw het dataframe van Panda's gebruiken dat we eerder hebben geladen, maar deze keer zullen we de showfunctie van Matplotlib aanroepen om de plot te laten zien die we hebben gemaakt. Hier is het codefragment:

sns.set_context("papier")
sns.swarmplot (x = "Aanval", y = "Verdediging", data = df)
plt.tonen()

Nadat we het bovenstaande codefragment hebben uitgevoerd, zien we de volgende uitvoer:

Door een Seaborn-context te gebruiken, stellen we Seaborn in staat om een ​​persoonlijk tintje en vloeiend ontwerp toe te voegen aan de plot. Het is mogelijk om deze plot nog verder aan te passen met een aangepaste lettergrootte die wordt gebruikt voor labels in de plot om het lezen te vergemakkelijken. Om dit te doen, zullen we meer parameters doorgeven aan de set_context-functie die precies zo werkt als ze klinken. Om bijvoorbeeld de lettergrootte van de labels te wijzigen, maken we gebruik van font.maatparameter:. Hier is het codefragment om de wijziging uit te voeren:

sns.set_context("paper", font_scale=3, rc="font.maat":8,"assen.labelgrootte":5)
sns.swarmplot (x = "Aanval", y = "Verdediging", data = df)
plt.tonen()

Nadat we het bovenstaande codefragment hebben uitgevoerd, zien we de volgende uitvoer:

De lettergrootte voor het label is gewijzigd op basis van de parameters die we hebben verstrekt en de waarde die aan het lettertype is gekoppeld.maatparameter:. Een ding waar Seaborn expert in is, is om de plot zeer intuïtief te maken voor praktisch gebruik en dit betekent dat Seaborn niet alleen een oefen Python-pakket is, maar eigenlijk iets dat we kunnen gebruiken in onze productie-implementaties.

Een titel toevoegen aan plots

Het is gemakkelijk om titels aan onze plots toe te voegen. We hoeven alleen maar een eenvoudige procedure te volgen om de functies op assenniveau te gebruiken, waarbij we de . zullen aanroepen set_title() functioneren zoals we hier in het codefragment laten zien:

sns.set_context("paper", font_scale=3, rc="font.maat":8,"assen.labelgrootte":5)
mijn_plot = sns.swarmplot (x = "Aanval", y = "Verdediging", data = df)
mijn_plot.set_title("LH Zwermplot")
plt.tonen()

Nadat we het bovenstaande codefragment hebben uitgevoerd, zien we de volgende uitvoer:

Op deze manier kunnen we veel meer informatie toevoegen aan onze plots.

Seaborn vs Matplotlib

Toen we naar de voorbeelden in deze les keken, kunnen we vaststellen dat Matplotlib en Seaborn niet direct kunnen worden vergeleken, maar ze kunnen worden gezien als complementair aan elkaar. Een van de kenmerken die Seaborn 1 stap vooruit helpt, is de manier waarop Seaborn gegevens statistisch kan visualiseren.

Om het beste uit Seaborn-parameters te halen, raden we u ten zeerste aan om de Seaborn-documentatie te bekijken en uit te zoeken welke parameters u moet gebruiken om uw perceel zo dicht mogelijk bij de zakelijke behoeften te maken.

Conclusie

In deze les hebben we gekeken naar verschillende aspecten van deze datavisualisatiebibliotheek die we met Python kunnen gebruiken om mooie en intuïtieve grafieken te genereren die gegevens kunnen visualiseren in een vorm die bedrijven van een platform willen. De Seaborm is een van de belangrijkste visualisatiebibliotheken als het gaat om data-engineering en het presenteren van gegevens in de meeste visuele vormen, absoluut een vaardigheid die we onder onze riem moeten hebben, omdat het ons in staat stelt om lineaire regressiemodellen te bouwen.

Deel uw feedback over de les op Twitter met @sbmaggarwal en @LinuxHint.

Sid Meier's Civilization VI downloaden en spelen op Linux and
Inleiding tot het spel Civilization 6 is een moderne versie van het klassieke concept dat werd geïntroduceerd in de serie Age of Empires-games. Het id...
Doom installeren en spelen op Linux
Inleiding tot Doom De Doom-serie is ontstaan ​​in de jaren 90 na de release van de originele Doom. Het was meteen een hit en vanaf die tijd heeft de g...
Vulkan voor Linux-gebruikers
Met elke nieuwe generatie grafische kaarten zien we game-ontwikkelaars de grenzen van grafische betrouwbaarheid verleggen en een stap dichter bij foto...