Zonder data kan je natuurlijk geen dashboard bouwen. Veel organisaties beschikken over ontzettend veel data. Deze data wordt ondergebracht in databases en wat is het verschil tussen Big Data en Traditionele (relationele) Data?
Blog geschreven na het beluisteren van de webinar van De webinar werd gegeven door Arjan Burger (Eduvision)
Waarom zou je iets met data visualisatie doen? Nou omdat data vragen beantwoorden wanneer je deze data visualiseert. Visualisatie is een relatief makkelijke manier om de data te tonen zonder de onderliggende stromen te kennen. Data kan je visualiseren met verschillende tools zoals Qlik, Tableau, PowerBI, MicroStrategy, Python en R. Google Data Studio.
Verschillende soorten datavisualisatie tools
QlikView
Deze tool komt een beetje ouderwets over. Je kan er beste veel mee maar je moet leren scripten. Veel gebruikt in de markt. Er is een gratis versie aanwezig.
QlikSence
Is de nieuwe versie, de vlaggenschip van Qlik en ze werken veel in de cloud. Het werkt vrij intuitief en er zitten veel standaard bronnen in. Deze tool is self-service gericht en er is ook een gratis versie beschikbaar.
Tableau
Het voelt relatief makkelijk omdat ze de mooiste GUI hebben zei Arjan. Scripting is bij deze tool niet noodzakelijk. Je hebt hier wel extra werk om je data te transformeren, er is een cloud versie. Tableau heeft veel koppelingen en er is ook een gratis versie beschikbaar.
PowerBI
PowerBI is van Microsoft en er is een gratis versie beschikbaar. Integratie met andere Microsoft pakketten en services. Er is een online versie en desktop versie.
MicroStrategy
Deze tool is in feite een platform, ze richten zich meer op de bovenkant van de markt. Je ontwikkelt tegelijkertijd ook een app met MicroStrategy.
Python
Python is een programmeertaal, veel gebruikt voor big data en data analyse. Python werkt samen met verschillende data analyse tools en platformen. Vaak wordt Python gecombineerd met R. Python is een open source dit betekent dat je het gratis ma downloaden en gebruiken hierdoor wordt hij dus ook veel gebruikt in een markt.
R
R is een statistische programmeertaal dat ook een open source is dus wordt ook veel gebruikt in combinatie met Python. Kennis van R wordt veel gevraagd als je zoekt naar een baan in data visualisatie.
Hoe kies ik?
Gebruik je al een specifieke software van een bepaalde vendor zoals Microsoft?
Welke vendor integreert software die je al gebruikt?
Wat heb je precies nodig qua functionaliteit? Daar zit verschil in tussen pakketten, onderzoek dit goed.
Hoeveel licenties heb je nodig hoeveel heb je qua budget?
Voorbeeld Tableau
Je start met het maken van een bepaalde connectie om je data te kunnen verzamelen. Met wat voor file maak je connectie, Excel kent iedereen. Arjan zei dat JSON file makkelijk te lezen is. Als je serieus dashboards wilt gaan maken dan maak je connecties met een server zoals Google Analytics, Google AdWords, Google Sheets en ook databases die niet van Google zijn natuurlijk. Je moet beginnen met prepareren voordat je kan visualiseren zei Arjan.
Als voorbeeld gebruikte Arjan een sample van zijn database, een simpele tabel met veel informatie. Wat ik daar zag was al een transformatie van wat we al allemaal uit die database is gehaald. Data komt niet standaard zo uit een database, dit is iets wat je moet realiseren. Het begint allemaal met mapping, dit was al gedaan bij het bestandje van Arjan, zo zag ik een wereldbolletje staan boven ‘’City’’.
Al deze informatie kan je dus gebruiken in het grafische gedeelte van het verhaal. Arjan liet een dashboard zien met een map, en door met de interface te spelen veranderde het plaatje. Ik bedoel hiermee dat ik eerst Europa kon zien en toen hij alleen het zuiden selecteerde kregen we dus alleen de informatie van het zuiden van Europa te zien. Op een eenvoudige manier kan je de data bevragen dus makkelijk verschillende inzichten genereren. Arjan liet verschillende ‘’sheets’’ zien, door de vele informatie zag het er druk uit. Links zie je de dimensies, alles wat standaard in die data zat. Daarna zie je de waardes. De basis is niet zo moeilijk zegt Arjan, je hebt een kolom en een rij en je zet daar je dimensies in. Hij gaf een voorbeeld: klanten in rij en winst in kolom. In de type model staat erbij wat je nodig hebt, hoeveel dimensies en hoeveel waarde. In het begin is het een beetje uitzoeken zei Arjan.
Conclusie
Ik vond deze webinar erg leerzaam omdat Arjan alle verschillen tussen de verschillende tools uitlegde op een rustige manier zonder erg moeilijke woorden. Zelf gebruik ik Google Data Studio voor het project omdat wij de data van Google Search Console en Google Analytics wilde visualiseren en zo ging dat het makkelijkste. Tableau lijkt mij moeilijker te gebruiken dan Google Data Studio omdat er veel meer opties zijn. Wel kan Tableau voor veel meer gebruikt worden dan Google Data Studio, als ik data had buiten Google dan had ik waarschijnlijk Tableau gebruikt.
Auteur: Daphne Oberije