IT
De BNAIC/BENELEARN 2021 conferentie

Data Scientist aan het woord

Data Scientist Tycho Atsma (Tech Unit Data)
mrt. 2022

Zou je jezelf willen voorstellen?

Mijn naam is Tycho Atsma, recent begonnen bij Working Talent als onderdeel van de Data tech unit. Ik heb een achtergrond als software engineer en informatiekundige en heb sinds dit jaar de master Data Science aan de Universiteit van Amsterdam afgerond. Samen met Working Talent heb ik de stap gemaakt naar de wereld van data science en engineering als onderdeel van de nieuwe data unit.
In deze blog zal ik wat vertellen over mijzelf, mijn reis naar en deelname aan de 33rd Benelux Conference on Artificial Intelligence and the 30th Belgian Dutch Conference on Machine Learning en voor de presentatie en publicatie van een paper. Het paper zal ik later in dit artikel verder toelichten.

Klik voor meer informatie over de conferentie op de volgende link: BNAIC/BENELEARN 2021

Working Talent
BNAIC/BENELEARN 2021

Wat deed je precies bij de conferentie in Luxemburg?

Zoals ik hierboven al kort heb besproken, ben ik afgereisd naar de Universiteit van Luxemburg voor de BNAIC/BENELEARN 2021 conferentie. Hier heb ik aan deelgenomen om mijn paper, genaamd “The effect of group roles on the development of online vaccination Twitter communities” , te presenteren. Dit paper is in feite een herschreven vorm van mijn masterscriptie. Om een paper te publiceren wordt er meestal verwacht dat je het in een bepaald format schrijft, afhankelijk van naar welke conferentie of journal je het stuurt. Dan wordt het gepeerreviewed door een aantal leden van de conferentie of journal. Op basis van de feedback wordt je paper geaccepteerd of geweigerd. Meestal krijg je nog wel de kans om de feedback te verwerken om nog een poging te wagen.
Naast de conferentie heb ik gelukkig ook nog een dag kunnen rondlopen en kunnen genieten van de mooie hoofdstad van Luxemburg.

Working Talent
Working Talent
Working Talent

Wat speelt er op de BNAIC?

Op deze conferentie delen experts en onderzoekers hun ervaringen met en onderzoek over opkomende trends en onderwerpen op het gebied van kunstmatige intelligentie (AI), specifiek gericht op rechten, kunst, ethiek en systemen. Tijdens deze editie werd er gesproken over het meten van de kwaliteit van staal, het voorspellen van rechtzaken, de uitkomsten van kankeronderzoek en nog veel meer. Hier zijn een aantal voorbeelden van technieken die besproken werden:

  • Machine learning, deep learning
  • Experts systems, rule-based systems and logic programming
  • Ontologies and knowledge representation
  • Meta-heuristics (Genetic Algorithms, Monte-Carlo, Hidden Markov Models)
  • Computer-Vision
  • en meer…

Ondanks het feit dat de vraagstukken vrij uiteen liepen kwam er vaak eenzelfde onderwerp naar voren, namelijk uitlegbaarheid of explainability/interpretability.

Het tempo waarin technologieën zich ontwikkelen ligt met de dag hoger. Modellen worden beter, maar ook ingewikkelder. Dit zorgt ervoor dat het steeds moeilijker wordt om bepaalde keuzes te verantwoorden op basis van de uitkomsten van een model. Kijk bijvoorbeeld naar de medische of financiele wereld. De keuze of Jantje wel of niet wordt opgenomen in het ziekenhuis of dat hij wel of niet een lening ontvangt van de bank kan serieuze gevolgen hebben voor Jantje. Als deze keuzes worden gebaseerd op de uitkomst van een model moet je vervolgens wel kunnen uitleggen waarom.
Afijn, uitlegbaarheid is dus erg belangrijk geworden in de wereld van datawetenschappen en kunstmatige intelligentie. Mocht je hier meer over willen lezen, dan kan ik het boek Interpretable Machine Learning aanbevelen.

Working Talent

Waar ging je onderzoek over?

Mijn onderzoek ging over het begrijpen van de ontwikkeling van negatief sentiment in online gemeenschappen door te kijken naar hun sociale structuren en dynamieken. Sentiment is de mate van positiviteit en negativiteit van een stuk tekst. Tijdens de huidige COVID-19 crisis heeft er een merkbare groei van opstandelingen tegen vaccinatieprogramma’s en andere overheidsmaatregelen plaatsgevonden. Hierbij spelen sociale netwerken een grote rol. Ik heb vervolgens gekeken naar de invloeden van verschillende sociale rollen binnen die netwerken. Aan de hand van literatuur hebben we drie type rollen vastgesteld: influentials, broadcasters en commons. Influentials zijn gebruikers die heel veel volgers hebben maar weinig anderen volgen. Broadcasters zijn gebruikers die niet heel veel volgers hebben en vooral veel berichten verspreiden. Commons zijn de rest. Door gebruik te maken van data van Twitter hebben we per rolgroep gekeken naar hun invloed op het sentimentniveau en de activiteit van die sociale netwerken/gemeenschappen.

Working Talent

Wat was de conclusie van je onderzoek?

Op basis van dit onderzoek hebben wij kunnen concluderen dat de invloeden van influentials niet significant verschillen van de andere rolgroepen en vergelijkbaar zijn met die van de commons. Dit is interessant want dit laat zien dat de invloed van ogenschijnlijk invloedrijke gebruikers dus groter lijkt dan het daadwerkelijk is en dat de “gewone” gebruiker dus veel meer lijkt te hebben.