Vak: Introductie Datamining credits: 3
- Vakcode
- BFVH18IDMN
- Naam
- Introductie Datamining
- Studiejaar
- 2022-2023
- ECTS credits
- 3
- Taal
- Nederlands
- Coördinator
- D.R.M. Langers
- Werkvormen
-
- Practicum / Training
- Toetsen
-
- Introductie Datamining - Schriftelijk, organisatie ToetsCentrum
Leeruitkomsten
- Onderscheid kunnen maken tussen typen (supervised/unsupervised) machine learning problemen
- Samenstellen, opschonen en transformeren van (trainings- en test-) datasets geschikt voor datamining
- Interactief classificatie, regressie en clustering analyses kunnen uitvoeren en evalueren m.b.v. Weka
- Begrijpen van de globale werking en kenmerken van diverse "klassieke" machine learning algoritmen
- Rule-based (ZeroR, OneR)
- Trees (Id3, J48)
- Naive Bayes
- (k)-Nearest Neighbor
- Regressie (lineair, logistisch)
- Ensemble learning (bagging, randomisation, boosting, voting/stacking)
- Interactief diverse classificatie, regressie en clustering analyses kunnen uitvoeren en evalueren m.b.v. Weka
- Kunnen evalueren en vergelijken van de prestatie van verschillende algoritmen
- Instellingen en hyperparameters van analysemethoden kunnen optimaliseren
- Relevante attributen in datasets kunnen identificeren en selecteren
- Eenvoudige berekeningen kunnen uitvoeren aangaande informatie-inhoud, formule v. Bayes, prestatiematen
Inhoud
Veel biologische datasets zijn te onoverzichtelijk om in een oogopslag de biologische vraag erachter te kunnen oplossen. Door gebruik te maken van geautomatiseerde machine learning technieken kan in een grote, complexe dataset gezocht worden naar relevante patronen. Tijdens deze module wordt kennis gemaakt met datamining toepassingen, algoritmen en analyses. In het bijzonder wordt de werking van een aantal "klassieke" classificatie-algoritmen behandeld. Geleerd wordt hoe de prestaties van deze algoritmen kunnen worden geevalueerd, geoptimaliseerd en vergeleken om zo te komen tot een optimale analyse voor een gegeven dataset. Diverse voorbeelden van datasets worden bekeken en voorbereid t.b.v. nadere analyse.
Opgenomen in opleiding(en)
School(s)
- Instituut voor Life Science & Technology