Quantitative Methoden und Data Mining - Modul 2
Studienziele
Die Teilnehmer*innen wenden die Methoden der deskriptiven Statistik wie der Stochastik an. Sie besitzen einen Überblick über Zufallsvariablen sowie grundlegende Verteilungen, sie verstehen die Konzepte der bedingten Wahrscheinlichkeit und wenden das Theorem von Bayes auf praktische Fragestellungen an. Die Teilnehmer*innen erarbeiten Datenmodelle und beurteilen Spalten/Attribute/Features vor dem Hintergrund der jeweiligen Fragestellung
Die Teilnehmer*innen kennen den Unterschied zwischen überwachtem und unüberwachtem Lernen und wenden Verfahren aus dem Data Mining (Assoziation, Klassifikation, Clusterung) an. Die Teilnehmer*innen haben ein Grundverständnis über die Funktion neuronaler Netze. Sie sind über die aktuelle gesellschaftliche Diskussion etwa über algorithmische Verzerrung (Algorithmic Bias) und Ethik in Zusammenhang mit maschinellem Lernen informiert.
Technologisch steht R im Mittelpunkt. Bei den Data Mining Verfahren werden die Lösungen parallel mit R und einem Business Intelligence System (SQL Server) gezeigt.
Lehrinhalte
- Daten, Merkmale und Variablen
- Deskriptive Statistik:
- Datenorganisation und Häufigkeitsverteilungen
- Lage, Streuung, Form, Symmetrie, Konzentration
- Gliederungs-, Beziehungs-, Mess- und Indexzahlen
- Kontingenz- und Korrelation
- Regression - Wahrscheinlichkeitsrechnung:
- Grundlagen und Axiome, Zählregeln
- Zufallsvariablen und Verteilungen
- Grenzwertsätze, Bayes Regel - Datentransformation
- Normalisierung und Skalierung
- Tukey’s Ladder of Powers - Feature Selection / Engineering
- Data Mining:
- Assoziationsanalysen und
Interessantheitsmaße
- Klassifikation und Modellbewertung
Entscheidungsbäume
Leistungsbewertung,
Konfusionsmatrix, ROC-Analyse - Clusteranalysen, Ähnlichkeits- und Distanzmaße
- Machine Learning und Neuronale Netze
Lehr- und Lernmethoden
Problem based learning; Vorträge, problemorientierte Übungen und Aufgaben
Abschluss
Hochschulzertifikat der Berliner Hochschule für Technik
(bei Absolvierung der modulbegleitenden Aufgaben und der Modulprüfung; 5 Creditpoints nach ECTS);
ansonsten Teilnahmebescheinigung
Durchführung
Dauer: 8 Wochen
Beginn: Januar 2025
Anmeldung: jederzeit zum nächsten Beginn
Präsenztermine: Anfang Januar und Anfang März 2025 (jeweils Fr/Sa)
Nutzungsentgelt
1.500,- Euro
Zugangsvoraussetzungen
- Abschluss eines Hochschulstudiums oder eines vergleichbaren Studiums an einer Berufsakademie (BA)
- mindestens ein Jahr für die Weiterbildung geeignete Berufserfahrung
- Besondere Vorkenntnisse im Programmieren mit R und Python sind nicht erforderlich, jedoch die Bereitschaft, sich in diese Programme einzuarbeiten.
- Interesse an der Teilnahme durch berufliche Erfahrungen in einem der Themenfelder (Vorverarbeitung, Datenanalyse, Ergebniskommunikation).
Detaillierte Informationen
Aufbau und Ablauf des Fernstudienkurses
weiter zu Modul 3: Darstellung der Analyseergebnisse (Storytelling)