Quantitative Methoden und Data Mining - Modul 2

Studienziele

Die Teilnehmer*innen wenden die Methoden der deskriptiven Statistik wie der Stochastik an. Sie besitzen einen Überblick über Zufallsvariablen sowie grundlegende Verteilungen, sie verstehen die Konzepte der bedingten Wahrscheinlichkeit und wenden das Theorem von Bayes auf praktische Fragestellungen an. Die Teilnehmer*innen erarbeiten Datenmodelle und beurteilen Spalten/Attribute/Features vor dem Hintergrund der jeweiligen Fragestellung

Die Teilnehmer*innen kennen den Unterschied zwischen überwachtem und unüberwachtem Lernen und wenden Verfahren aus dem Data Mining (Assoziation, Klassifikation, Clusterung) an.  Die Teilnehmer*innen haben ein Grundverständnis über die Funktion neuronaler Netze. Sie sind über die aktuelle gesellschaftliche Diskussion etwa über algorithmische Verzerrung (Algorithmic Bias) und Ethik in Zusammenhang mit maschinellem Lernen informiert.

Technologisch steht R im Mittelpunkt. Bei den Data Mining Verfahren werden die Lösungen parallel mit R und einem Business Intelligence System (SQL Server) gezeigt.

Lehrinhalte

  • Daten, Merkmale und Variablen
  • Deskriptive Statistik:
    -    Datenorganisation und   Häufigkeitsverteilungen
    -    Lage, Streuung, Form, Symmetrie,         Konzentration
    -    Gliederungs-, Beziehungs-, Mess- und   Indexzahlen
    -    Kontingenz- und Korrelation
    -    Regression
  • Wahrscheinlichkeitsrechnung:
    -   Grundlagen und Axiome, Zählregeln
    -   Zufallsvariablen und Verteilungen
    -   Grenzwertsätze, Bayes Regel
  • Datentransformation
    - Normalisierung und Skalierung
    - Tukey’s Ladder of Powers
  • Feature Selection / Engineering
  • Data Mining:
    - Assoziationsanalysen und
      Interessantheitsmaße
    - Klassifikation und Modellbewertung
      Entscheidungsbäume
      Leistungsbewertung,
      Konfusionsmatrix, ROC-Analyse
  • Clusteranalysen, Ähnlichkeits- und Distanzmaße
  • Machine Learning und Neuronale Netze

Lehr- und Lernmethoden

Problem based learning; Vorträge, problemorientierte Übungen und Aufgaben

Abschluss

Hochschulzertifikat der Berliner Hochschule für Technik
(bei Absolvierung der modulbegleitenden Aufgaben und der Modulprüfung; 5 Creditpoints nach ECTS);
ansonsten Teilnahmebescheinigung

Durchführung

Dauer: 8 Wochen 
Beginn: Januar 2025
Anmeldung: jederzeit zum nächsten Beginn
Präsenztermine: Anfang Januar und Anfang März 2025 (jeweils Fr/Sa)

Nutzungsentgelt

1.500,- Euro 

Zugangsvoraussetzungen

  • Abschluss eines Hochschulstudiums oder eines vergleichbaren Studiums an einer Berufsakademie (BA)
  • mindestens ein Jahr für die Weiterbildung geeignete Berufserfahrung
  • Besondere Vorkenntnisse im Programmieren mit R und Python sind nicht erforderlich, jedoch die Bereitschaft, sich in diese Programme einzuarbeiten.
  • Interesse an der Teilnahme durch berufliche Erfahrungen in einem der Themenfelder (Vorverarbeitung, Datenanalyse, Ergebniskommunikation).

Detaillierte Informationen

Aufbau und Ablauf des Fernstudienkurses

weiter zu Modul 3: Darstellung der Analyseergebnisse (Storytelling)