Big Data Engineering Prof. Dr. Jens Dittrich, Marcel Maltry vormals Informationssysteme, Grundvorlesung (6 CP), Sommersemester 2020

News

22.05.2020

Tutorien nächste Woche

Liebe Studierende,

obwohl es diese Woche keine Vorlesung gab, finden nächste Woche die Tutorien statt. Wir haben noch ein paar Aufgaben zu ER-Modellen und dem relationales Modell vorbereitet und ihr könnt Fragen zur aktullen Übung stellen.

Viele... Weiterlesen

Liebe Studierende,

obwohl es diese Woche keine Vorlesung gab, finden nächste Woche die Tutorien statt. Wir haben noch ein paar Aufgaben zu ER-Modellen und dem relationales Modell vorbereitet und ihr könnt Fragen zur aktullen Übung stellen.

Viele Grüße

Marcel

18.05.2020

Teamabgaben

Liebe Studierende,

wegen der besonderen Situation des virtuellen Vorlesungsbetriebs werden wir dieses Semester (im Gegensatz zur News-Ankündigung vom 14.5.) 2er- und 3er-Gruppen zur Abgabe zulassen. Versuchen Sie bitte trotzdem soweit möglich 3er-Gruppen zu... Weiterlesen

Liebe Studierende,

wegen der besonderen Situation des virtuellen Vorlesungsbetriebs werden wir dieses Semester (im Gegensatz zur News-Ankündigung vom 14.5.) 2er- und 3er-Gruppen zur Abgabe zulassen. Versuchen Sie bitte trotzdem soweit möglich 3er-Gruppen zu bilden, da dies die Korrekturlast der TutorInnen erheblich reduziert. Aus Rücksicht auf die TutorInnen werden wir keine Einzelabgaben akzeptieren.

Zum Finden von Teammitgliedern gibt es folgende Hilfestellungen von uns:

1. Im Forum gibt es bereits diesen Thread:

https://forum-bde.bigdata.uni-saarland.de/t/team-fur-abgabe-finden/195

2. Über Discord:

"Arbeitsbereich" -> "team-finden"

3. Sprechen Sie Ihre Tutorin oder Ihren Tutor an.
 

Noch ein paar Worte zum Thema Teamarbeit:

Gute Informatik entsteht immer nur im Team. Das in Filmen zelebrierte Stereotyp vom savanten Hacker, die/der alle Probleme im Alleingang löst, hat mit der Realität nichts zu tun. Deswegen ist das Trainieren von Teamarbeit Teil der Ausbildung. Das passiert im Informatikstudium z.B. auch im Softwarepraktikum, bei DSAI im Data Science-Praktikum, aber auch in diversen Vorlesungen (so wie dieser), diversen Stammvorlesungen, etc.

Falls es zu irgendwelchen Problemen oder Unstimmigkeiten mit Ihrem Team kommt, sprechen Sie uns bitte frühzeitig an. Wir helfen dann Probleme zu klären. Sie können auch unkompliziert das Team wechseln. Die größten Probleme bei der Teamarbeit entstehen aus unserer Erfahrung üblicherweise dadurch, dass die Arbeitslast ungleich verteilt ist und das nicht im Team thematisiert wird.

Vielen Dank für Ihr Verständnis
Jens Dittrich

14.05.2020

Übung 2

Liebe Studierende,

wir haben soeben Übung 2 unter Materialien hochgeladen. Eure Lösungen müssen bis zum 28. Mai, 10:00 Uhr über die Abgabe auf eurer persönlichen Statusseite hochgeladen werden.

Falls nicht andersweitig bekannt gegeben, gelten für diese und... Weiterlesen

Liebe Studierende,

wir haben soeben Übung 2 unter Materialien hochgeladen. Eure Lösungen müssen bis zum 28. Mai, 10:00 Uhr über die Abgabe auf eurer persönlichen Statusseite hochgeladen werden.

Falls nicht andersweitig bekannt gegeben, gelten für diese und alle zukünftigen Abgaben die Vorgaben, die wir zu Beginn der Vorlesung hier veröffentlicht haben.

Wie bereits angekündigt, wird Nichteinhaltung mit Punktabzug bestraft. Nachfolgend listen wir Vorgabe und entsprechenden Punktabzug auf:

  • Fehlende Angaben wie Name oder Matrikelnummer: 2 Punkte
  • Team nicht im CMS eingetragen: 2 Punkte
  • Mehrfacher Lösungsupload innerhalb eines Teams: 2 Punkte
  • Falsches Dateiformat oder falsche Lösungsaufteilung: 2 Punkte
  • Abgabe mit weniger als 3 Studierenden:
    • 1 Studierender: 5 Punkte
    • 2 Studierende: 3 Punkte

Abzüge für kleinere Teams wird es erst ab Übung 2 geben. Bitte nutzt Discord und das Forum, um euch in Teams zusammen zu finden, da Abgaben in kleineren Gruppen zu deutlich höherem Korrekturaufwand führen. Ihr habt dafür zwei Wochen Zeit bis zur nächsten Abgabe.

Viele Grüße

Marcel

09.05.2020

Tutorienzuteilung

Liebe Studierende,

wir haben soeben die Zuteilung der Tutorien vorgenommen. Solltet ihr mal zu eurem zugeteilten Termin verhindert sein, könnt ihr natürlich auch gerne ein anderes Tutorium besuchen.

Die Tutorien beginnen bereits nächste Woche über Discord.... Weiterlesen

Liebe Studierende,

wir haben soeben die Zuteilung der Tutorien vorgenommen. Solltet ihr mal zu eurem zugeteilten Termin verhindert sein, könnt ihr natürlich auch gerne ein anderes Tutorium besuchen.

Die Tutorien beginnen bereits nächste Woche über Discord. Da häufig mehrere Tutorien parallel stattfinden, gibt es in Discord zwei Tutoriumsräume: Plenum 1 und Plenum 2. Schaut auf der Team Seite nach, in welchem Raum euer Tutorium stattfindet. Tretet dann zum entsprechenden Zeitpunkt dem Sprachkanal bei. Wie es von dort weiter geht, erklären euch eure Tutoren. Nächste Woche werden wir in den Tutorien hauptsächlich den Ablauf der Tutorien erklären, Unklarheiten beseitigen und alle technischen Probleme (vagrant, Discord, ...) beheben. Natürlich könnt ihr auch Fragen zum ersten Übungsblatt stellen.

Viele Grüße und ein schönes Wochenende!

Marcel

07.05.2020

Erinnerung: Präferenzwahl Tutorien

Liebe Studierende,

bitte denkt daran bis morgen Abend 08. Mai, 23:59 Uhr auf eurer persönlichen Statusseite die Präferenzen bezüglich der Tutorien anzugeben. Wir werden die Einteilung am Samstag vornehmen.

Die Tutorien starten bereits nächste Woche über... Weiterlesen

Liebe Studierende,

bitte denkt daran bis morgen Abend 08. Mai, 23:59 Uhr auf eurer persönlichen Statusseite die Präferenzen bezüglich der Tutorien anzugeben. Wir werden die Einteilung am Samstag vornehmen.

Die Tutorien starten bereits nächste Woche über Discord. Nähere Informationen zum Ablauf veröffentlichen wir zeitnah.

Viele Grüße

Marcel

07.05.2020

Abgabe von Übungen

Liebe Studierende,

wir haben soeben Übung 1 unter Materialien hochgeladen. Eure Lösungen müssen bis zum 14. Mai, 10:00 Uhr über die Abgabe auf eurer persönlichen Statusseite hochgeladen werden.

Um zur Klaursur zugelassen zu werden müsst ihr mindestens 50%... Weiterlesen

Liebe Studierende,

wir haben soeben Übung 1 unter Materialien hochgeladen. Eure Lösungen müssen bis zum 14. Mai, 10:00 Uhr über die Abgabe auf eurer persönlichen Statusseite hochgeladen werden.

Um zur Klaursur zugelassen zu werden müsst ihr mindestens 50% der Punkte aus den Übungen erreicht haben und dürft maximal 2 Übungen mit 0 Punkten haben. Es wird dieses Semester 7 Übungen und insgesamt 140 Punkte geben.

Beachtet bei dieser und allen zukünftigen Abgaben bitte die folgenden Vorgaben:

  • Übungen sollen in Teams von 3 Studierenden abgegeben werden. Bitte notiert Namen und Matrikelnummer aller Teammitgleider auf eurer Abgabe und tragt euer Team hier im CMS ein. Pro Team darf nur ein Mitglied eure Lösungen hochladen.
  • Als Abgabe wird nur das zip-Format akzeptiert. Eure Abgabe besteht aus:
    • (1) einem pdf-Dokument, das die Lösungen zu Aufgaben 1, 2 und 4 enthält. Diese Lösungen können auch gescannte oder fotografierte, handschriftliche Aufzeichnungen sein.
    • (2) einer plain-text-Datei (beispielsweise im txt-Format), in die ihr die Lösung zu Aufgabe 3 kopiert. Dabei soll nur die gefragte Jupyter-Zelle inklusive korrekter Einrückung abgegeben werden.
abgabe.zip
└── loesungen.pdf
└── python.txt

Abgaben, die nicht diesen Vorgaben entsprechen, führen zu Punktabzug.

Viel Erfolg beim Bearbeiten.

Marcel

06.05.2020

Team zur Abgabe von Übungen

Liebe Studierende,

bitte bildet für die Abgabe der Übungen Teams mit 3 Mitgliedern. Nutzt zum Eintragen der Teams ins CMS das Teamsfeature. Dies erleichtert euch die Abgabe der Übungen, da nur ein Gruppenmitglied die Lösung hochladen muss.

Geht zum Erstellen... Weiterlesen

Liebe Studierende,

bitte bildet für die Abgabe der Übungen Teams mit 3 Mitgliedern. Nutzt zum Eintragen der Teams ins CMS das Teamsfeature. Dies erleichtert euch die Abgabe der Übungen, da nur ein Gruppenmitglied die Lösung hochladen muss.

Geht zum Erstellen eines Teams wie folgt vor:

  1. Erstellt zunächst ein neues Team, indem ihr auf eurer persönlichen Statusseite unter Teams auf Create Team klickt. Ihr erhaltet nun ein Einladungstoken. Pro Team muss ein Token erstellt werden.
  2. Gebt dieses Token an die anderen Teammitglieder weiter. Diese können dann durch Klicken auf Join Team auf ihrer persönliche Statusseite und nach Eingabe des Tokens eurem Team beitreten.

Ihr könnt Discord und das Forum verwenden um ein Team zu finden.

Viele Grüße

Marcel

28.04.2020

Profcast 28/04/20, Testvorlesung am Donnerstag

Liebe Studierende,

am kommenden Donnerstag, den 30. April, findet um 10:15 Uhr eine Testvorlesung statt. Die Vorlesung wird live über YouTube gestreamt. Den Link findet ihr im Kalender unter Informationen => Termine. In der Vorlesung wird hauptsächlich... Weiterlesen

Liebe Studierende,

am kommenden Donnerstag, den 30. April, findet um 10:15 Uhr eine Testvorlesung statt. Die Vorlesung wird live über YouTube gestreamt. Den Link findet ihr im Kalender unter Informationen => Termine. In der Vorlesung wird hauptsächlich Administratives geklärt. Außerdem stellen wir die Tools vor, die wir für die Vorlesung verwenden werden. Alle wichtigen Infos sind noch mal im folgenden Profcast zusammengefasst.

Profcast 28/04/20: https://youtu.be/t1LOgq77ek8

Viele Grüße

Marcel

17.04.2020

Präferenzen für die Übungsgruppen

Liebe Studierende,

ihr könnt ab sofort auf eurer persönliche Statusseite Präferenzen für die Übungsgruppenzuteilung angeben. Eure Angaben könnt ihr bis zum 8. Mai 23:59 anpassen. Anschließend teilen wir euch den Übungsgruppen zu.

Viele... Weiterlesen

Liebe Studierende,

ihr könnt ab sofort auf eurer persönliche Statusseite Präferenzen für die Übungsgruppenzuteilung angeben. Eure Angaben könnt ihr bis zum 8. Mai 23:59 anpassen. Anschließend teilen wir euch den Übungsgruppen zu.

Viele Grüße

Marcel

14.04.2020

Office Hours im April

Liebe Studierende,

wir bieten bereits im April virtuelle Office Hours an. Im Rahmen dieser möchten wir euch dabei unterstützen die virtuelle Maschine mit Vagrant aufzusetzen und Python zu lernen. Es ist wichtig, dass die Tools zu Vorlesungsbeginn funktionieren... Weiterlesen

Liebe Studierende,

wir bieten bereits im April virtuelle Office Hours an. Im Rahmen dieser möchten wir euch dabei unterstützen die virtuelle Maschine mit Vagrant aufzusetzen und Python zu lernen. Es ist wichtig, dass die Tools zu Vorlesungsbeginn funktionieren und ihr euch ausreichend mit Python auskennt.

Für die virtuellen Office Hours testen wir im April noch verschiedene Tools. Über welches Tool die Office Hour stattfindet, könnt ihr jeweils dem Termin im Kalender entnehmen.

Office Hour über Zoom: Um an der Office Hour über Zoom teilzunehmen, installiert zunächst den Zoom.us Client für euer Betriebssystem. Nun könnt ihr Meetings per Meeting ID und Passwort beitreten. Noch einfacher geht es, wenn ihr zusätzlich das Zoom.us Browser Plugin installiert. Damit könnt ihr Meetings auch einfach über einen Link beitreten. Alternativ kann man sich auch per Telefon bei einem Meeting dazuschalten. Meeting ID, Passwort findet ihr in den Details zur jeweiligen Office Hour im Kalender. Unter diesem Link wird erklärt, wie ihr einem Zoom-Meeting beitreten könnt.

Office Hour über Discord: Um an der Office Hour über Discord teilzunehmen, installiert zunächst Discord, registriert euch und bestätigt eure Emailadresse. Account ohne bestätigte Emailadresse sind auf unserem Server nicht zugelassen. Folgt dann dem Einladungslink Discord Server oben links unter Informationen. Wenn ihr mit dem Server verbunden seid, begebt euch zunächst in den Wartebereich. Dort erklären wir euch dann, wie es weiter geht.

Wir freuen uns auf euch! Bis dann

Marcel


Update: Die Office Hour heute findet über Discord statt!

08.04.2020

Herzlich Willkommen

Liebe Studierende,

herzlich Willkommen zur Vorlesung Big Data Engineering!

Nachfolgend haben wir ein Video für euch vorbereitet, in dem kurz Informationen zur Vorlesung zusammengefasst werden und erklärt wird, was wir im April bis zum Vorlesungsbeginn mit... Weiterlesen

Liebe Studierende,

herzlich Willkommen zur Vorlesung Big Data Engineering!

Nachfolgend haben wir ein Video für euch vorbereitet, in dem kurz Informationen zur Vorlesung zusammengefasst werden und erklärt wird, was wir im April bis zum Vorlesungsbeginn mit euch vor haben.

Profcast 08/04/20: https://youtu.be/lw4eGMduS-E

Viel Grüße

Marcel

Show all
 

Big Data Engineering

In diesem Kurs werden die Grundlagen von Daten-Management aund Anfrageverarbeitung vermittelt.

Lernziele dieser Vorlesung:

  1. Grundlegende Techniken im Bereich ”Big Data Engineering“ konzeptuell lernen.

  2. Grundlegende Techniken im Bereich ”Big Data Engineering“ anwenden lernen.

  3. Ihnen helfen, später nicht das Rad neu zu erfinden:
    Lernen, neue Probleme auf existierende Probleme abzubilden und mit etablierten Techniken zu lösen.

  4. Für Probleme wichtiger Anwendungen sensibilisieren: Privatheit, Deanonymisierung, ethische Fragestellungen

  5. Für Lösungen wichtiger Anwendungen sensibilisieren:
    Aufwand, Performanz, Robustheit, Erweiterbarkeit, Wartbarkeit

 

Die Vorlesung in Zeiten von Corona

Die Vorlesung wird ab Anfang Mai (voraussichtlich online) stattfinden. Hierfür testen wir gerade intern mehrere Tools und haben Datenschutz und Sicherheit im Blick. Vorläufige Details dazu finden Sie im ersten Foliensatz (neuste Version vom 28.4.2020, kleine Änderungen vorbehalten).

In fast jeder Vorlesungseinheit werden wir neben den üblichen Folien auch Jupyter Notebooks zeigen, um die Anwendung der unterrichteten Konzepte in Python/SQL zu verdeutlichen. Falls Sie bisher keine Erfahrung mit Python haben, empfehlen wir Ihnen dringend, die Zeit im April sinnvoll zu nutzen und sich gute Grundkenntnisse in Python anzueignen. Als Teil der wöchentlichen Übungen wird es immer wieder auch Pythonaufgaben geben.

Hierzu stellen wir Ihnen umfangreiches Material sowie eine virtuelle Maschine zur Verfügung.

Letzteres stellt sicher, dass Sie mit wenig Aufwand und betiebssystemunabhängig eine funktionierende Umgebung aufsetzen können, die für die in der Vorlesung und den Übungen genutzten Notebooks verwendet werden kann. Bitte lesen Sie sich unsere Anleitung sorgfältig durch.

Für Python und Vagrant bieten wir bereits ab dem 14. April virtuelle Office Hours an, um Probleme frühzeitig zu beheben. Schauen Sie sich dazu die Termine im Kalender an.

Sollten Sie erst ab Mai Zeit haben, sich mit Python zu beschäftigen, ist das natürlich auch möglich. Wir bieten hierzu ab Mai zwei Dienstagsvorlesungstermine an, die das Material aus den Python-Videos in live-Vorlesungen präsentieren.

 

 



Datenschutz | Impressum
Bei technischen Problemen wenden Sie sich bitte an die Administratoren