Python og Big Data

Kurset giver en gennemgang, samt viser mulighederne for forskellige data science og statistik muligheder i Python.

Kurset vil samtidig vise, hvor meget data kan hjælpe i sammenspil med Python, for at skabe den gode data science løsning.

Kurset vil arbejde både med Python, web og sql, så en basal viden om web og sql er at anbefale.

Derudover til kurset berøre naturlig sprog forståelse via Python samt hvor man kan simulere begivenheder med Python.

Formål

At give deltageren viden og overblik over mulighederne for data science med Python i samspil med data.

Forudsætninger

For at deltage på dette kursus anbefaler vi, at du forinden har deltaget på, eller har viden svarende til:

Tilhørende certificering

  • PS0230 - SCDP - Python Certified Developer Professional 

Tilhørende test

  • TSU-227 - Python and Big Data 

Indhold

Simpel data repræsentation og behandling 

  • NumPy, Matplotlib og Pandas

Machine learning med scikit-learn

  • Machine learning modeller og deres anvendelse
  • Regression-, Classification modeller brugt på datasæt

Neurale netværk og deep learning

  • Datasæts skalering og normalisering
  • MultiLayer Perceptronen og dens praktiske anvendelse

Natural Language processing

  • Natural Language toolkit (NLTK) til data-analyse

Håndtering af eksterne datakilder

  • SQL databaser
  • NoSQL databaser, MongoDB
  • Fra servere