Lesen Sie die offizielle Beschreibung

Kompetenzen

Verwenden Sie Python zum Zählen von Datensätzen und zum Vorhersagen von Mustern.

Produktionsstandard

Erstellen Sie statistische Modelle - Regression und Klassifizierung -, die aus Rohdaten verwertbare Informationen generieren.

Das große Bild

Meistern Sie die Grundlagen des maschinellen Lernens und nutzen Sie die Kraft der Daten, um zu prognostizieren, was als nächstes kommt.

Treffen Sie Ihr Support-Team

Unsere pädagogische Exzellenz ist eine Gemeinschaftsarbeit. Wenn Sie bei GA lernen, können Sie sich immer auf ein internes Expertenteam verlassen, das Sie bei Bedarf berät und unterstützt.

Ausbilder

Lernen Sie branchenspezifische Frameworks, Tools, Vokabeln und Best Practices von einem Lehrer kennen, dessen tägliche Arbeit es erfordert, sie fachgerecht einzusetzen.

Lehrassistenten

Neues Material anzunehmen ist nicht immer einfach. Durch Sprechstunden und andere Kanäle sind unsere Reisebüros hier, um Ihnen Antworten, Tipps und mehr zu geben.

Kurs Produzenten

Unsere Absolventen lieben ihre Kurshersteller, die sie während des Kurses motiviert haben. Sie können jederzeit Unterstützung für Ihre Unterstützung erhalten.

Siehe Was Sie lernen werden

Einheit 1: Forschungsdesign und explorative Datenanalyse

  • Was ist Datenwissenschaft?
    • Beschreiben Sie den Kurslehrplan und richten Sie die Unterrichtsumgebung ein
    • Beantworten Sie die Fragen: "Was ist Data Science? Welche Rollen gibt es in Data Science?"
    • Definieren Sie die Arbeitsabläufe, Tools und Ansätze, mit denen Datenwissenschaftler Daten analysieren
  • Forschungsdesign und Pandas
  • Definieren Sie ein Problem und identifizieren Sie geeignete Datensätze mithilfe des Data-Science-Workflows
  • Führen Sie den Data Science-Workflow anhand einer Fallstudie in der Pandas-Bibliothek durch
  • Importieren, formatieren und bereinigen Sie Daten mit der Pandas-Bibliothek
  • Statistik Grundlegende I
  • Verwenden Sie NumPy- und Pandas-Bibliotheken zum Analysieren von Datensätzen mithilfe von grundlegenden zusammenfassenden Statistiken: Mittelwert, Median, Modus, Max, Min, Quartil, Interquartil, Bereich, Varianz, Standardabweichung und Korrelation
  • Erstellen Sie Datenvisualisierungen - Streudiagramme, Streudiagramm, Liniendiagramm, Box-Blots und Histogramme -, um Merkmale und Trends in einem Dataset zu erkennen
  • Identifizieren einer Normalverteilung innerhalb eines Datasets mithilfe von Statistikzusammenfassungen und Visualisierung
  • Statistik Grundlegende II
  • Erklären Sie den Unterschied zwischen Kausalität und Korrelation
  • Testen Sie eine Hypothese innerhalb einer Beispielfallstudie
  • Validieren Sie Ihre Ergebnisse mit statistischen Analysen (p-Werte, Konfidenzintervalle)
  • Ausbilderwahl
  • Konzentrieren Sie sich auf ein vom Kursleiter ausgewähltes Thema, um einen tieferen Einblick in die explorative Datenanalyse zu erhalten

Einheit 2: Grundlagen der Datenmodellierung

  • Einführung in die Regression
    • Definieren Sie Datenmodellierung und lineare Regression
    • Unterscheiden zwischen kategorischen und kontinuierlichen Variablen
    • Erstellen Sie ein lineares Regressionsmodell mit einem Datensatz, der die Linearitätsannahme mithilfe der Bibliothek scikit-learn erfüllt
  • Modell Fit bewerten
  • Definieren Sie Regularisierungs-, Bias- und Fehlermetriken.
  • Bewerten Sie die Modellanpassung mithilfe von Verlustfunktionen, einschließlich mittlerer absoluter Fehler, mittlerer quadratischer Fehler und mittlerer quadratischer Fehler
  • Wählen Sie Regressionsmethoden basierend auf Anpassung und Komplexität
  • Einführung in die Klassifikation
  • Definieren Sie ein Klassifikationsmodell
  • Erstellen Sie mithilfe der scikit-learn-Bibliothek einen K-Nearest Neighbours
  • Bewerten und optimieren Sie das Modell mithilfe von Metriken wie Klassifikationsgenauigkeit / Fehler
  • Einführung in die logistische Regression
  • Erstellen Sie ein logistisches Regressionsklassifizierungsmodell mithilfe der scikit learn-Bibliothek
  • Beschreiben Sie die Sigmoid-Funktion, Odds und Odds Ratios und wie sie sich auf die logistische Regression beziehen
  • Bewerten Sie ein Modell anhand von Metriken wie Klassifikationsgenauigkeit / Fehler, Konfusionsmatrix, ROC / AOC-Kurven und Verlustfunktionen
  • Ergebnisse aus logistischer Regression kommunizieren
  • Erläutern Sie den Kompromiss zwischen der Genauigkeit und dem Rückruf eines Modells und artikulieren Sie die Kosten von falsch positiven gegenüber falsch negativen.
  • Identifizieren Sie die Komponenten eines prägnanten, überzeugenden Berichts und deren Bezug zu bestimmten Zielgruppen / Interessengruppen
  • Beschreiben Sie den Unterschied zwischen der Visualisierung für Präsentationen und der explorativen Datenanalyse
  • Flexible Klassensitzung
  • Konzentrieren Sie sich auf ein vom Kursleiter ausgewähltes Thema, um einen tieferen Einblick in die Datenmodellierung zu erhalten

Einheit 3: Data Science in der realen Welt

  • Entscheidungsbäume und zufälliger Wald
    • Beschreiben Sie den Unterschied zwischen Klassifikations- und Regressionsbäumen und wie diese Modelle zu interpretieren sind
    • Erläutern und kommunizieren Sie die Kompromisse zwischen Entscheidungsbäumen und Regressionsmodellen
    • Erstellen Sie Entscheidungsbäume und zufällige Gesamtstrukturen mit der Bibliothek scikit-learn
  • Verarbeitung natürlicher Sprache
  • Zeigen Sie, wie Sie mithilfe von NLTK Text in natürlicher Sprache in Tokens umwandeln können
  • Kategorisieren und markieren Sie unstrukturierte Textdaten
  • Erläutern, wie ein Textklassifizierungsmodell mit NLTK erstellt wird
  • Reduzierung der Dimensionalität
  • Erläutern Sie, wie Sie mithilfe von Themenmodellen eine Dimensionsreduktion durchführen
  • Demonstrieren, wie Daten mithilfe der latenten Dirichlet-Zuordnung (LDA) verfeinert werden
  • Extrahieren Sie Informationen aus einem Beispieltextdatenset
  • Mit Zeitreihendaten arbeiten
  • Erläutern Sie, warum sich Zeitreihendaten von anderen Daten unterscheiden und wie sie berücksichtigt werden
  • Erstellen Sie rollierende Mittel und zeichnen Sie Zeitreihendaten mit der Pandas-Bibliothek auf
  • Führen Sie Autokorrelation auf Zeitreihendaten durch
  • Erstellen von Modellen mit Zeitreihendaten
  • Zerlegen Sie Zeitreihendaten in Trend- und Restkomponenten
  • Validierung und Kreuzvalidierung von Daten aus verschiedenen Datensätzen
  • Verwenden Sie das ARIMA-Modell, um Trends in Zeitreihendaten zu prognostizieren und zu erkennen
  • Der Wert von Datenbanken
  • Beschreiben Sie die Anwendungsfälle für verschiedene Arten von Datenbanken
  • Erläutern Sie die Unterschiede zwischen relationalen Datenbanken und dokumentenbasierten Datenbanken
  • Schreiben Sie einfache Select-Abfragen, um Daten aus einer Datenbank zu ziehen und in Pandas zu verwenden
  • Vorwärts mit Ihrer Data Science Karriere
  • Geben Sie allgemeine Modelle an, die in verschiedenen Branchen verwendet werden
  • Identifizieren Sie die Anwendungsfälle für gängige Modelle
  • Diskutieren Sie die nächsten Schritte und zusätzliche Ressourcen für das Data Science Learning
  • Flexible Klassensitzung
  • Konzentrieren Sie sich auf ein Thema, das von der Lehrkraft / Klasse ausgewählt wurde, um einen tieferen Einblick in die Datenwissenschaft in der realen Welt zu geben
  • Abschlusspräsentationen
  • Präsentieren Sie die Abschlusspräsentation an Peers, Dozenten und Gastwissenschaftler, die Stärken und Bereiche für Verbesserungen identifizieren

Finanzierungsoptionen

Benötigen Sie eine Zahlungshilfe? Unsere Finanzierungsmöglichkeiten ermöglichen Ihnen, sich auf Ihre Ziele zu konzentrieren, anstatt auf die Hindernisse, die Sie davon abhalten, sie zu erreichen.

WirLend

Bewerben Sie sich für ein zinsloses Darlehen bis zu 18 Monaten oder eine feste Gebühr Darlehen bis zu 48 Monaten⁵ Muss ein Staatsbürger von Hongkong oder ein Daueraufenthaltsberechtigter sein.
Finanzierungsoptionen unterscheiden sich in jedem Markt und sind nur für Studenten verfügbar, die in unsere Programme aufgenommen wurden.
Kontaktieren Sie einen lokalen Zulassungsbeamten für weitere Informationen.

Studiengang in:
Englisch

Siehe 12 weitere Kurse von General Assembly »

Dieser Kurs ist Campus based
Startdatum
März 2019
Apr. 2019
Duration
10 wochen
Teilzeit
Preis
3,950 USD
Deadline
Nach Standort
Nach Datum
Startdatum
Jan. 2020
Enddatum
Anmeldefrist
Startdatum
Jan. 2020
Enddatum
Anmeldefrist
Startdatum
Jan. 2020
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Aug. 2019
Enddatum
Anmeldefrist
Startdatum
Aug. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
März 2019
Enddatum
Anmeldefrist
Startdatum
Apr. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Feb. 2020
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist
Startdatum
Sept. 2019
Enddatum
Anmeldefrist

März 2019

Apr. 2019

Aug. 2019

Location
Anmeldefrist
Enddatum

Sept. 2019

Location
Anmeldefrist
Enddatum

Jan. 2020

Feb. 2020