Zurück zu allen Blogbeiträgen

XGBoost: Entscheidungsbaum vs. Lineares Modell

  • Machine Learning
  • Python
  • R
12. Januar 2018
·

Fabian Müller
COO

Einführung

Eines der Highlights der diesjährigen H2O World war ein Kaggle Grandmaster Panel. Die Teilnehmer, Gilberto Titericz (Airbnb), Mathias Müller (H2O.ai), Dmitry Larko (H2O.ai), Marios Michailidis (H2O.ai) und Mark Landry (H2O.ai), beantworteten verschiedene Fragen zu Kaggle und Data Science im Allgemeinen.

Eine der Fragen aus dem Publikum war, welche Tools und Algorithmen die Grandmasters häufig verwenden. Wie erwartet, nannte jeder einzelne von ihnen die Gradient-Boosting-Implementierung XGBoost (Chen und Guestrin 2016). Das ist nicht überraschend, da schon lange bekannt ist, dass XGBoost momentan wahrscheinlich der am häufigsten verwendete Algorithmus in der Data Science ist.

Die Popularität von XGBoost zeigt sich in zahlreichen Blogposts. Darunter Tutorials für R und Python, Hyperparameter für XGBoost und sogar die Verwendung von XGBoost mit Nvidias CUDA-GPU-Unterstützung.

Auch bei STATWORX nutzen wir die Leistungsfähigkeit von XGBoost regelmäßig für externe und interne Projekte. Eine Frage, die wir uns in letzter Zeit gestellt haben, war: Wie groß ist eigentlich der Unterschied zwischen den beiden in XGBoost angebotenen Basismodellen (auch Booster genannt)? Dieser Beitrag versucht, diese Frage systematischer zu beantworten.

Weak Learner

Gradient Boosting kann als Kombination einzelner Modelle (sogenannter Base Learner oder Weak Learner) zu einem Ensemblemodell interpretiert werden (Natekin und Knoll 2013).
Theoretisch kann jeder Base Learner im Boosting-Framework verwendet werden, wobei sich einige Base Learner als besonders nützlich erwiesen haben: Lineare und regulierte Modelle (Hastie et al. 2008), (B/P-)Splines (Huang und Yang 2004) und insbesondere Entscheidungsbäume (James et al. 2013). Zu den weniger häufig verwendeten Base Learnern gehören Random Effects (Tutz und Groll 2009), Radial Basis Functions (Gomez-Verdejo et al. 2002), Markov Random Fields (Dietterich et al. 2004) und Wavelets (Dubossarsky et al. 2016).

Chen und Guestrin (2016) beschreiben XGBoost als additive Funktion, gegeben die Daten. $D = left{ left( x_{ i }, y_{ i } right) right}$, in der folgenden Form:

$$hat{y_{ i }} = Phi(x_{ i }) = sum_{ k = 1 }^K{ f_{ k }(x_{ i }), f_{ k } } in F$$

In ihrem ursprünglichen Paper, $f_{ k }(x)forall k = 1, ... , K$ als <em>Klassifikations- oder Regressionsbaum</em> (CART) definiert. Abgesehen davon weiß der aufmerksame Leser der technischen Dokumentation, dass man die funktionale Form von $f_k(x)$ durch Verwendung des Booster-Arguments in R/Python ändern kann

# Example of XGBoost for regression in R with trees (CART)
xgboost(data = train_DMatrix,
        obj = "reg:linear".
        eval_metric = "rmse",
        booster = "gbtree")

Man kann zwischen Entscheidungsbäumen (gbtree und dart) und linearen Modellen (gblinear) wählen. Leider gibt es nur wenig Literatur über den Vergleich verschiedener Basislerner für Boosting (siehe z.B. Joshi et al. 2002). Für den Spezialfall von XGBoost gibt es unseres Wissens nach keinen systematischen Vergleich.

Simulation und Setup

Um lineare und baumbasierte Lerner zu vergleichen, schlagen wir die folgende Monte-Carlo-Simulation vor:

  • Ziehe eine Zufallszahl $n$ aus einer gleichverteilten Verteilung $[100, 2500]$.
  • Simuliere vier Datensätze, zwei für Klassifikation und zwei für Regression, jeweils mit $n$ Beobachtungen.
  • Trainiere auf jedem Datensatz ein Boosting-Modell mit Entscheidungsbaum- und linearem Basislerner.
  • Berechne eine geeignete Fehlermetrik für jedes Modell auf jedem Datensatz.
  • Wiederhole das beschriebene Verfahren $m = 100$ mal.

    Für die Simulation verwenden wir die Funktionen twoClassSim(), LPH07_1(), LPH07_2(), SLC14_1() aus dem caret-Paket. Zusätzlich zu den relevanten Merkmalen wurde eine variierende Anzahl (korrelierter) Zufallsmerkmale hinzugefügt. Beachte, dass zur Annäherung an reale Daten alle Daten­generierungs­prozesse nichtlineare Komponenten beinhalten. Für weitere Details empfehlen wir einen Blick in die Dokumentation des caret-Pakets.

    Für jeden Datensatz wenden wir dieselbe (zufällige) Aufteilungsstrategie an, wobei 70 % der Daten zum Training, 15 % zur Validierung und die letzten 15 % zum Testen verwendet werden. Bezüglich des Hyperparameter-Tunings verwenden wir eine Grid-Search-Strategie in Kombination mit 10-facher Kreuzvalidierung auf den Trainingsdaten. Unabhängig vom Typ des Basislerners wurden $L1$ (alpha) und $L2$ (lambda) Regularisierung unter Verwendung eines gemeinsamen Parameterraums abgestimmt.
    Beim Tree Boosting wurde die Lernrate (eta) konstant auf 0{,}3 gehalten, während die optimale Baumtiefe (max_depth) abgestimmt wurde. Schließlich verwendeten wir eine feste Anzahl von 1000 Boosting-Iterationen (nrounds) in Kombination mit zehn frühen Abbruchrunden (early_stopping_rounds) auf dem Validierungs-Set. Die finale Performance wurde bewertet, indem das Modell mit den besten kreuzvalidierten Parametern auf den Testdatensatz angewendet wurde.

    Ergebnisse

    Abbildung 1 und Abbildung 2 zeigen die Verteilungen der Klassifikationsfehler (AUC) und Regressionsfehler (RMSE) außerhalb der Stichprobe für beide Datensätze. Die zugehörigen zusammenfassenden Statistiken sind in Tabelle 1 zu finden.

    Tabelle 1: Zusammenfassung der Fehlermetriken nach Datensätzen und Basislernern

    Base learner Dataset Type Error metric Average error Error std.
    Linear 1 Classification AUC 0.904 0.031
    Tree 1 Classification AUC 0.934 0.090
    Linear 2 Classification AUC 0.733 0.087
    Tree 2 Classification AUC 0.730 0.062
    Linear 3 Regression RMSE 45.182 2.915
    Tree 3 Regression RMSE 17.207 9.067
    Linear 4 Regression RMSE 17.383 1.454
    Tree 4 Regression RMSE 6.595 3.104

    Für den ersten Datensatz sind die Modelle mit Tree-Learnern im Durchschnitt besser als die Modelle mit linearen Lernern. Allerdings weisen die Tree-Modelle eine größere Varianz auf. Beim zweiten Datensatz ist das Verhältnis umgekehrt. Im Durchschnitt sind die linearen Modelle etwas besser und die Tree-Modelle zeigen eine geringere Varianz.

    result-oos-classification

    Im Gegensatz zum Klassifikationsfall gibt es bei beiden Regressionsdatensätzen einen deutlichen Leistungsunterschied zugunsten der Tree-Modelle. Beim dritten Datensatz sind die Tree-Modelle im Durchschnitt besser als ihre linearen Gegenstücke. Auch die Varianz der Ergebnisse ist bei den Tree-Modellen deutlich höher. Die Ergebnisse für den vierten Datensatz sind ähnlich. Die Tree-Modelle sind erneut im Durchschnitt besser als die linearen Modelle, weisen jedoch eine höhere Streuung auf.

    result-oos-regression

    Zusammenfassung

    Die Ergebnisse einer Monte-Carlo-Simulation mit 100 künstlich erzeugten Datensätzen deuten darauf hin, dass XGBoost mit Tree- und linearen Basislernern bei Klassifikationsproblemen vergleichbare Ergebnisse liefert, während Tree-Learner bei Regressionsproblemen überlegen sind. Basierend auf diesem Ergebnis lässt sich keine allgemeingültige Empfehlung aussprechen, welches Modell verwendet werden sollte, um den Modellbias zu minimieren. Darüber hinaus leiden baumbasierte XGBoost-Modelle im Vergleich zu ihren linearen Pendants unter einer höheren Schätzvarianz. Dieser Befund steht wahrscheinlich im Zusammenhang mit dem komplexeren Parameterraum von Tree-Modellen. Der vollständige Code ist auf GitHub zu finden.

    Literatur

    Linkedin Logo
    Marcel Plaschke
    Head of Strategy, Sales & Marketing
    Beratung vereinbaren
    Zugehörige Leistungen
    No items found.

    Weitere Blogartikel

    • Coding
    • Python
    • Statistics & Methods
    Ensemble-Methoden im maschinellen Lernen: Bagging & Subagging
    Team statworx
    15.4.2025
    Mehr erfahren
    • Deep Learning
    • Python
    • Tutorial
    Verwendung von Reinforcement Learning zum Spielen von Super Mario Bros auf NES mit TensorFlow
    Sebastian Heinz
    15.4.2025
    Mehr erfahren
    • Coding
    • Machine Learning
    • R
    Abstimmung von Random Forest auf Zeitreihendaten
    Team statworx
    15.4.2025
    Mehr erfahren
    • Data Science
    • Statistics & Methods
    Modellregularisierung – The Bayesian Way
    Thomas Alcock
    15.4.2025
    Mehr erfahren
    • Coding
    • Python
    • Statistics & Methods
    Wie man Gradient Boosting um den Faktor Zwei beschleunigt
    Team statworx
    15.4.2025
    Mehr erfahren
    • Coding
    • Frontend
    • R
    Dynamische UI-Elemente in Shiny - Teil 2
    Team statworx
    15.4.2025
    Mehr erfahren
    • Coding
    • R
    Warum heißen sie so?! – Ursprung und Bedeutung von R-Paketnamen
    Team statworx
    15.4.2025
    Mehr erfahren
    • Data Engineering
    • Python
    Von überall aus auf deinen Spark-Cluster zugreifen – mit Apache Livy
    Team statworx
    15.4.2025
    Mehr erfahren
    • Coding
    • Data Engineering
    • Data Science
    Testen von REST-APIs mit Newman
    Team statworx
    14.4.2025
    Mehr erfahren
    • Data Science
    • R
    Kombination von Preiselastizitäten und Verkaufsprognosen zur Verkaufssteigerung
    Team statworx
    14.4.2025
    Mehr erfahren
    • Data Science
    • Machine Learning
    • R
    Zeitreihenvorhersage mit Random Forest
    Team statworx
    14.4.2025
    Mehr erfahren
    • Data Visualization
    • R
    Gemeinschaftsdetektion mit Louvain und Infomap
    Team statworx
    14.4.2025
    Mehr erfahren
    • Machine Learning
    Machine Learning Goes Causal II: Der kausale Bruder des Random Forests
    Team statworx
    11.4.2025
    Mehr erfahren
    • Coding
    • Data Visualization
    • R
    Animierte Diagramme mit ggplot und gganimate
    Team statworx
    8.4.2025
    Mehr erfahren
    • Artificial Intelligence
    AI Trends Report 2025: Die 16 Trends im Überblick
    Tarik Ashry
    25.2.2025
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    • GenAI
    Wie ein CustomGPT Effizienz und Kreativität bei hagebau fördert
    Tarik Ashry
    15.1.2025
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    • Human-centered AI
    Explainable AI in der Praxis: Mit der richtigen Methode die Black Box öffnen
    Jonas Wacker
    15.1.2025
    Mehr erfahren
    • Artificial Intelligence
    • GenAI
    • statworx
    Zurück in die Zukunft: Die Geschichte von Generativer KI (Episode 4)
    Tarik Ashry
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • GenAI
    • statworx
    Zurück in die Zukunft: Die Geschichte von Generativer KI (Episode 3)
    Tarik Ashry
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • GenAI
    • statworx
    Zurück in die Zukunft: Die Geschichte von Generativer KI (Episode 2)
    Tarik Ashry
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Culture
    • Data Science
    • Deep Learning
    • GenAI
    • Machine Learning
    AI Trends Report 2024: statworx COO Fabian Müller zieht eine Zwischenbilanz
    Tarik Ashry
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • GenAI
    • statworx
    Maßgeschneiderte KI-Chatbots: Hohe Leistung und schnelle Integration vereint
    Tarik Ashry
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • GenAI
    • statworx
    Zurück in die Zukunft: Die Geschichte von Generativer KI (Episode 1)
    Tarik Ashry
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Culture
    • Human-centered AI
    KI in der Arbeitswelt: Wie wir Skepsis in Zuversicht verwandeln
    Tarik Ashry
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • GenAI
    • statworx
    Generative KI als Denkmaschine? Ein medientheoretischer Blick
    Tarik Ashry
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Culture
    • Human-centered AI
    Wie Führungskräfte die Datenkultur im Unternehmen stärken können
    Tarik Ashry
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    Wie wir für Microsoft einen Chatbot mit echtem Wissen entwickelt haben
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Science
    • Data Visualization
    • Frontend Solution
    Warum Frontend-Entwicklung in Data Science-Anwendungen nützlich ist
    Jakob Gepp
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Human-centered AI
    • statworx
    the byte - Wie wir ein KI-gesteuertes Pop-up Restaurant aufgebaut haben
    Sebastian Heinz
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    • GenAI
    Die Zukunft des Customer Service: Generative KI als Erfolgsfaktor
    Tarik Ashry
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Human-centered AI
    • Strategy
    Der AI-Act ist da – diese Risikoklassen sollte man kennen
    Fabian Müller
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Human-centered AI
    • Machine Learning
    Genderdarstellung in der KI – Teil 2: Automatisierte Erzeugung genderneutraler Versionen von Gesichtsbildern
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Science
    • Human-centered AI
    • Statistics & Methods
    Die Black-Box entschlüsseln – 3 Explainable AI Methoden zur Vorbereitung auf den AI-Act
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Human-centered AI
    • Strategy
    Wie der AI-Act die KI-Branche verändern wird: Alles, was man jetzt darüber wissen muss
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Recap
    • statworx
    Big Data & AI World 2023 Recap
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    • Statistics & Methods
    Ein erster Einblick in unser Forecasting Recommender Tool
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    Vom Können, Tun und Wollen – Warum Datenkultur und Death Metal einiges miteinander gemeinsam haben
    David Schlepps
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Deep Learning
    • Machine Learning
    Wie man KI-generierte Avatare mit Hilfe von Stable Diffusion und Textual Inversion erstellt
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    • Strategy
    Das Geheimnis der Datenkultur entschlüsseln: Diese Faktoren beeinflussen Kultur und Erfolg von Unternehmen
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Human-centered AI
    • Machine Learning
    GPT-4 – Eine Einordnung der wichtigsten Neuerungen
    Mareike Flögel
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Human-centered AI
    • Strategy
    Knowledge Management mit NLP: So einfach verarbeitet man E-Mails mit KI
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Deep Learning
    • Machine Learning
    3 Anwendungsfälle, wie ChatGPT die Kommunikation in Unternehmen revolutionieren wird
    Ingo Marquart
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Machine Learning
    • Tutorial
    Paradigmenwechsel in NLP: 5 Ansätze, um bessere Prompts zu schreiben
    Team statworx
    6.12.2024
    Mehr erfahren
    • Recap
    • statworx
    Ho ho ho – weihnachtlicher Küchenabriss
    Julius Heinz
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Deep Learning
    • Machine Learning
    Real-time Computer Vision: Gesichter erkennen mit einem Roboter
    Sarah Sester
    6.12.2024
    Mehr erfahren
    • Recap
    • statworx
    statworx @ UXDX Conf 2022
    Markus Berroth
    6.12.2024
    Mehr erfahren
    • Data Engineering
    • Tutorial
    Data Engineering – From Zero to Hero
    Thomas Alcock
    6.12.2024
    Mehr erfahren
    • Recap
    • statworx
    statworx @ vuejs.de Conf 2022
    Jakob Gepp
    6.12.2024
    Mehr erfahren
    • Data Engineering
    • Data Science
    Überwachung und Protokollierung von Anwendungen und Infrastruktur: Metriken und (Ereignis-)Protokolle
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Engineering
    • Data Science
    • Python
    Wie Du Deinen Code und Deine Abhängigkeiten in Python scannst
    Thomas Alcock
    6.12.2024
    Mehr erfahren
    • Cloud Technology
    • Data Engineering
    • Data Science
    Wie du dein Data Science Projekt fit für die Cloud machst
    Alexander Broska
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Human-centered AI
    • Machine Learning
    Geschlechter­darstellung in der KI – Teil 1: Verwendung von StyleGAN zur Erforschung von Geschlechter­vielfalt bei der Bild­bearbeitung
    Isabel Hermes
    6.12.2024
    Mehr erfahren
    • R
    Das helfRlein Package – Eine Sammlung nützlicher Funktionen
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Engineering
    • Data Science
    • Machine Learning
    Data-Centric AI: Von Model-First zu Data-First KI-Prozessen
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Deep Learning
    • Human-centered AI
    • Machine Learning
    DALL-E 2: Warum Diskriminierung in der KI-Entwicklung nicht ignoriert werden kann
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Human-centered AI
    statworx AI Principles: Warum wir eigene KI-Prinzipien entwickeln
    Team statworx
    6.12.2024
    Mehr erfahren
    • Recap
    • statworx
    5 Highlights vom Digital Festival Zürich 2021
    Team statworx
    6.12.2024
    Mehr erfahren
    • Recap
    • statworx
    Unfold 2022 in Bern – by Cleverclip
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Science
    • Human-centered AI
    • Machine Learning
    • Strategy
    Warum Data Science und KI-Initiativen scheitern – eine Reflektion zu nicht-technischen Faktoren
    Team statworx
    6.12.2024
    Mehr erfahren
    • Machine Learning
    • Python
    • Tutorial
    Wie man eine Machine Learning API mit Python und Flask erstellt
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    • Human-centered AI
    • Machine Learning
    Vorurteile in KI abbauen
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Cloud Technology
    • Data Science
    • Sustainable AI
    Wie du als Data Scientist deinen KI CO₂ Fußabdruck verringerst
    Team statworx
    6.12.2024
    Mehr erfahren
    • Coding
    • Data Engineering
    Automatisierte Erstellung von Docker Containern
    Stephan Emmer
    6.12.2024
    Mehr erfahren
    • Coding
    • Data Visualization
    • R
    Anpassung der Zeit- und Datumsskalen in ggplot2
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    • Machine Learning
    5 Typen von Machine Learning Algorithmen (Mit Anwendungsfällen)
    Team statworx
    6.12.2024
    Mehr erfahren
    • Coding
    • Machine Learning
    • Python
    Data Science in Python – Der Einstieg in Machine Learning mit Scikit-Learn
    Team statworx
    6.12.2024
    Mehr erfahren
    • Recap
    • statworx
    2022 und die Reise zu statworx next
    Sebastian Heinz
    6.12.2024
    Mehr erfahren
    • Recap
    • statworx
    Als Data Science Praktikant bei statworx
    Team statworx
    6.12.2024
    Mehr erfahren
    • Coding
    • Data Science
    • Python
    Wie man mit Call Graph automatisch Projektgrafiken erstellt
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    • Human-centered AI
    • Machine Learning
    • statworx
    Kolumne: Mensch und Maschine Seite an Seite
    Sebastian Heinz
    6.12.2024
    Mehr erfahren
    • Data Engineering
    • Data Science
    • Machine Learning
    Machine Learning Modelle bereitstellen und skalieren mit Kubernetes
    Team statworx
    6.12.2024
    Mehr erfahren
    • Coding
    • Python
    • Tutorial
    statworx Cheatsheets – Python Basics Cheatsheet für Data Science
    Team statworx
    6.12.2024
    Mehr erfahren
    • Cloud Technology
    • Data Engineering
    • Machine Learning

    3 Szenarien zum Deployment von Machine Learning Workflows mittels MLflow
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Science
    • statworx
    • Strategy
    STATWORX meets DHBW – Data Science Real-World Use Cases
    Team statworx
    6.12.2024
    Mehr erfahren
    • Coding
    • Deep Learning
    Car Model Classification I: Transfer Learning mit ResNet
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Deep Learning
    • Machine Learning
    Car Model Classification IV: Integration von Deep Learning Modellen mit Dash
    Dominique Lade
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Deep Learning
    • Machine Learning

    Car Model Classification III: Erklärbarkeit von Deep Learning Modellen mit Grad-CAM
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Coding
    • Deep Learning
    Car Model Classification II: Deployment von TensorFlow-Modellen in Docker mit TensorFlow Serving
    Team statworx
    6.12.2024
    Mehr erfahren
    • AI Act
    Potenzial noch nicht ausgeschöpft – Ein Kommentar zur vorgeschlagenen KI-Regulierung der EU
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Deep Learning
    • statworx
    Creaition – Revolutionierung des Designprozesses mit Machine Learning
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Science
    • Deep Learning
    Die 5 wichtigsten Use Cases für Computer Vision
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Data Science
    • Machine Learning
    Generative Adversarial Networks: Wie mit Neuronalen Netzen Daten generiert werden können
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Engineering
    5 Technologien, die jeder Data Engineer kennen sollte
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Deep Learning
    • Machine Learning
    5 praxisnahe Beispiele für NLP Use Cases
    Team statworx
    6.12.2024
    Mehr erfahren
    • Coding
    • Data Science
    • Deep Learning
    Finetuning von Tesseract-OCR für deutsche Rechnungen
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Science
    • Deep Learning
    Neue Trends im Natural Language Processing – Wie NLP massentauglich wird
    Dominique Lade
    6.12.2024
    Mehr erfahren
    • Data Engineering
    • Data Science
    • Machine Learning
    Machine Learning Modelle mit Hilfe von Docker Containern bereitstellen
    Thomas Alcock
    6.12.2024
    Mehr erfahren
    • Frontend
    • Python
    • Tutorial
    Wie Du ein Dashboard In Python baust – Plotly Dash Step-by-Step Tutorial
    Alexander Blaufuss
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Machine Learning
    Whitepaper: Ein Reifegradmodell für Künstliche Intelligenz
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Engineering
    • R
    • Tutorial
    Wie Du ShinyApps in Docker-Images einbauen kannst
    Team statworx
    6.12.2024
    Mehr erfahren
    • Recap
    • statworx
    STATWORX 2.0 – Das neue Headquarter in Frankfurt ist eröffnet
    Julius Heinz
    6.12.2024
    Mehr erfahren
    • Coding
    • Python
    Web Scraping 101 in Python mit Requests & BeautifulSoup
    Team statworx
    6.12.2024
    Mehr erfahren
    • Artificial Intelligence
    • Deep Learning
    Deep Learning – Überblick und Einstieg
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Science
    • R
    • Statistics & Methods
    Wie man eine Kreuzvalidierung zur Evaluation der Modellperformance von Grund auf selbst erstellt
    Team statworx
    6.12.2024
    Mehr erfahren
    • Machine Learning
    • R
    • Statistics & Methods
    Was dem MAPE fälschlicherweise vorgeworfen wird, seine WAHREN Schwächen und BESSERE Alternativen!
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Visualization
    • R
    Interaktive Netzwerkvisualisierung mit R
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Science
    • Tutorial
    Eine Einführung in Dataiku DSS
    Team statworx
    6.12.2024
    Mehr erfahren
    • Coding
    • Data Visualization
    • Python
    Das häufigste Problem mit Plotly Histograms und wie man es löst
    Team statworx
    6.12.2024
    Mehr erfahren
    • Coding
    • Data Engineering
    • R
    Wie Du ein R-Skript in Docker ausführst
    Team statworx
    6.12.2024
    Mehr erfahren
    • Data Science
    • Data Visualization
    • Python
    Data Science in Python – Matplotlib – Teil 4
    Team statworx
    6.12.2024
    Mehr erfahren
    This is some text inside of a div block.
    This is some text inside of a div block.