ZurĂŒck zu allen BlogbeitrĂ€gen

Zero-Shot Textklassifikation

  • Coding
  • Data Science
  • Machine Learning
29. September 2022
·

Fabian MĂŒller
COO

Die Textklassifikation ist eine der hĂ€ufigsten Anwendungen der natĂŒrlichen Sprachverarbeitung (NLP). Sie besteht darin, einem Textausschnitt eine Reihe vordefinierter Kategorien zuzuweisen. Je nach Art des Problems kann der Textausschnitt ein Satz, ein Absatz oder sogar ein ganzes Dokument sein. Es gibt viele potenzielle Anwendungen der Textklassifikation in der realen Welt, aber zu den hĂ€ufigsten gehören Sentiment-Analyse, Themenmodellierung und Absicht, Spam- und Hassrede-Erkennung.

Der Standardansatz zur Textklassifikation besteht darin, einen Klassifikator in einem ĂŒberwachten Regime zu trainieren. Dazu benötigt man Paare aus Text und zugehörigen Kategorien (auch Labels genannt) aus dem interessierenden Bereich als Trainingsdaten. Dann kann ein beliebiger Klassifikator (z.B. ein neuronales Netzwerk) eine Zuordnungsfunktion vom Text zur wahrscheinlichsten Kategorie lernen. WĂ€hrend dieser Ansatz in vielen Situationen gut funktionieren kann, hĂ€ngt seine DurchfĂŒhrbarkeit stark von der VerfĂŒgbarkeit dieser handbeschrifteten Trainingsdatenpaare ab.

Auch wenn vortrainierte Sprachmodelle wie BERT die benötigte Datenmenge reduzieren können, machen sie diese nicht vollstĂ€ndig ĂŒberflĂŒssig. Daher bleibt die DatenverfĂŒgbarkeit fĂŒr Anwendungen in der realen Welt die grĂ¶ĂŸte HĂŒrde.

Zero-Shot-Lernen

Es gibt zwar verschiedene Definitionen des Zero-Shot-Lernens1, aber im Allgemeinen kann es als ein Regime definiert werden, in dem ein Modell eine Aufgabe löst, auf die es zuvor nicht explizit trainiert wurde.

Es ist wichtig zu verstehen, dass eine „Aufgabe“ sowohl im weiteren als auch im engeren Sinne definiert werden kann: Zum Beispiel zeigten die Autoren von GPT-2, dass ein auf Sprachgenerierung trainiertes Modell auf völlig neue nachgelagerte Aufgaben wie maschinelle Übersetzung2 angewendet werden kann. Gleichzeitig wĂ€re eine engere Definition der Aufgabe, zuvor ungesehene Kategorien in Bildern zu erkennen, wie im OpenAI CLIP-Papier3 gezeigt.

Aber was all diese AnsĂ€tze gemeinsam haben, ist die Idee der Extrapolation gelernter Konzepte ĂŒber das Trainingsregime hinaus. Ein mĂ€chtiges Konzept, weil es die Lösbarkeit einer Aufgabe von der VerfĂŒgbarkeit von (beschrifteten) Trainingsdaten entkoppelt.

Zero-Shot-Lernen fĂŒr Textklassifikation

Die Lösung von Textklassifikationsaufgaben mit Zero-Shot-Lernen kann als gutes Beispiel dafĂŒr dienen, wie man die Extrapolation gelernter Konzepte ĂŒber das Trainingsregime hinaus anwenden kann. Eine Möglichkeit, dies zu tun, ist die Verwendung von natĂŒrlicher Sprachinferenz (NLI) wie von Yin et al. (2019)4 vorgeschlagen. Es gibt auch andere AnsĂ€tze, wie die Berechnung von AbstĂ€nden zwischen Text-Einbettungen oder die Formulierung des Problems als LĂŒckentext.

Bei NLI besteht die Aufgabe darin zu bestimmen, ob eine Hypothese in Anbetracht einer PrÀmisse5 wahr (entailment), falsch (contradiction) oder unbestimmt (neutral) ist. Ein typischer NLI-Datensatz besteht aus Satzpaaren mit zugehörigen Labels in der folgenden Form:

Beispiele von http://nlpprogress.com/english/natural_language_inference.html

Yin et al. (2019) schlugen vor, große Sprachmodelle wie BERT, die auf NLI-DatensĂ€tzen trainiert sind, zu nutzen und ihre SprachverstĂ€ndnisfĂ€higkeiten fĂŒr die Zero-Shot-Textklassifikation auszunutzen. Dies kann geschehen, indem man den interessierenden Text als PrĂ€misse nimmt und fĂŒr jede potenzielle Kategorie eine Hypothese formuliert, indem man eine sogenannte Hypothesen-Vorlage verwendet. Dann lĂ€sst man das NLI-Modell vorhersagen, ob die PrĂ€misse die Hypothese beinhaltet. Schließlich kann die vorhergesagte Wahrscheinlichkeit der Einbeziehung als Wahrscheinlichkeit des Labels interpretiert werden.

Zero-Shot-Textklassifikation mit Hugging Face đŸ€—

Lass uns die oben formulierte Idee genauer untersuchen, indem wir die hervorragende Hugging Face-Implementierung fĂŒr Zero-Shot-Textklassifikation verwenden.

Wir sind daran interessiert, den untenstehenden Satz in vordefinierte Themen zu klassifizieren:

topics = ['Web', 'Panorama', 'International', 'Wirtschaft', 'Sport', 'Inland', 'Etat', 'Wissenschaft', 'Kultur']
test_txt = 'Eintracht Frankfurt gewinnt die Europa League nach 6:5-Erfolg im Elfmeterschießen gegen die Glasgow Rangers'

‍

Dank der đŸ€— Pipeline-Abstraktion mĂŒssen wir die Vorhersageaufgabe nicht selbst definieren. Wir mĂŒssen lediglich eine Pipeline instanziieren und die Aufgabe als zero-shot-text-classification definieren. Die Pipeline kĂŒmmert sich um die Formulierung der PrĂ€misse und Hypothese sowie um den Umgang mit den Logits und Wahrscheinlichkeiten aus dem Modell.

Wie oben geschrieben, benötigen wir ein Sprachmodell, das auf einer NLI-Aufgabe vortrainiert wurde. Das Standardmodell fĂŒr Zero-Shot-Textklassifikation in đŸ€— ist bart-large-mnli. BART ist ein Transformer-Encoder-Decoder fĂŒr Sequenz-zu-Sequenz-Modellierung mit einem bidirektionalen (BERT-Ă€hnlichen) Encoder und einem autoregressiven (GPT-Ă€hnlichen) Decoder6. Das mnli-Suffix bedeutet, dass BART anschließend auf dem MultiNLI-Datensatz7 weiter trainiert wurde.

Da wir jedoch deutsche SĂ€tze verwenden und BART nur Englisch unterstĂŒtzt, mĂŒssen wir das Standardmodell durch ein benutzerdefiniertes Modell ersetzen. Dank des đŸ€— Modell-Hubs ist es ziemlich einfach, einen geeigneten Kandidaten zu finden. In unserem Fall ist mDeBERTa-v3-base-xnli-multilingual-nli-2mil7 ein solcher Kandidat. Lass uns den Namen kurz entschlĂŒsseln fĂŒr ein besseres VerstĂ€ndnis: Es ist eine mehrsprachige Version von DeBERTa-v3-base (das selbst eine verbesserte Version von BERT/RoBERTa8 ist), die anschließend auf zwei cross-lingualen NLI-DatensĂ€tzen (XNLI9 und multilingual-NLI-26lang10) weiter trainiert wurde.

Mit der richtigen Aufgabe und dem richtigen Modell können wir nun die Pipeline instanziieren:

from transformers import pipeline
model = 'MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7'
pipe = pipeline(task='zero-shot-classification', model=model, tokenizer=model)

‍

Als nĂ€chstes rufen wir die Pipeline auf, um die wahrscheinlichste Kategorie unseres Textes basierend auf den Kandidaten vorherzusagen. Aber als letzten Schritt mĂŒssen wir auch die Standard-Hypothesen-Vorlage ersetzen. Dies ist notwendig, da die Standardvorlage wieder auf Englisch ist. Daher definieren wir die Vorlage als 'Das Thema ist {}'. Beachte, dass {} ein Platzhalter fĂŒr die zuvor definierten Themenkandidaten ist. Du kannst jede Vorlage definieren, die dir gefĂ€llt, solange sie einen Platzhalter fĂŒr die Kandidaten enthĂ€lt:

template_de = 'Das Thema ist {}'
prediction = pipe(test_txt, topics, hypothesis_template=template_de)


Schließlich können wir die Vorhersage aus der Pipeline bewerten. Der untenstehende Code gibt die drei wahrscheinlichsten Themen zusammen mit ihren vorhergesagten Wahrscheinlichkeiten aus:

print(f'Zero-shot prediction for: \n {prediction["sequence"]}')
top_3 = zip(prediction['labels'][0:3], prediction['scores'][0:3])
for label, score in top_3:
    print(f'{label} - {score:.2%}')
Zero-shot prediction for: 
 Eintracht Frankfurt gewinnt die Europa League nach 6:5-Erfolg im Elfmeterschießen gegen die Glasgow Rangers
Sport - 77.41%
International - 15.69%
Inland - 5.29%


Wie man sehen kann, liefert das Zero-Shot-Modell ein vernĂŒnftiges Ergebnis, wobei „Sport“ das wahrscheinlichste Thema ist, gefolgt von „International“ und „Inland“.

Unten sind einige weitere Beispiele aus anderen Kategorien. Wie zuvor sind die Ergebnisse insgesamt recht vernĂŒnftig. Beachte, wie das Modell fĂŒr den zweiten Text eine unerwartet niedrige Wahrscheinlichkeit fĂŒr „Kultur“ vorhersagt.

further_examples = ['Verbraucher halten sich wegen steigender Zinsen und Inflation beim Immobilienkauf zurĂŒck',
                    '„Die bitteren TrĂ€nen der Petra von Kant“ von 1972 geschlechtsumgewandelt und neu verfilmt',
                    'Eine 541 Millionen Jahre alte fossile Alge weist erstaunliche Ähnlichkeit zu noch heute existierenden Vertretern auf']

for txt in further_examples:
    prediction = pipe(txt, topics, hypothesis_template=template_de)
    print(f'Zero-shot prediction for: \n {prediction["sequence"]}')
    top_3 = zip(prediction['labels'][0:3], prediction['scores'][0:3])
    for label, score in top_3:
        print(f'{label} - {score:.2%}')
Zero-shot prediction for: 
  Verbraucher halten sich wegen steigender Zinsen und Inflation beim Immobilienkauf zurĂŒck 
Wirtschaft - 96.11% 
Inland - 1.69% 
Panorama - 0.70% 

Zero-shot prediction for: 
  „Die bitteren TrĂ€nen der Petra von Kant“ von 1972 geschlechtsumgewandelt und neu verfilmt 
International - 50.95% 
Inland - 16.40% 
Kultur - 7.76% 

Zero-shot prediction for: 
  Eine 541 Millionen Jahre alte fossile Alge weist erstaunliche Ähnlichkeit zu noch heute existierenden Vertretern auf 
Wissenschaft - 67.52% 
Web - 8.14% 
Inland - 6.91%

‍
Der gesamte Code kann auf GitHub gefunden werden. Neben den oben genannten Beispielen findest du dort auch Anwendungen der Zero-Shot-Textklassifikation auf zwei beschrifteten DatensĂ€tzen, einschließlich einer Bewertung der Genauigkeit. DarĂŒber hinaus habe ich einige Prompt-Tuning durchgefĂŒhrt, indem ich mit der Hypothesen-Vorlage experimentiert habe.

Abschließende Gedanken

Zero-Shot-Textklassifikation bietet einen geeigneten Ansatz, wenn entweder Trainingsdaten begrenzt (oder sogar nicht vorhanden) sind oder als einfach zu implementierende Benchmark fĂŒr anspruchsvollere Methoden. WĂ€hrend explizite AnsĂ€tze, wie das Feinabstimmen großer vortrainierter Modelle, sicherlich immer noch implizite AnsĂ€tze wie das Zero-Shot-Lernen ĂŒbertreffen, macht ihre universelle Anwendbarkeit sie sehr attraktiv.

DarĂŒber hinaus sollten wir erwarten, dass Zero-Shot-Lernen im Allgemeinen in den nĂ€chsten Jahren wichtiger wird. Dies liegt daran, dass sich die Art und Weise, wie wir Modelle zur Lösung von Aufgaben verwenden werden, mit der zunehmenden Bedeutung großer vortrainierter Modelle weiterentwickeln wird. Daher plĂ€diere ich dafĂŒr, dass Zero-Shot-Techniken bereits heute Teil des Werkzeugsatzes eines modernen Datenwissenschaftlers sein sollten

Quellen:

1 https://joeddav.github.io/blog/2020/05/29/ZSL.html
2 https://d4mucfpksywv.cloudfront.net/better-language-models/language_models_are_unsupervised_multitask_learners.pdf
3 https://arxiv.org/pdf/2103.00020.pdf
4 https://arxiv.org/pdf/1909.00161.pdf
5
http://nlpprogress.com/english/natural_language_inference.html
6
https://arxiv.org/pdf/1910.13461.pdf
7
https://huggingface.co/datasets/multi_nli
8 https://arxiv.org/pdf/2006.03654.pdf
9
https://huggingface.co/datasets/xnli
10 https://huggingface.co/datasets/MoritzLaurer/multilingual-NLI-26lang-2mil7

‍

Linkedin Logo
Marcel Plaschke
Head of Strategy, Sales & Marketing
Beratung vereinbaren
Zugehörige Leistungen
No items found.

Weitere Blogartikel

  • Coding
  • Python
Making Of: Eine kostenlose API fĂŒr COVID-19-Daten
Sebastian Heinz
17.4.2025
Mehr erfahren
  • Coding
  • Python
  • R
R und Python: Mit Reticulate das Beste aus beiden Welten nutzen
Team statworx
17.4.2025
Mehr erfahren
  • Coding
  • Frontend
  • R
Einstieg in Flexdashboards in R
Thomas Alcock
17.4.2025
Mehr erfahren
  • Artificial Intelligence
  • Machine Learning
  • Statistics & Methods
Machine Learning Goes Causal I: Warum KausalitÀt wichtig ist
Team statworx
17.4.2025
Mehr erfahren
  • Coding
  • Data Visualization
  • R
Koordinatensysteme in ggplot2: Leicht ĂŒbersehen und ziemlich unterschĂ€tzt
Team statworx
17.4.2025
Mehr erfahren
  • Data Engineering
  • R
  • Tutorial
Wie man REST-APIs mit R Plumber erstellt
Stephan Emmer
17.4.2025
Mehr erfahren
  • Coding
  • Frontend
  • R
Dynamische UI Elemente in Shiny – Teil 1
Team statworx
17.4.2025
Mehr erfahren
  • Recaps
  • statworx
statworx 2019 – Ein JahresrĂŒckblick
Sebastian Heinz
17.4.2025
Mehr erfahren
  • Recap
  • statworx
STATWORX auf Tour: Wein, Burgen & Wandern!
Team statworx
17.4.2025
Mehr erfahren
  • Recap
  • statworx
Auf zu neuen Abenteuern: Soft Opening des STATWORX BĂŒros
Team statworx
17.4.2025
Mehr erfahren
  • Recap
  • statworx
STATWORX on Tour: Year-End-Event in Belgien
Sebastian Heinz
17.4.2025
Mehr erfahren
  • Recap
  • statworx
statworx Sommer-Barbecue 2019
Team statworx
17.4.2025
Mehr erfahren
  • Coding
  • R
  • Tutorial
R Code in Sublime Text kompilieren
Team statworx
17.4.2025
Mehr erfahren
  • Coding
  • R
  • Tutorial
Gestalten Sie RStudio nach Ihren WĂŒnschen – Denn Schönheit zĂ€hlt
Team statworx
17.4.2025
Mehr erfahren
  • Recaps
  • statworx
2020 – Ein RĂŒckblick fĂŒr mich und GPT-3
Sebastian Heinz
17.4.2025
Mehr erfahren
  • Coding
  • R
Master R Shiny: Ein Trick zum Aufbau wartbarer und skalierbarer Ereignisketten
Team statworx
17.4.2025
Mehr erfahren
  • Coding
  • Python
  • Statistics & Methods
Ensemble-Methoden im maschinellen Lernen: Bagging & Subagging
Team statworx
15.4.2025
Mehr erfahren
  • Deep Learning
  • Python
  • Tutorial
Verwendung von Reinforcement Learning zum Spielen von Super Mario Bros auf NES mit TensorFlow
Sebastian Heinz
15.4.2025
Mehr erfahren
  • Coding
  • Machine Learning
  • R
Abstimmung von Random Forest auf Zeitreihendaten
Team statworx
15.4.2025
Mehr erfahren
  • Data Science
  • Statistics & Methods
Modellregularisierung – The Bayesian Way
Thomas Alcock
15.4.2025
Mehr erfahren
  • Coding
  • Python
  • Statistics & Methods
Wie man Gradient Boosting um den Faktor Zwei beschleunigt
Team statworx
15.4.2025
Mehr erfahren
  • Coding
  • Frontend
  • R
Dynamische UI-Elemente in Shiny - Teil 2
Team statworx
15.4.2025
Mehr erfahren
  • Coding
  • R
Warum heißen sie so?! – Ursprung und Bedeutung von R-Paketnamen
Team statworx
15.4.2025
Mehr erfahren
  • Data Engineering
  • Python
Von ĂŒberall aus auf deinen Spark-Cluster zugreifen – mit Apache Livy
Team statworx
15.4.2025
Mehr erfahren
  • Coding
  • Data Engineering
  • Data Science
Testen von REST-APIs mit Newman
Team statworx
14.4.2025
Mehr erfahren
  • Machine Learning
  • Python
  • R
XGBoost: Entscheidungsbaum vs. Lineares Modell
Fabian MĂŒller
14.4.2025
Mehr erfahren
  • Data Science
  • R
Kombination von PreiselastizitÀten und Verkaufsprognosen zur Verkaufssteigerung
Team statworx
14.4.2025
Mehr erfahren
  • Data Science
  • Machine Learning
  • R
Zeitreihenvorhersage mit Random Forest
Team statworx
14.4.2025
Mehr erfahren
  • Data Visualization
  • R
Gemeinschaftsdetektion mit Louvain und Infomap
Team statworx
14.4.2025
Mehr erfahren
  • Machine Learning
Machine Learning Goes Causal II: Der kausale Bruder des Random Forests
Team statworx
11.4.2025
Mehr erfahren
  • Coding
  • Data Visualization
  • R
Animierte Plots mit ggplot und gganimate
Team statworx
8.4.2025
Mehr erfahren
  • Artificial Intelligence
AI Trends Report 2025: Die 16 Trends im Überblick
Tarik Ashry
25.2.2025
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • GenAI
Wie ein CustomGPT Effizienz und KreativitÀt bei hagebau fördert
Tarik Ashry
15.1.2025
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Human-centered AI
Explainable AI in der Praxis: Mit der richtigen Methode die Black Box öffnen
Jonas Wacker
15.1.2025
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
ZurĂŒck in die Zukunft: Die Geschichte von Generativer KI (Episode 4)
Tarik Ashry
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
ZurĂŒck in die Zukunft: Die Geschichte von Generativer KI (Episode 3)
Tarik Ashry
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
ZurĂŒck in die Zukunft: Die Geschichte von Generativer KI (Episode 2)
Tarik Ashry
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Culture
  • Data Science
  • Deep Learning
  • GenAI
  • Machine Learning
AI Trends Report 2024: statworx COO Fabian MĂŒller zieht eine Zwischenbilanz
Tarik Ashry
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
Maßgeschneiderte KI-Chatbots: Hohe Leistung und schnelle Integration vereint
Tarik Ashry
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
ZurĂŒck in die Zukunft: Die Geschichte von Generativer KI (Episode 1)
Tarik Ashry
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Culture
  • Human-centered AI
KI in der Arbeitswelt: Wie wir Skepsis in Zuversicht verwandeln
Tarik Ashry
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
Generative KI als Denkmaschine? Ein medientheoretischer Blick
Tarik Ashry
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Culture
  • Human-centered AI
Wie FĂŒhrungskrĂ€fte die Datenkultur im Unternehmen stĂ€rken können
Tarik Ashry
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
Wie wir fĂŒr Microsoft einen Chatbot mit echtem Wissen entwickelt haben
Team statworx
6.12.2024
Mehr erfahren
  • Data Science
  • Data Visualization
  • Frontend Solution
Warum Frontend-Entwicklung in Data Science-Anwendungen nĂŒtzlich ist
Jakob Gepp
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • statworx
the byte - Wie wir ein KI-gesteuertes Pop-up Restaurant aufgebaut haben
Sebastian Heinz
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Strategy
Der AI-Act ist da – diese Risikoklassen sollte man kennen
Fabian MĂŒller
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Machine Learning
Genderdarstellung in der KI – Teil 2: Automatisierte Erzeugung genderneutraler Versionen von Gesichtsbildern
Team statworx
6.12.2024
Mehr erfahren
  • Data Science
  • Human-centered AI
  • Statistics & Methods
Die Black-Box entschlĂŒsseln – 3 Explainable AI Methoden zur Vorbereitung auf den AI-Act
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Strategy
Wie der AI-Act die KI-Branche verĂ€ndern wird: Alles, was man jetzt darĂŒber wissen muss
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Recap
  • statworx
Big Data & AI World 2023 Recap
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Statistics & Methods
Ein erster Einblick in unser Forecasting Recommender Tool
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
Vom Können, Tun und Wollen – Warum Datenkultur und Death Metal einiges miteinander gemeinsam haben
David Schlepps
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
Wie man KI-generierte Avatare mit Hilfe von Stable Diffusion und Textual Inversion erstellt
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Strategy
Das Geheimnis der Datenkultur entschlĂŒsseln: Diese Faktoren beeinflussen Kultur und Erfolg von Unternehmen
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Machine Learning
GPT-4 – Eine Einordnung der wichtigsten Neuerungen
Mareike Flögel
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Strategy
Knowledge Management mit NLP: So einfach verarbeitet man E-Mails mit KI
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
3 AnwendungsfÀlle, wie ChatGPT die Kommunikation in Unternehmen revolutionieren wird
Ingo Marquart
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Machine Learning
  • Tutorial
Paradigmenwechsel in NLP: 5 AnsÀtze, um bessere Prompts zu schreiben
Team statworx
6.12.2024
Mehr erfahren
  • Recap
  • statworx
Ho ho ho – weihnachtlicher KĂŒchenabriss
Julius Heinz
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
Real-time Computer Vision: Gesichter erkennen mit einem Roboter
Sarah Sester
6.12.2024
Mehr erfahren
  • Recap
  • statworx
statworx @ UXDX Conf 2022
Markus Berroth
6.12.2024
Mehr erfahren
  • Data Engineering
  • Tutorial
Data Engineering – From Zero to Hero
Thomas Alcock
6.12.2024
Mehr erfahren
  • Recap
  • statworx
statworx @ vuejs.de Conf 2022
Jakob Gepp
6.12.2024
Mehr erfahren
  • Data Engineering
  • Data Science
Überwachung und Protokollierung von Anwendungen und Infrastruktur: Metriken und (Ereignis-)Protokolle
Team statworx
6.12.2024
Mehr erfahren
  • Data Engineering
  • Data Science
  • Python
Wie Du Deinen Code und Deine AbhÀngigkeiten in Python scannst
Thomas Alcock
6.12.2024
Mehr erfahren
  • Cloud Technology
  • Data Engineering
  • Data Science
Wie du dein Data Science Projekt fit fĂŒr die Cloud machst
Alexander Broska
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Machine Learning
Geschlechter­darstellung in der KI – Teil 1: Verwendung von StyleGAN zur Erforschung von Geschlechter­vielfalt bei der Bild­bearbeitung
Isabel Hermes
6.12.2024
Mehr erfahren
  • R
Das helfRlein Package – Eine Sammlung nĂŒtzlicher Funktionen
Team statworx
6.12.2024
Mehr erfahren
  • Data Engineering
  • Data Science
  • Machine Learning
Data-Centric AI: Von Model-First zu Data-First KI-Prozessen
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Human-centered AI
  • Machine Learning
DALL-E 2: Warum Diskriminierung in der KI-Entwicklung nicht ignoriert werden kann
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
statworx AI Principles: Warum wir eigene KI-Prinzipien entwickeln
Team statworx
6.12.2024
Mehr erfahren
  • Recap
  • statworx
5 Highlights vom Digital Festival ZĂŒrich 2021
Team statworx
6.12.2024
Mehr erfahren
  • Recap
  • statworx
Unfold 2022 in Bern – by Cleverclip
Team statworx
6.12.2024
Mehr erfahren
  • Data Science
  • Human-centered AI
  • Machine Learning
  • Strategy
Warum Data Science und KI-Initiativen scheitern – eine Reflektion zu nicht-technischen Faktoren
Team statworx
6.12.2024
Mehr erfahren
  • Machine Learning
  • Python
  • Tutorial
Wie man eine Machine Learning API mit Python und Flask erstellt
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Human-centered AI
  • Machine Learning
Vorurteile in KI abbauen
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Cloud Technology
  • Data Science
  • Sustainable AI
Wie du als Data Scientist deinen KI CO₂ Fußabdruck verringerst
Team statworx
6.12.2024
Mehr erfahren
  • Coding
  • Data Engineering
Automatisierte Erstellung von Docker Containern
Stephan Emmer
6.12.2024
Mehr erfahren
  • Coding
  • Data Visualization
  • R
Anpassung der Zeit- und Datumsskalen in ggplot2
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Machine Learning
5 Typen von Machine Learning Algorithmen (Mit Anwendungsfällen)
Team statworx
6.12.2024
Mehr erfahren
  • Coding
  • Machine Learning
  • Python
Data Science in Python – Der Einstieg in Machine Learning mit Scikit-Learn
Team statworx
6.12.2024
Mehr erfahren
  • Recap
  • statworx
2022 und die Reise zu statworx next
Sebastian Heinz
6.12.2024
Mehr erfahren
  • Recap
  • statworx
Als Data Science Praktikant bei statworx
Team statworx
6.12.2024
Mehr erfahren
  • Coding
  • Data Science
  • Python
Wie man mit Call Graph automatisch Projektgrafiken erstellt
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Human-centered AI
  • Machine Learning
  • statworx
Kolumne: Mensch und Maschine Seite an Seite
Sebastian Heinz
6.12.2024
Mehr erfahren
  • Data Engineering
  • Data Science
  • Machine Learning
Machine Learning Modelle bereitstellen und skalieren mit Kubernetes
Team statworx
6.12.2024
Mehr erfahren
  • Coding
  • Python
  • Tutorial
statworx Cheatsheets – Python Basics Cheatsheet fĂŒr Data Science
Team statworx
6.12.2024
Mehr erfahren
  • Cloud Technology
  • Data Engineering
  • Machine Learning

‍

3 Szenarien zum Deployment von Machine Learning Workflows mittels MLflow
Team statworx
6.12.2024
Mehr erfahren
  • Data Science
  • statworx
  • Strategy
STATWORX meets DHBW – Data Science Real-World Use Cases
Team statworx
6.12.2024
Mehr erfahren
  • Coding
  • Deep Learning
Car Model Classification I: Transfer Learning mit ResNet
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
Car Model Classification IV: Integration von Deep Learning Modellen mit Dash
Dominique Lade
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning

‍

Car Model Classification III: ErklÀrbarkeit von Deep Learning Modellen mit Grad-CAM
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Coding
  • Deep Learning
Car Model Classification II: Deployment von TensorFlow-Modellen in Docker mit TensorFlow Serving
Team statworx
6.12.2024
Mehr erfahren
  • AI Act
Potenzial noch nicht ausgeschöpft – Ein Kommentar zur vorgeschlagenen KI-Regulierung der EU
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • statworx
Creaition – Revolutionierung des Designprozesses mit Machine Learning
Team statworx
6.12.2024
Mehr erfahren
  • Data Science
  • Deep Learning
Die 5 wichtigsten Use Cases fĂŒr Computer Vision
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Machine Learning
Generative Adversarial Networks: Wie mit Neuronalen Netzen Daten generiert werden können
Team statworx
6.12.2024
Mehr erfahren
  • Data Engineering
5 Technologien, die jeder Data Engineer kennen sollte
Team statworx
6.12.2024
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
5 praxisnahe Beispiele fĂŒr NLP Use Cases
Team statworx
6.12.2024
Mehr erfahren
This is some text inside of a div block.
This is some text inside of a div block.