Textdatenanalyse mit NLP und maschinellem Lernen

Textdaten auf relevante Inhalte "zwischen den Zeilen" untersuchen

​In der heutigen digitalen Welt sind enorme Mengen an Informationen in Textform verfügbar. Die Fähigkeit, diese Daten effektiv zu analysieren, ist für Fachleute in Bereichen wie IT-Forensik, Data Science und Data Analytics von entscheidender Bedeutung. Unser Kurs vermittelt Ihnen fundierte Kenntnisse in der digitalen Textdatenanalyse mit Schwerpunkten auf Natural Language Processing (NLP) und maschinellem Lernen (ML).

Sie erlernen die gesamte Verarbeitungs-Pipeline für umfangreiche Textmengen, beginnend mit der Datenakquise durch Web Crawling bis hin zur maschinenlesbaren Bereinigung und Vorverarbeitung oft unstrukturierter Textdaten. Anhand von Programmierbeispielen in Python werden Ihnen Standardmethoden des maschinellen Lernens wie Clustering und Klassifikation nähergebracht. Ein besonderer Fokus liegt auf der Interpretation der Ergebnisse und der Anwendung statistischer Methoden zur Bewertung der Güte dieser Verfahren. ​

Der Kurs kombiniert Live-Vorträge und Demonstrationen mit praktischen Programmierübungen in Jupyter-Notebooks. Unsere Expertinnen und Experten stehen Ihnen während des Seminars für Fragen zur Verfügung und bieten zudem einen zusätzlichen Tag Online-Support für die Nachbereitung an. Dieser praxisorientierte Ansatz stellt sicher, dass Sie die erlernten Methoden direkt auf Ihre spezifischen Projekte anwenden können. ​

Durch die Teilnahme an diesem Kurs erwerben Sie die Fähigkeit, relevante Informationen aus umfangreichen Textdaten zu extrahieren und zu interpretieren. Dies befähigt Sie, in Ihrem beruflichen Umfeld fundierte Entscheidungen zu treffen und komplexe Textanalysen effizient durchzuführen. 

 

Nach dem Seminar können Sie:

  • Verstehen, welche Methoden des Natural Language Processing (NLP) und des maschinellen Lernens (ML) für Ihre Projekte verfügbar sind.
  • Implementieren dieser Methoden in Python, um große Textmengen effizient zu analysieren.
  • Bewerten der Ergebnisse durch Anwendung statistischer Methoden zur Gütebestimmung der eingesetzten Verfahren.
ÜBERBLICK
Veranstaltungstyp
Online-Seminar, Offenes Format, Inhouse-Format
Format
Online
Abschluss
Teilnahmebescheinigung
Zugangsvoraussetzung
Praktische Programmiererfahrungen in Python.
Termine, Anmeldefrist und Ort
  • Wir sind aktuell in der Termin-Planung. Sie können sich auf unsere Warteliste setzen lassen, und werden informiert, sobald ein Termin feststeht.
Dauer/ Ablauf
20 Stunden an 4 Tagen / Jeweils von 10:00 bis 15:30 Uhr
Sprache
Deutsch
Teilnahmegebühr
1.500,00 € (zzgl. MwSt.)
ZIELGRUPPE - diese Seminar ist genau richtig für:
  • Forensiker*innen und Ermittler*innen
  • IT-Sicherheitsexpert*innen
  • Data Science & Data Analytics
  • Data Journalists
  • Social Media Manager
  • Marketing Experts
  • Financial Analysts
KURSINHALTE - diese Themen erarbeiten Sie im Seminar:
  • Crawling nach Textdaten im Internet
  • Korpuserstellung und -strukturierung
  • Datenbereinigung
  • Preprocessing
  • Grundlagen des ML in der Textdatenanalyse: Datenrepräsentation, Klassifikationsverfahren, Hyperparameter
  • Interpretierbarkeit von ML-Modellen
  • Evaluierung Ihrer Ergebnisse
  • Überblick über Anwendungen: Autorschaftsanalyse, Topic Modeling und Sentiment-Analyse
  • Tipps zu Literatur und externen Informationsquellen

Zu allen Kursteilen: Programmier-Beispiele in Python als Jupyter-Notebooks zur eigenen Bearbeitung, mit Betreuung durch unsere Expert*innen

Ihre TRAINER*INNEN

Jeong-Eun Choi, Lukas Graner, Karla Schäfer

Die Trainer*innen und Expert*innen im Bereich ML und NLP (wissenschaftliche Mitarbeitende aus dem Bereich "Media Security & IT-Forensics")

Referenzen:

  • Forschungsprojekte zum Thema Fakenews in Textform im Internet
  • Paper Award im „Digital Forensics Workshop (WSDF)” auf der ARES-Konferenz 2020 für eine Arbeit zu Autorschaftsanalyse
  • 3. Platz im internationalen Textforensik-Wettbewerb „Profiling Fake News Spreaders on Twitter (2020 Edition)“ auf der „PAN at CLEF“-Konferenz mit einer Arbeit zum Erkennen von Desinformation

Diese Kurse könnten Sie auch interessieren:

 

Online oder Präsenz

Open Source Intelligence für Behörden

Für Fachkräfte aus Behörden, die ihre Fähigkeiten in digitaler Forensik und Open-Source-Recherche ausbauen möchten. Der Kurs vermittelt praxisnahes Wissen zu OSINT-Tools, Metadatenanalyse und rechtlichen Aspekten – ideal, um moderne Ermittlungsverfahren effizient umzusetzen.

 

Online

Einführung in die Datenträger-Forensik

Erwerben Sie fundierte Kenntnisse zur Analyse digitaler Beweise. Lernen Sie, Beweismittel zu sichern, gelöschte Daten wiederherzustellen und forensische Untersuchungen gerichtsfest zu dokumentieren. Ideal für Fachkräfte in IT-Sicherheit, Compliance und Strafverfolgung.

 

Präsenz

Einführung in Darknet und Kryptowährung

Erweitern Sie Ihr Wissen über das Darknet und Kryptowährungen. Der Kurs zeigt praxisnah, wie man sich sicher im Tor-Netzwerk bewegt und Blockchain sowie Kryptografie anwendet. Er richtet sich an Ermittler, IT-Sicherheitsexperten und Journalisten, die diese Technologien verstehen möchten.

 

Präsenz

Forensische Echtheitsprüfung für Digitalfotos und -videos

Vertiefen Sie Ihre Fähigkeiten in der Bild- und Videoforensik. Lernen Sie, digitale Medien auf Manipulationen wie Deepfakes zu überprüfen und Metadaten zu analysieren. Der Kurs ist ideal für Forensiker, Ermittler und Journalisten, die Echtheiten verifizieren und Fakenews bekämpfen wollen.

Kontakt

 

Ansprechpartner Fachliches

Dr. Sascha Zmudzinski

 

Fraunhofer SIT

Telefon: +49 6151 869-321

 

Ansprechpartner Organisatorisches

Adem Salgin

 

Fraunhofer Academy

Telefon: +49 89 1205-1555