
Natural Language Processing
Was es ist und was man darüber wissen sollte
Die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) ist ein Teilbereich der Artificial Intelligence. Sie soll Computer in die Lage versetzen, menschliche Sprache zu verstehen, zu interpretieren und zu manipulieren. NLP will die Lücke zwischen menschlicher Kommunikation und den Sprachverarbeitungsfähigkeiten von Computern schließen und greift dazu auf eine Vielzahl von Disziplinen zurück, unter anderem die Informatik und die Computerlinguistik.
Entwicklung von Natural Language Processing
Natural Language Processing ist keine neue wissenschaftliche Disziplin, aber die Technologie entwickelt sich gerade schnell weiter – angetrieben von einem verstärkten Interesse an der Kommunikation zwischen Mensch und Maschine sowie der Verfügbarkeit von Big Data, hoher Rechenleistung und verbesserten Algorithmen.
Menschen kommunizieren, ob mündlich oder schriftlich, in Sprachen wie Deutsch, Englisch, Spanisch oder Chinesisch. Die „Sprache“ eines Computers – der Maschinencode oder die Maschinensprache – ist für die meisten Menschen dagegen weitgehend unverständlich. Auf der untersten Ebene erfolgt die Kommunikation in einem Computer nicht in Form von Worten, sondern mit Millionen von Nullen und Einsen, die logische Aktionen hervorbringen.
Tatsächlich nutzten Programmierer:innen vor Jahrzehnten Lochkarten für die Kommunikation mit den ersten Computern. Mit diesem in mühsamer Handarbeit ausgeführten Prozess waren nur relativ wenige Menschen vertraut. Heutzutage können Sie generative AI-Modelle (GenAI) wie ChatGPT verwenden, um Code zu erstellen, neue Ideen zu brainstormen oder Forschungsthemen zusammenzufassen.
Diese Technologie ist nur dank großen Sprachmodellen (Large Language Model, LLM) möglich, die NLP zusammen mit anderen AI-Elementen wie maschinellem Lernen und Deep Learning verwenden.
Synthetische Daten und ihre vielfältigen Einsatzmöglichkeiten
Künstlich erzeugter Text wird oft mit NLP-Modellen verwendet. Möchten Sie mehr darüber erfahren, was synthetische Daten sind, warum sie so wertvoll sind und wie sie heute genutzt werden? Sehen Sie sich dieses Video mit Brett Wujek an, der bei SAS die Produktstrategie für AI-Technologien der nächsten Generation leitet, und erfahren Sie, warum synthetische Daten für die Zukunft so wichtig sind.

NLP in der Welt von heute
Warum ist NLP so wichtig?
Kia nutzt AI und fortschrittliche Analytics, um Informationen aus Kundenfeedback zu extrahieren
Kia Motors America sammelt regelmäßig Feedback von Fahrzeugbesitzer:innen mithilfe von Fragebögen, um Qualitätsprobleme zu ermitteln und Produkte zu verbessern. Aber das Interpretieren und Kategorisieren von Kundenfeedback kann schwierig sein. Mit Natural Language Processing von SAS kann Kia das Feedback entschlüsseln. Ein NLP-Modell kategorisiert und erkennt automatisch die Art der Beschwerde in den Antworten, so dass Qualitätsprobleme im Entwicklungs- und Fertigungsprozess bestehender und zukünftiger Fahrzeuge berücksichtigt werden können.
Wie funktioniert NLP?
Aufschlüsseln von Sprache in ihre elementaren Bestandteile
Natural Language Processing umfasst verschiedenste Verfahren zur Interpretation menschlicher Sprache, von statistischen Ansätzen und Methoden für maschinelles Lernen bis zu regelbasierten und algorithmischen Ansätzen. Diese vielfältigen Ansätze sind unverzichtbar, denn text- und sprachbasierte Daten sind ebenso vielfältig wie ihre Verwendung in der Praxis.
Grundlegende NLP-Aufgaben sind Tokenisierung und Parsing, Lemmatisierung/Wortstammerkennung, Wortart-Tagging, die Spracherkennung und die Erkennung von Bedeutungszusammenhängen. Diese Aufgaben haben Sie höchstwahrscheinlich schon manuell bewältigt, und zwar bei der Satzbauanalyse im Schulunterricht.
Ganz allgemein ausgedrückt geht es bei den NLP-Aufgaben darum, Sprache in kürzere, elementare Bestandteile zu zerlegen, die Beziehungen zwischen diesen Teilen zu ermitteln und zu untersuchen, wie aus dem Zusammenspiel dieser Teile Bedeutung entsteht.
Diese zugrunde liegenden Aufgaben werden häufig bei NLP-Funktionen höherer Ebene eingesetzt.
- Die Content-Kategorisierung ermöglicht eine linguistisch basierte Dokumentenzusammenfassung, einschließlich Suche und Indizierung, Inhaltswarnungen und Erkennung von Duplikaten.
- Mit Klassifizierungen auf der Grundlage von großen Sprachmodellen (LLM), insbesondere BERT-basierten Klassifizierungen, wird der Kontext und die Bedeutung von Wörtern in einem Text erfasst, um die Genauigkeit im Vergleich zu traditionellen Modellen zu verbessern.
- Die Korpusanalyse wird verwendet, um den Korpus und die Dokumentenstruktur anhand von Ausgabestatistiken zu verstehen, um z. B. ein effektives Sampling durchzuführen, Daten als Input für weitere Modelle vorzubereiten und Modellansätze zu entwickeln.
- Die kontextuelle Extraktion zieht automatisch strukturierte Informationen aus textbasierten Quellen.
- Die Tonalitätsanalyse erkennt die Stimmung oder die subjektiven Meinungen in einem Text (oder auch in großen Textmengen), einschließlich der durchschnittlichen Stimmung und des Meinungsbildes.
- Speech-to-Text- und Text-to-Speech-Konvertierung wandelt Sprachbefehle in schriftlichen Text um und umgekehrt.
- Bei der Dokumentenzusammenfassung werden automatisch Kurzfassungen großer Textmengen erstellt und die vertretenen Sprachen in mehrsprachigen Korpora (Dokumenten) erkannt.
- Mit maschinellen Übersetzungen werden geschriebene oder gesprochene Texte von einer Sprache in eine andere übersetzt.
Vorrangiges Ziel ist es in jedem Fall, Sprachinput mit linguistischen Ansätzen und Algorithmen zu transformieren oder anzureichern und damit wertvoller zu machen.
NLP-Methoden und -Anwendungen
So erkennen Computer den Sinn in Textdaten
SAS® Visual Text Analytics
Wie finden Sie Antworten in großen Mengen von Textdaten? Indem Sie maschinelles Lernen mit Natural Language Processing und Textanalysen kombinieren. Erfahren Sie, wie unstrukturierte Daten analysiert werden können, um Probleme zu identifizieren, Tonalitäten zu bewerten, aufkommende Trends zu erkennen und verborgene Chancen ausfindig zu machen.
Literaturempfehlungen
-
Fishing for the freshest data: Leading the global seafood market with analyticsThe Norwegian Seafood Council uses SAS to give Norwegian fish exporters a competitive advantage.
-
Manufacturing smarter, safer vehicles with analyticsKia Motors America relies on advanced analytics and artificial intelligence solutions from SAS to improve its products, services and customer satisfaction.
-
Reducing hospital-acquired infections with artificial intelligence Hospitals in the Region of Southern Denmark aim to increase patient safety using analytics and AI solutions from SAS.
-
Your personal data scientistImagine pushing a button on your desk and asking for the latest sales forecasts the same way you might ask Siri for the weather forecast. Find out what else is possible with a combination of natural language processing and machine learning.