Text- und Sprachverarbeitung
Mathematica Version 11 erweitert das Framework für die Verarbeitung von Zeichenketten, Text und natürlicher Sprache um neue und leistungsstarke Funktionen zur symbolischen Textmanipulation und -analyse. Des Weiteren sind neue Funktionen zur Identifizierung und Extraktion von strukturierten Daten aus unstrukturiertem Text verfügbar. Auch historische Daten zur Worthäufigkeit können untersucht und natürliche Spracheingaben können analysiert werden.
Schlüsselfunktionen
- Neue String-Befehle und Muster machen die String-Verarbeitung einfacher und effizienter »
- Neue Normalisierungsfunktionen erlauben die Vorverarbeitung für Großschreibung, diakritische Zeichen, Stoppwörter und mehr »
- Das Arbeiten mit unterschiedlichen Alphabeten berücksichtigt die speziellen Eigenschaften von Zeichen »
- Zugriff auf Worteigenschaften wie z. B. Definition, Wortstamm oder Wortart »
|
- Finden von historischen Worthäufigkeitsdaten aus multilingualen Korpora »
- Programmatische Segmentierung von Texten in Wörter und Sätze »
- Finden der grammatikalischen Struktur eines Satzes und Darstellung als Abhängigkeitsgraph, Syntaxbaum usw. »
- Schreiben von flexiblen Parsern für natürliche Sprache, um Text in Aktionen zu übersetzen »
|
Beispiele
ID=5055