✍️ 🧑‍🦱 💚 Autor:innen verdienen bei uns doppelt. Dank euch haben sie so schon 418.243 € mehr verdient. → Mehr erfahren 💪 📚 🙏

Statistische Eigenschaften türkischer Wörter

Statistische Eigenschaften türkischer Wörter

von Gökhan Dalkiliç
Softcover - 9786203335217
59,00 €
  • Versandkostenfrei
Auf meine Merkliste
  • Hinweis: Print on Demand. Lieferbar in 2 Tagen.
  • Lieferzeit nach Versand: ca. 1-2 Tage
  • inkl. MwSt. & Versandkosten (innerhalb Deutschlands)

Autorenfreundlich Bücher kaufen?!

Beschreibung

Für die Spracherkennung, OCR usw. ist die Bestimmung der strukturellen Eigenschaften einer natürlichen Sprache wesentlich. Diese Eigenschaften können in zwei verschiedenen Kategorien analysiert werden. morphologische und statistische Analyse. Für die statistische Analyse wird ein Korpus benötigt, der eine repräsentative Stichprobe der natürlichen Sprache darstellt. Wort-n-Gramm-Frequenzen dieses Korpus können unter Verwendung geeigneter Algorithmen bestimmt werden, und fehlende n-Gramm können unter Verwendung von Glättungstechniken geschätzt werden. In dieser Studie wurde ein Korpus namens TurCo erstellt, um Glättungstechniken auf Türkisch zu vergleichen und anzuwenden. Um das Wort n-Gramm zu berechnen, wurden verschiedene Algorithmen getestet. Nachdem n-Gramm-Wortlisten gefunden worden waren, wurden ihre Eigenschaften analysiert. Zur Verallgemeinerung wurde das Zipf-Gesetz angewendet, und um die Genauigkeit des Zipf-Gesetzes zu erhöhen, wurde das Mandelbrot-Gesetz angewendet, indem die geeigneten Konstanten von Mandelbrot gefunden wurden. Da der Korpus nicht groß genug sein konnte, um die gesamte Sprache darzustellen, wurden Glättungstechniken verwendet, um das unsichtbare Wort n-Gramm zu schätzen. Diese Studie kann Fachleuten helfen, die an Spracherkennung, Kryptoanalyse und Autorenerkennung auf Türkisch arbeiten.

Zeitgenössische gedruckte türkische Wortmerkmale und Glättungstechniken

Details

Verlag Verlag Unser Wissen
Ersterscheinung 04. Oktober 2022
Maße 22 cm x 15 cm x 0.9 cm
Gewicht 227 Gramm
Format Softcover
ISBN-13 9786203335217
Seiten 140

Schlagwörter