✍️ 🧑‍🦱 💚 Autor:innen verdienen bei uns doppelt. Dank euch haben sie so schon 418.243 € mehr verdient. → Mehr erfahren 💪 📚 🙏

Propiedades estadísticas de las palabras turcas

Propiedades estadísticas de las palabras turcas

von Gökhan Dalkiliç
Softcover - 9786203335224
59,00 €
  • Versandkostenfrei
Auf meine Merkliste
  • Hinweis: Print on Demand. Lieferbar in 2 Tagen.
  • Lieferzeit nach Versand: ca. 1-2 Tage
  • inkl. MwSt. & Versandkosten (innerhalb Deutschlands)

Autorenfreundlich Bücher kaufen?!

Beschreibung

Para el reconocimiento de voz, OCR, etc., la determinación de las propiedades estructurales de un lenguaje natural es esencial. Estas propiedades se pueden analizar en dos categorías diferentes; análisis morfológico y estadístico. Para el análisis estadístico, se necesita un corpus que sea una muestra representativa del lenguaje natural. Las frecuencias de n-gramas de palabras de ese corpus pueden determinarse utilizando algoritmos adecuados y los n-gramas faltantes pueden estimarse utilizando técnicas de suavizado. En este estudio, para comparar y aplicar técnicas de suavizado al turco, se creó un corpus llamado TurCo. Para calcular los n-gramas de palabras, se probaron diferentes algoritmos. Después de encontrar listas de palabras de n-gramas, se analizaron sus características. Para generalizar, se aplicó la Ley de Zipf, y para aumentar la precisión en la Ley de Zipf, se aplicó la Ley de Mandelbrot al encontrar las constantes apropiadas de Mandelbrot. Como el corpus no podía ser lo suficientemente grande para representar todo el idioma, se utilizaron técnicas de suavizado para estimar los n-gramas de palabras invisibles. Este estudio puede ayudar a los profesionales que trabajan en reconocimiento de voz, criptoanálisis y reconocimiento de autores en turco.

Características de la palabra turca impresa contemporánea y técnicas de suavizado

Details

Verlag Ediciones Nuestro Conocimiento
Ersterscheinung 04. Oktober 2022
Maße 22 cm x 15 cm x 0.9 cm
Gewicht 227 Gramm
Format Softcover
ISBN-13 9786203335224
Seiten 140

Schlagwörter