✍️ 🧑‍🦱 💚 Autor:innen verdienen bei uns doppelt. Dank euch haben sie so schon 418.243 € mehr verdient. → Mehr erfahren 💪 📚 🙏

Extraction du nom d'auteur d'une page web type blog

Extraction du nom d'auteur d'une page web type blog

von Lucie Dupin
Softcover - 9783639522532
35,90 €
  • Versandkostenfrei
Auf meine Merkliste
  • Hinweis: Print on Demand. Lieferbar in 5 Tagen.
  • Lieferzeit nach Versand: ca. 1-2 Tage
  • inkl. MwSt. & Versandkosten (innerhalb Deutschlands)

Autorenfreundlich Bücher kaufen?!

Beschreibung

Ce travail a été rédigé au Laboratoire Informatique de Blois, en partenariat avec l'entreprise Elokenz. Le but était de créer un prototype d'outil de récupération automatique du nom de l'auteur d'une page de blog. La méthodologie adoptée est une approche existante sur un corpus de pages web scolaires, proposée par Sahar Changuel. Le corpus de travail est un ensemble de pages HTML issues de différents blogs dont l'auteur est identifié. Premièrement, pour chaque page, l'auteur étant une personne, tous les noms de personnes sont extraits grâce à la reconnaissance des entités nommées. Ensuite, chacun de ces noms s'est vu attribuer plusieurs caractéristiques linguistiques et contextuelles, comme du vocabulaire ou une date dans l'entourage. Grâce à ces dernières, un "tri" est effectué par un algorithme d'apprentissage automatique, les arbres de décision, ce qui permet de déterminer un seul nom comme auteur pour chaque page. Les résultats obtenus par cette méthode sont très prometteurs.

Details

Verlag Éditions universitaires européennes
Ersterscheinung 12. Mai 2016
Maße 22 cm x 15 cm x 0.5 cm
Gewicht 131 Gramm
Format Softcover
ISBN-13 9783639522532
Seiten 76