{"product_id":"estrazione-dei-dati-del-web-profondo-basata-sulla-visione-per-il-raggruppamento-dei-documenti-web-von-m-lavanya","title":"Estrazione dei dati del web profondo basata sulla visione per il raggruppamento dei documenti web","description":"\u003cp\u003eL'approccio VDEC comprende due fasi: 1) estrazione dei dati web basata sulla visione e 2) raggruppamento dei documenti web. Nella fase 1, le informazioni della pagina Web vengono segmentate in vari chunk, dai quali vengono rimossi il rumore in eccesso e i chunk duplicati utilizzando tre parametri, quali la percentuale di collegamenti ipertestuali, il punteggio del rumore e la somiglianza del coseno. Per identificare i chunk rilevanti, vengono utilizzati tre parametri, quali la rilevanza del titolo, la selezione dei chunk basata sulla frequenza delle parole chiave e le caratteristiche della posizione, per poi estrarre un insieme di parole chiave da questi chunk principali. Infine, le parole chiave estratte vengono sottoposte a clustering dei documenti web utilizzando il Fuzzy C-Means clustering (FCM). L'estrazione di dati web profondi basata sulla visione proposta è stata implementata e testata utilizzando un set di dati sintetici. I risultati sono stati confrontati con i due algoritmi esistenti, il ViDE (Vision-based Data Record Extraction) e l'MDR (Mining Data Region). Dai risultati sperimentali eseguiti su due diversi set di dati sintetici, è emerso che il metodo VDEC proposto è in grado di ottenere risultati stabili e buoni, con un valore di precisione di circa il 99,2% e il 99,1% in entrambi i set di dati con diversi valori di soglia.\u003c\/p\u003e\u003cdiv class=\"aw-variant-hidden-subtitle-div\" id=\"aw-variant-subtitle-9786205023549\"\u003e\u003ch3\u003eQuesto lavoro propone un approccio all'estrazione di dati web profondi basato sulla visione per il clustering dei documenti web (VDEC)\u003c\/h3\u003e\u003c\/div\u003e","brand":"Autorenwelt Shop","offers":[{"title":"Softcover - 9786205023549","offer_id":40357167988829,"sku":"9786205023549","price":79.9,"currency_code":"EUR","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0940\/0622\/files\/c071f3b4-3388-4597-9b80-325499a831a8.png?v=1758348374","url":"https:\/\/shop.autorenwelt.de\/en\/products\/estrazione-dei-dati-del-web-profondo-basata-sulla-visione-per-il-raggruppamento-dei-documenti-web-von-m-lavanya","provider":"Autorenwelt Shop","version":"1.0","type":"link"}