{"product_id":"x-means-ein-algorithmus-zur-clusterbildung-unter-selbststandiger-abschatzung-der-optimalen-clusteranzahl-von-roy-skodowski","title":"X-Means: Ein Algorithmus zur Clusterbildung unter selbstständiger Abschätzung der optimalen Clusteranzahl","description":"\u003cp\u003eStudienarbeit aus dem Jahr 2006 im Fachbereich Informatik - Wirtschaftsinformatik, Note: 1,7, Friedrich-Schiller-Universität Jena (Wirtschaftswissenschaftliche Fakultät), Veranstaltung: Datenanalyse 2, Sprache: Deutsch, Abstract: X-Means: Extending K-means with Efficient Estimation of the Number of Cluster\u003c\/p\u003e\u003cp\u003e\u003c\/p\u003e\u003cp\u003eAufbauend auf k-means greift der x-means Algorithmus die drei hauptsächlichen Probleme von k-means auf und versucht diese zu umgehen bzw. zu beheben. Dabei wird vom Benutzer im Gegensatz zu k-means nicht die Angabe einer Klassenanzahl k gefordert, sondern lediglich ein Bereich in welchem die optimale Klassenanzahl wahrscheinlich liegen wird.\u003c\/p\u003e\u003cp\u003eNun werden ausgehend von der unteren Grenze des angegebenen Bereiches kontinuierlich neue Centroide hinzugefügt. Dies geschieht indem die alten ¿Vatercentroide¿ aufgespalten\u003c\/p\u003e\u003cp\u003ewerden. Aus jedem Vater werden auf diese Weise zwei ¿Söhnecentroide¿ erstellt. Ob Vater- oder Söhnecentroide beibehalten werden wird auf Grundlage einer Punktbewertung mittels BIC ermittelt. Je nachdem wessen Punktzahl höher ausfällt, werden entweder die Söhne oder\u003c\/p\u003e\u003cp\u003eder Vater als Klassenmittelpunkte verworfen. Danach wird grundsätzlich jenes Gesamtmodell ausgegeben welches nach einem  ewertungskriterium die höchste Punktzahl erreicht hat.\u003c\/p\u003e\u003cp\u003eDer x-means Algorithmus besteht grundsätzlich aus zwei Schritten:\u003c\/p\u003e\u003cp\u003e1. Improve Params\u003c\/p\u003e\u003cp\u003e2. Improve Structure\u003c\/p\u003e\u003cp\u003eDer erste Schritt entspricht einem herkömmlichen k-means Durchlauf. Der zweite Schritt ermittelt, welche Centroide gesplittet werden müssen um das Ergebnis zu verbessern. Auf dieser Basis und unter Einbeziehung eines kd-tree, welcher die Durchläufe der k-means\u003c\/p\u003e\u003cp\u003eIterationen erheblich beschleunigt, werden sowohl die optimale Anzahl der Cluster wie auch die Cluster als solche ausgegeben. Dadurch wird es möglich viel größere Datenmengen in viel kürzerer Zeit zu analysieren.\u003c\/p\u003e\u003cdiv class=\"aw-variant-hidden-subtitle-div\" id=\"aw-variant-subtitle-9783638903523\"\u003e\u003ch3\u003e\u003c\/h3\u003e\u003c\/div\u003e","brand":"Libri","offers":[{"title":"Softcover - 9783638903523","offer_id":39429189107805,"sku":"9783638903523","price":17.95,"currency_code":"EUR","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0940\/0622\/files\/188ad308-d094-4719-b244-4e7f007e71fd.jpg?v=1777437828","url":"https:\/\/shop.autorenwelt.de\/products\/x-means-ein-algorithmus-zur-clusterbildung-unter-selbststandiger-abschatzung-der-optimalen-clusteranzahl-von-roy-skodowski","provider":"Autorenwelt Shop","version":"1.0","type":"link"}