Top-Fragen
Zeitleiste
Chat
Kontext

Assoziationsanalyse

Verfahren zum Aufdecken relevanter Beziehung Aus Wikipedia, der freien Enzyklopädie

Remove ads

Die Assoziationsanalyse bezeichnet die Suche nach starken Regeln. Diese daraus folgenden Assoziationsregeln beschreiben Korrelationen zwischen gemeinsam auftretenden Dingen. Der Zweck einer Assoziationsanalyse besteht also darin, Items (Elemente einer Menge, wie z. B. einzelne Artikel eines Warenkorbs) zu ermitteln, die das Auftreten anderer Items innerhalb einer Transaktion implizieren. Eine solcherart aufgedeckte Beziehung zwischen zwei oder mehr Items kann dann als Regel der Form „Wenn Item(menge) A, dann Item(menge) B“ bzw. A → B dargestellt werden.

Remove ads

Anwendungsfelder

Ein typisches Anwendungsfeld sind die Zusammenhänge beim Einkauf, die sogenannte Warenkorbanalyse, um gezielt Werbemaßnahmen einzuleiten. Ein Beispiel: Bei 80 Prozent der Einkäufe, in denen Bier gekauft wird, werden auch Kartoffelchips gekauft. Beide Produkte kommen in 10 Prozent der Einkäufe vor. Häufig werden diese Erkenntnisse im Crossmarketing genutzt.

Definitionen

Zusammenfassung
Kontext

Objekte, deren Beziehungen untersucht werden sollen, heißen im Rahmen der Assoziationsanalyse Items. Gegeben sei die endliche Menge aller Items eines Betrachtungsraumes. Eine Teilmenge dieser Grundgesamtheit wird Itemmenge genannt. Enthält die Itemmenge Elemente, wird sie auch als -Itemmenge bezeichnet.[1][2]

Eine Transaktion ist eine solche Itemmenge. Die Menge aller Transaktionen bildet die Datenbasis mit .

Eine Assoziationsregel beschreibt eine Implikation der Form . Prämisse und Konklusion sind disjunkte Itemmengen, d. h. und . Eine Transaktion erfüllt die Regel , wenn , also alle in der Regel vorkommenden Items umfasst.

Wichtige Kenngrößen von Assoziationsregeln sind Support und Konfidenz.

  • Support: Der Support einer Itemmenge gibt die relative Häufigkeit der Transaktionen aus an, die enthalten:
Entsprechend ist der Support einer Regel gegeben durch die relative Häufigkeit der Transaktionen, die sowohl die Elemente der Prämisse als auch die der Konklusion enthalten:
  • Konfidenz: Die Konfidenz von gibt den Anteil der und enthaltenden Transaktionen unter den enthaltenden Transaktionen an:
Sie beschreibt also die bedingte Wahrscheinlichkeit dafür, dass eine Transaktion die erfüllt auch erfüllt.
  • Lift: Der Lift gibt an, wie hoch der Konfidenzwert für die Regel den Erwartungswert übertrifft, er zeigt also die generelle Bedeutung einer Regel.
, wobei gilt:
Remove ads

Beispiel

Zusammenfassung
Kontext

Gegeben sei eine Assoziationsregel {Zahnbürste} → {Zahncreme}.

  • Support: Mit dem Support wird berechnet, für welchen Anteil aller Transaktionen die Regel {Zahnbürste} → {Zahncreme} gilt. Zur Berechnung wird die Anzahl der Transaktionen, in denen beide interessierenden Itemmengen vorkommen, durch die Anzahl aller Transaktionen geteilt.
  • Confidence: Für welchen Anteil der Transaktionen, in denen {Zahnbürste} vorkommt, kommt auch {Zahncreme} vor? Zur Berechnung der Konfidenz wird die Anzahl aller regelerfüllenden Transaktionen durch die Anzahl der Transaktionen, die {Zahnbürste} enthalten, geteilt.
  • Lift: Angenommen, 10 Prozent aller Kunden kaufen {Zahnbürste, Zahncreme}, 20 Prozent aller Kunden kaufen {Zahnbürste} und 40 Prozent aller Kunden kaufen {Zahncreme}. Dann hat die Regel einen Lift von 1,25.

Testen der Regeln auf Statistische Signifikanz

Generieren von Datensets unter der Nullhypothese (Nullhypothese: es liegen keine echten Assoziationsregeln vor), kann mithilfe der Swap-Randomisierung erfolgen. Dabei werden relevante Teile des Datensets vollkommen zufällig permutiert. Das Ergebnis der Assoziationsanalyse auf dem originalen Datensatz kann dann mit den Ergebnissen auf den zufällig generierten Datensets verglichen werden um abzuleiten ob das Ergebnis auch unter reinem Zufall hätte auftreten können.[3] Der Ansatz erlaubt es die Irrtumswahrscheinlichkeit zu schätzen.

Remove ads

Verfahren

Algorithmen sind so zu entwerfen, dass alle Assoziationsregeln mit einer vorab festzulegenden Mindestkonfidenz und Mindestsupport gefunden werden. Die Verfahren sollen keine Annahmen über die zu analysierenden Merkmale benötigen. Dies wäre beispielsweise bei einem Versandhandel mit vielen Tausend Artikeln auch nicht denkbar.

Der erste Algorithmus zur Assoziationsanalyse ist der AIS-Algorithmus (benannt nach seinen Entwicklern Agrawal, Imielinski und Swami)[4][5] aus dem der Apriori-Algorithmus entwickelt wurde. Dieser wird mehr und mehr vom wesentlich effizienteren FPGrowth-Algorithmus[6] abgelöst.

Remove ads

Einzelnachweise

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads