← www.metal.agh.edu.pl/~regulski/ [Eksploracja danych]
|
Eksploracja Danych Analiza skupień
|
Analiza skupień: 1. Dokonaj analizy skupień metodą aglomeracyjną (Statystyka | Wielowymiarowe techniki eksploracyjne | Analiza skupień | Aglomeracja) 2. Odczytaj, które zmienne są najbliższe sobie, a które najbardziej oddalone (macież odległości). Zapisz te pary. 3. Wykonaj analizę grupowania obiektów i cech dla zmiennych age, education-num oraz hours-per-week dla pierwszych 50 przypadków (select cases). Wcześniej zestandaryzuj te zmienne w nowych kolumnach. 4. Wykonaj losowanie warstwowe (Dane|Próba|Losowanie warstwowe; warstwy ustaw w zależności od zmiennej zależnej np. Income/50%-50%) tak by uzyskać zbiór około 1000 rekordów. 5. Analiza skupień metodą k-średnich (5-krotny sprawdzian krzyżowy) dla wybranych zmiennych (na wylosowanej grupie rekordów). 6. Wykonaj interpretację wyników (opisz charakterystykę poszczególnych skupień na podstawie zmienych jakościowych i ilościowych). 7. Spróbuj dopasować poszczególne skupienia do grup ze swoich hipotez. Zweryfikuj, czy skupienia potwierdzajš hipotezy. 8. Analiza skupień metodą EM. 9. Charakterystyka skupień dla EM. 10. Opracuj raport z zajęć. Przedstaw wyniki do oceny. | |
|