← www.metal.agh.edu.pl/~regulski


Eksploracja Danych



  → ED: wykłady (dla Informatyki Stosowanej)



LABORATORIA:

    → Excel
    → STATISTICA: dobór zmiennych
    → Indukcja drzew decyzyjnych
    → Analiza skupień
    → Przygotowanie raportu z badań



PROJEKTY:

  → Wybór tematu i pozyskanie danych
  → Przygotowanie danych
  → Dobór zmiennych
  → Drzewa decyzyjne
  → Analiza skupień
  → Wybrany algorytm
  → Raport z badań



Narzędzia:

  → (licencje na AGH:) STATISTICA, MATLAB, SPSS i inne

  → STATISTICA - StatSoft
  → IBM - SPSS Statistics
  → ¶rodowisko R
  → Weka
  → Jupyter - with Python, JupyterLab, with Julia, with R or with C++

i inne...
  → Clementine - IBM
  → Oracle Data Mining
  → Enterprise Miner SAS
  → IBM DB2 Intelligent Miner
  → Mine Set - Silicon Graphics
  → RapidMiner
  → Data Mining Client for Excel
  → The Dap Project for Statistics and Graphics
  → GNU PSPP - a program for statistical analysis
  → OpenStat
  → Statistical Lab

Przydatne linki:

  → Otwarte zbiory danych na UC Irvine Machine Learning Repository
  → Kaggle data science projects
  → Otwarte zbiory danych na Data Mining Community's Top Resource
  → best-free-datasets-for-machine-learning
  → repod.pon.edu.pl
  → www.openml.org
  → zenodo.org
  → 19 Free Public Data Sets
  → The 50 Best Public Datasets
  → altexsoft: Sources and Advice on the Choice
  → Top Sources For Machine Learning Datasets
  → Google Dataset Search
  → lmgifu
  → inne otwarte zbiory danych

  → Internetowy Podręcznik Statystyki
  → DataCamp
  → Towards Data Science
  → Data Science Central
  → scikit-learn.org
  → kdnuggets.com
  → kaggle.com
  → r2d3 - zobacz koniecznie!
  → Statistics by SJSU (free online course)
  → lmgtfy

  → Uczelnia on-line (http://wazniak.mimuw.edu.pl/) - Eksploracja danych
Wykłady prof. dr. hab. inż. Tadeusza Morzego
Projekt sfinansowano ze ¶rodków Europejskiego Funduszu Społecznego z programu Sektorowy Program Operacyjny Rozwój Zasobów Ludzkich 2004 - 2006.



mail: regulski@agh.edu.pl

©Krzysztof Regulski - Kraków 2020