|
„Analityk data mining 2009” — Raport Rexer Analytics
Rexer Analytics przygotował i opublikował trzecią edycję raportu Data Miner Survey. Coroczny raport Rexera prezentuje informacje na temat rynku data mining w zakresie wykorzystywanych narzędzi data mining, typów analizowanych danych i ich jakości, a także wyzwań i nowych trendów. Zapraszamy do zapoznania się z krótkim podsumowaniem raportu, w którym prócz informacji o pierwszym miejscu dla rozwiązań IBM SPSS będą mogli Państwo przeczytać więcej o rynku data mining (drążenia danych).
Jak wynika z raportu Data Miner Survey, data mining jest procesem, który z powodzeniem znalazł zastosowanie w każdej z branż — zarówno w biznesie, edukacji i administracji publicznej. Najczęstszymi obszarami, w których wykorzystywane są techniki i narzędzia tego typu są zagadnienia CRM, marketingu, edukacji oraz usługi, zarówno finansowe, telekomunikacyjne jak i IT. Uczestnicy badania deklarują dużą rolę i wpływ wyników analiz typu data mining na ich organizację. Ponad połowa badanych twierdzi, że wyniki ich pracy wspomagają proces decyzyjny i mają wpływ na działania operacyjne w ich firmie. Wyniki dostarczane przez modele są wdrażane w procesy instytucji zawsze lub prawie zawsze, tak twierdzi 60% badanych. Największym wyzwaniem dla ludzi zajmujących się drążeniem danych są: „czystość danych”, zrozumienie procesu data mining wśród innych pracowników firmy i trudności z dostępem do danych.
Techniki, którymi według raportu Rexera, najczęściej posługują się analitycy biorący udział w badaniu to techniki regresyjne, drzewa decyzyjne i analiza skupień.
Rysunek 1. Najczęściej wykorzystywane narzędzia data mining w podziale na biznes i środowisko akademickie (źródło: Rexer Analytics 3rd Annual Data Miner Survey Summary)
Według raportu Rexera standardem, aplikacją najczęściej wykorzystywaną przez osoby zajmujące się data miningiem jest IBM SPSS Modeler (dawniej Clementine). Jego użytkownicy mają najwięcej pozytywnych odczuć związanych z pracą z tym narzędziem, określając ją jako satysfakcjonującą, bądź bardzo satysfakcjonującą. Jak wskazuje raport narzędziem data mining, które jest najszerzej wykorzystywane zarówno w biznesie, jak i środowisku akademickim jest IBM SPSS Statistics. W tegorocznym badaniu spadek w rankingu wykorzystywanych narzędzi data mining odnotował SAS. Jednocześnie wzrasta procent wykorzystania narzędzi data mining typu open-source, takich jak WEKA, czy R w środowisku akademickim i non-profit.
Rysunek 2. Udział narzędzi data mining w poszczególnych obszarach analitycznych (źródło: Rexer Analytics 3rd Annual Data Miner Survey Summary)
Mimo, że metodologia zaproponowana przez Rexter Analytics*, do przygotowania raportu, nie pozwala przenosić wyników tego raportu na całą populację, to z pewnością jego wyniki mogą być powodem, aby bliżej poznać rozwiązania oferowane przez SPSS Polska. Po więcej informacji zapraszamy na strony Rexer Analytics.
Źródło informacji — Rexer Analytics 3rd Annual Data Miner Survey Summary
* Raport Data Miner Survey powstaje w oparciu o wyniki ankiety on-line, do wypełnienia której zaproszono osoby zajmujące się analizami data mining. W tegorocznym, badaniu wzięło udział 710 osób z 58 krajów, jednak ze względu na udział dostawców narzędzi, do analizy wykorzystano wyniki z 529 ankiet.
|