Co zamiast średniej? Podstawowe statystyki do obliczenia.

Chcesz zacząć sprawdzać wyniki swoich działań, ale nie wiesz od czego zacząć? Nie wiesz, czy obliczanie wartości średniej ma sens? Nie wiesz, co mogłabyś obliczyć zamiast średniej? Powiem Ci, dlaczego średnia nie jest najlepszą wartością i co zamiast średniej właściwie obliczać – nawet nie mając zielonego pojęcia o analizie danych.

3 podstawowe statystyki, na początek przygody z analizą.

Jesteś na samym początku swojej drogi z analizą danych? Dobrze się składa, pokażę Ci 3 podstawowe statystyki, które bardzo łatwo obliczyć. Nie potrzebujesz właściwie żadnej wiedzy z zakresy statystyki czy analizy danych. Wystarczy, że obejrzysz film, wszystko w nim tłumaczę.

 

Czy obliczanie wartości średniej ma sens?

Zastanawiałaś się kiedyś czy w przypadku Twojego bloga czy strony na Facebooku jest sens obliczać wartość średnią dla ilości komentarzy czy polubień?

Gdy dopiero zaczynamy przygodę z analizą danych, pierwszą rzeczą jaka przychodzi nam do głowy jest wartość średnia. Pamiętamy obliczanie jej z lekcji matematyki w szkole. Ale czy rzeczywiście pokazuje nam ona odpowiedni obraz wyników naszych działań?

Pamiętasz jak obliczyć wartość średnią? Jeśli nie – sumujemy wyniki i dzielimy je przez ich ilość.

Mamy na przykład taką sytuację, sprawdzamy ilość komentarzy dla naszych postów z ostatniego tygodnia. Mamy następujące liczby

3, 5, 6, 7, 2, 6, 9, 1, 15, 23, 36

Mamy 11 wyników, czyli przyjmujemy, że opublikowałyśmy 11 postów. Średnia wynosi (3+5+6+7+2+6+9+1+15+23+36)/11 = 113/11 = 10,27.

Wychodzi na to, że nasze posty uzyskały średnio po 10,27 komentarza. Ale łatwo zauważyć, że wcale nie jest tak kolorowo – większość postów ma gorsze wyniki. Te 3 posty, które uzyskały bardzo dużo komentarzy sprawiły, że średnia została mocno zawyżona i nie pokazuje nam prawidłowego obrazu.

Właśnie dlatego liczenie wartości średniej nie jest dobrym pomysłem. Ma to sens w przypadku zbliżonych wartości, jednak kiedy obserwujemy bardzo duże odchylenia, obliczona wartość średnia jest mocno zniekształcona.

Więc co zamiast średniej?

Oczywiście możemy obliczyć sporo innych wartości, które pokażą nam to co chcemy wiedzieć. W dzisiejszym artykule pozostaniemy wśród tych najbardziej podstawowych, których obliczenie i przeanalizowanie wyników nie wymaga właściwie żadnej wiedzy z zakresu statystyki i analizy danych.

Te wartości to:

Mediana.

Mediana, czyli najprościej mówiąc wartość środkowa.

Żeby ją obliczyć, najpierw musimy uporządkować nasz zbiór danych – od najmniejszej wartości do największej, lub od największej do najmniejszej. W naszym przypadku będzie to:

1, 2, 3, 5, 6, 6, 7, 9, 15, 23, 36

Pozostało nam wyznaczyć wartość środkową. Mamy nieparzystą liczbę obserwacji, więc nasze zadanie jest ułatwione (w przypadku parzystej liczby, obliczamy wartość średnią z tych dwóch najbliżej środka).

Nasza mediana wynosi 6. Co to oznacza? Dzięki temu wiemy, że połowa naszych postów otrzymała 6 lub mniej komentarzy, podczas gdy druga połowa dostała tych komentarzy 6 lub więcej.

Jeszcze przykład do filmu, kiedy mediana jest większa od wartości średniej – weźmy cyfry 1, 1, 1, 1, 5, 5, 5, 5, 5. Mediana wynosi 5, wartość średnia 3,22. Oczywiście to tylko jeden z przykładów, taki aby łatwo było obliczyć.

Moda (modalna, dominanta).

Oprócz mediany, możemy też obliczyć modę. Jak sama nazwa wskazuje jest to coś modnego, czyli w przypadku liczb – jest to ta liczba, która pojawia się najczęściej.

Możemy obliczać modę bardzo dokładnie, lub tak jak mówiłam w filmie wyznaczyć sobie pewne przedziały. Po co to robić? Dla ułatwienia sobie analizy wyników. Dlaczego?

Jeśli chcemy przeanalizować dużą liczbę naszych postów czy artykułów, prawdopodobnie będą pojawiały się bardzo różne wyniki. Chcąc sprawdzić dokładną wartość mody, być może będziemy musieli przyjąć wartość, która pojawia się choćby 2 razy. Jeśli wyznaczymy sobie przedziały, nasze zadanie będzie miało większy sens.

Do danego przedziały wpadnie więcej liczb. Wybierając ten, który ma ich najwięcej, wyznaczymy częstotliwość z jaką najczęściej nasze posty są like’owane czy komentowane.

W naszym przypadku, moda wynosi 6. Co prawda ten wynik pojawił się tylko dwa razy, ale pozostałe jedynie raz. Gdybyśmy zrobili przedziały – na przykład o długości 10, czyli 1-10, 11-20, 21-30 i tak dalej, to najwięcej obserwacji znalazłoby się w przedziale 0-10, czyli najczęściej nasze posty otrzymywałyby właśnie tyle komentarzy.


Przeczytaj też:

PO CO SPRAWDZAĆ STATYSTYKI? 3 PODSTAWOWE POWODY

 

A CZY TY SPRAWDZASZ STATYSTYKI? JAKIE NAJCZĘŚCIEJ?

 

DOŁĄCZ DO GRUPY

BOGATYCH MYŚLI