czwartek, 19 marca 2015

Trochę statystyki i biegania

Interesuję się m.in. matematyką (co jest raczej oczywiste dla moich nielicznych czytelników ), ale także bieganiem (co już takie oczywiste nie jest). Jestem aktywnym biegaczem i czasem startuję w różnych zawodach.

Ostatnio zastanawiałem się, jaki rozkład będą miały wyniki zawodników w jakimś większym biegu. Postanowiłem sprawdzić to na przykładzie pewnych zawodów – jakich, nie zdradzę, ponieważ ludzie zachowują się czasem jak idioci roszcząc sobie prawa własności do powszechnie dostępnych danych. A ja chcę uniknąć grożenia mi pozwami z takich absurdalnych powodów i konieczności wycofania mojej pracy z sieci.(*)

(*) - Jest to aluzja do autentycznego wydarzenia, które miało miejsce nie tak dawno temu. Pewien gościu, którego nazwiska niestety już nie pamiętam, więc nie jestem w stanie nawet wyszukać tej sprawy w googlach, zbadał i przetworzył powszechnie dostępne dane z facebooka i zaprezentował swoją pracę publicznie. Jego wysiłki okazały się bardzo wartościowe pod względem poznawczym. Niestety prawnicy facebooka w barbarzyński sposób zażądali, aby te dane zostały usunięte i skasowane, ponieważ „należały one do facebooka”. Gdybym był diabłem, trzymałbym dla takich ludzi specjalne miejsce w piekle .

Ale do rzeczy. Zestawiłem sobie te wyniki w arkuszu i otrzymałem następujący wykres:

Na osi poziomej są czasy, na pionowej ilości zawodników. Zostały one usunięte, żeby utrudnić ew. dupkom jakiekolwiek roszczenia . Niebieska linia przedstawia rzeczywiste ilości zawodników z danym czasem, czerwona zaś wyidealizowany rozkład, będący w rzeczywistości rozkładem Poissona.

Dlaczego taki rozkład, a nie inny – nie pytajcie. Ja jestem tylko technikiem informatykiem, który metodą prób i błędów potrafi znaleźć właściwy wzór .

Właściwie to wszystko, co miałem do powiedzenia – chciałem tylko przedstawić pewną ciekawostkę oraz pokazać, że bardzo prosta matematyka może mieć zastosowanie w bardzo zwykłych życiowych wydarzeniach .

Powiem jeszcze na koniec tylko, że zastanawia mnie zauważalny brak osób o przeciętnych czasach przy jednoczesnej nadreprezentacji osób o tych gorszych wynikach. Być może to przypadek? Będę zbierał dalej dane – może przy większej ich ilości wykres się wygładzi.

3 komentarze:

  1. Ten komentarz został usunięty przez autora.

    OdpowiedzUsuń
  2. Jednostki powinieneś pozostawić - i tak nikt nie będzie wiedział o który event chodzi :-)

    OdpowiedzUsuń
    Odpowiedzi
    1. Pewnie masz rację ;-). Ale w sumie nie mają one znaczenia - orientacyjnie powiem tylko, że czasy są w dziesiątkach minut, a ilości sięgają kilkuset zawodników.

      Ale jeśli bardzo chcesz, to mogę umieścić tu obrazek z jednostkami.

      Usuń