knitted-woolen-textured-surface-macro-soft-grey-blue-merino-wool-pattern-backdrop-closeup-autumn-winter-flat-lay-scandinavian-minimal-style_91130-95.jpg

KOCYK

obliczanie podobieństwa poglądów w serwisie Sonar

Wyzwanie

W ramach eksperymentu postanowiliśmy sprawdzić jak wygląda podobieństwo pomiędzy użytkownikami oraz czy informacja o tym podobieństwie jest dla użytkowników interesująca.

W serwisie Sonar użytkownicy mają możliwość odpowiadania na krótkie (jednopytaniowe) ankiety w celu sprawdzenia podobieństwa swoich poglądów ze stanowiskami poszczególnych partii politycznych.

Rozwiązanie

Zaczynamy od przestrzeni wielowymiarowej. Każda ankieta lub sonda to jeden wymiar. Takie rozwiązanie jest jednak mało praktyczne (ze względu na pracochłonność i trudności w wyobrażeniu sobie tego rozwiązania). Dlatego zdecydowaliśmy się wykorzystać PCA (Principal Component Analysis), czyli klasyczny algorytm z rodziny dimension reduction. Przekształca on nasze dane, w taki sposób żeby zostało tylko pięć wymiarów, przy jak najmniejszej utracie informacji w stosunku do oryginalnej ich formy.

Innowacyjność

Nasz wkład w Data Driven Journalism: jako pierwsi na świecie stworzyliśmy algorytm pozwalający na podstawie sond i ankiet wizualizować podobieństwo pomiędzy użytkownikami serwisu informacyjnego. Przekształciliśmy pozyskiwane dane, w celu osadzenia ich w pięciu wymiarach, przy jak najmniejszej utracie informacji w stosunku do oryginalnej ich formy.

Interesuje Cię eksperyment pozwalający na pozyskanie kluczowych danych i zależności w Twoim produkcie?

Required *
attach_file