W ramach eksperymentu postanowiliśmy sprawdzić jak wygląda podobieństwo pomiędzy użytkownikami oraz czy informacja o tym podobieństwie jest dla użytkowników interesująca.
W serwisie Sonar użytkownicy mają możliwość odpowiadania na krótkie (jednopytaniowe) ankiety w celu sprawdzenia podobieństwa swoich poglądów ze stanowiskami poszczególnych partii politycznych.
Zaczynamy od przestrzeni wielowymiarowej. Każda ankieta lub sonda to jeden wymiar. Takie rozwiązanie jest jednak mało praktyczne (ze względu na pracochłonność i trudności w wyobrażeniu sobie tego rozwiązania). Dlatego zdecydowaliśmy się wykorzystać PCA (Principal Component Analysis), czyli klasyczny algorytm z rodziny dimension reduction. Przekształca on nasze dane, w taki sposób żeby zostało tylko pięć wymiarów, przy jak najmniejszej utracie informacji w stosunku do oryginalnej ich formy.
Nasz wkład w Data Driven Journalism: jako pierwsi na świecie stworzyliśmy algorytm pozwalający na podstawie sond i ankiet wizualizować podobieństwo pomiędzy użytkownikami serwisu informacyjnego. Przekształciliśmy pozyskiwane dane, w celu osadzenia ich w pięciu wymiarach, przy jak najmniejszej utracie informacji w stosunku do oryginalnej ich formy.