Metode

Metode

Beregningen af antallet af Brugere er detaljeret gennemgået i dette Whitepaper: Calculation real users (på engelsk) og nærmere omkring beregning af udenlandske brugere her: Whitepaper: Calculation real foreign users (engelsk).

Metoden er sammenfattet på dansk nederst på denne side, og forklares nærmere i nedenstående afsnit.

Brugertallene på FDIMs toplister giver det mest retvisende billede af, hvor mange mennesker, der rent faktisk har besøgt hvilke websites. Brugertallet retter op på en række af de skavanker, andre målinger for internet-trafikken påvirkes af. Det sker ved at udvide antallet af datakilder og anvende en lang række avancerede algoritmer. I det følgende kan du læse hvordan, det fungerer.

Beregning af Brugere
Det grundlæggende princip er enkelt: Systemet finder, ved hjælp af en automatisk måling og en række avancerede beregninger og algoritmer, ud af hvor mange procent af brugerne (reach) fra Danmark, der har besøgt en given hjemmeside.

Derefter undersøges det ved telefonrundspørge af Danmarks Statistik, hvor mange der har været på nettet i den undersøgte periode.

Ved at gange reach med det samlede antal danske internetbrugere fås det samlede antal danske brugere på sitet.

For at få det samlede brugertal tillægges herefter antallet af brugere, der har surfet fra udlandet. Dette tal fastlægges ved at estimere hvor stor en del af trafikken der stammede fra udenlandske surfere. Estimatet baseres på de informationer brugerne automatisk afgiver til målesystemet, hver gang de besøger en hjemmeside, og som blandt andet afslører hvilket land de surfer fra.

Beregning af Besøg og Tid
Besøg er defineret som sidevisinger på samme udgivelse inden for max. 30 mellem 2 sidevisinger foretaget af samme browser. For de sidevisinger, hvor der ikke kan sættes cookies, beregnes antallet af besøg og tidsforbrug proportionalt ud fra antallet af besøg fra sidevisninger med cookies, hvor besøg kan måles. (Se: Udvidet forklaring [engelsk]

Automatisk totaltælling

En af de centrale punkter i metoden er den automatiske måling af, hvor stor en andel af alle besøgende, der har besøgt et givent site i den undersøgte periode og de algortimer, der benyttes for at nå frem hertil.

Den automatiske måling foretages ved hjælp en kode der er indsat på alle de hjemmesider der er med i målingen, og som blandt andet automatisk registerer hvor mange såkaldt ”unikke cookies” hver af hjemmesiderne har. Det sker ved at systemet sætter et lille mærke – en såkaldt cookie – på brugerens computer, når man besøger en af de hjemmesider der er med i undersøgelsen første gang. Næste gang brugeren kommer igen, kan systemet se at brugeren allerede har en cookie, hvorfor den registrerer et nyt besøg men ikke en ny ”unik cookie”.

Renset for cookie-fejl
Denne opgørelse har blandt andet den svaghed, at den er følsom overfor om brugerens computer overhovedet lader systemet sætte en cookie – og overfor computere hvis cookies bliver slettet. I det første tilfælde tæller brugeren slet ikke med i statistikken over unikke besøgende. I den andet tilfælde – der er kendt som såkaldt ”cookie deletion” vil brugeren tælle som en ny unik besøgende, hver gang han besøger en hjemmeside efter at den foregående cookie er blevet slettet.

”Cookie deletion” problematikken bliver tacklet ved at udnytte, at alle cookies har et datostempel, der fortæller hvor gamle de er. Alle de cookies, som blev skabt før den periode der måles for, og som også findes når perioden er slut, kan pr. definition ikke være blevet slettet i perioden, og er derfor gode nok.

Den anden gruppe af cookies kan derimod være cookies der tilhører en computer, hvis foregående cookie er blevet slettet. Altså computere, der, hvis alle cookies tælles med, vil optræde som flere forskellige ”unikke cookies” selvom det er den samme computer, der er tale om.

Det antal ”unikke cookies”, som systemet ville have målt, hvis cookie deletion slet ikke fandtes, estimeres nu ud fra forholdet mellem antallet af sidevisninger pr. ”unik cookie” i de 2 grupper.

Den samme nøgle: forholdet mellem sidevisninger og ”gode unikke cookies” benyttes til at fastlægge et estimeret antal unikke besøgende til gruppen af sidevisninger, der er genereret af computere, der slet ikke tillader cookies at blive sat.

Renset for robot-trafik
For at undgå at indregne trafik fra robotter, der kunstigt kan forøge trafikken på et site, bliver alle trafiktal filtreret for:

  • Computere med unormalt mange sidevisninger
  • Computere med unormalt mange sidevisinger på få websites
  • Computere med unormalt meget tid på internettet
  • Computere med unormalt mange sidevisninger på kort tid

Brugere fra udlandet estimeres

Det er ikke – som det er med brugere, der surfer fra Danmark - hverken muligt eller metodisk meningsfuld at gennemføre telefon-surveys overfor gruppen af brugere, der surfer fra udlandet, for at fastslå, hvor mange der aktivt har surfet i den periode målingen dækker. Derfor benyttes en anden metode til at fastsætte antallet af udenlanske brugere.

Nøglen her er antallet af besøg: Det antages som udgangspunkt, at en udenlandsk og en dansk bruger foretager samme antal besøg, og ud fra dette beregnes antallet af udenlandske brugere – en antagelse der kvalificeres af undersøgelser, der viser at hovedparten af de brugere, der surfer fra udlandet, rent faktisk er danskere – de fleste af dem danskere, der bor i udlandet. For at undgå dobbelttælling af brugere, der i den givne periode både har surfet fra Danmark og fra udlandet, foretages der løbende web-undersøgelser blandt de brugere, der surfer fra udenlandske lokationer, hvori det kortlægges om de tidligere i løbet af den seneste måned har surfet på de pågældende hjemmesider også fra danske lokationer, og antallet af udenlandske brugere reduceres herefter.

Demografi fra panel
En anden del af systemet beskæftiger sig med, hvem brugerne er. Hvor gamle er de, er de mænd eller kvinder, hvor de bor henne etc. Disse informationer hentes fra et stort brugerpanel af danskere, der har fortalt systemet om dem selv, og har sagt ja til automatisk at rapportere hvilke hjemmesider de besøger til systemet. Du er måske selv stødt på spørgeskemaer fra FDIM/Gemius på danske hjemmesider.

Panellisterne skal leve op til stramme krav for at få lov at indgå i målingerne. Alle der har givet modstridende svar i undersøgelsen sorteres fra, og det samme gør alle der f.eks. indikerer, at den computer de sidder med på det tidspunkt hvor de udfylder det indledende spørgeskema, benyttes af andre end dem selv. For at blive panellist kræves det også, at den cookie, som systemet sætter hos paneliisten ikke slettes. Derfor bliver panellister først godkendt, når systemet har genkendt dem, og konstateret at de stadig findes, i over en måned.

Resultaterne fra panelet bliver, før det bliver benyttet, vejet på plads ud fra både sociodemografiske kendetegn (som køn og alder) samt adfærdsmæssige kendetegn.

Sammenfatning af beregning af brugere 
1) Antal sidevisninger pr måned måles for hvert site. 
2) Antal ”gode” cookies måles, der stammer fra danske IP-numre. ”Gode” betyder, at de har eksisteret hele måneden eller fortsat er aktive 21 dage efter måneden er slut. Desuden kontrolleres der for, at cookien ikke har udvist unormal trafikadfærd, som kunne tyde på, at der er tale om en automatiseret proces. Man lægger mere vægt på ”gamle” cookies, da nye cookies enten kan være nye brugere eller eksisterende brugere, der har slettet deres gamle cookies. Nye cookies er derfor er mere ”usikre” mht. om hvor mange brugere de repræsenterer. 
3) Man filtrerer antal sidevisninger ud, der er foretaget af brugere med ”gode” cookies. 
4) Man beregner en ”justeret cookieværdi” = (sidevisninger/sidevisninger fra godecookies) x gode cookies. 
5) Man måler/beregner det samlede ”univers” af cookies. Altså for alle danske sites, ikke kun det site, som vi betragter pt. 
6) Man beregner websites andel (reach) af det samlede univers = ”justeret cookieværdi” / ”cookie univers”. 
7) Man måler hvor mange danske personer, der har anvendt internettet den pågældende måned (det gør Danmarks Statistik). 
8) Nu kan antal Danske Brugere på sitet beregnes = Reach x Danske internetbrugere 
9) Der foretages en (ny) beregning af forholdtal for de udenlanske cookies/brugere. Her indgår data fra særlige spørgeskemaer til udenlanske brugere, og der estimeres på baggrund af besøg. Resultatet lægges til de danske brugere og herved fremkommer den endelige værdi for det samlede antal Brugere på sitet.

Metoden tager på den måde højde for at flere personer kan anvende samme computer, at samme person kan anvende flere computere, at der er forskel på hvordan danske og udenlandske brugere anvender et dansk site, at der er danske brugere fra udenlandske IP-numre og at en andel personer sletter eller blokerer cookies. Der koorigeres for disse forhold individuelt for hvert enkelt site og med nye værdier hver måned.

Læs mere i whitepaperet
Beregningen af antallet af Brugere er detaljeret gennemgået i dette Whitepaper: Calculation real users (på engelsk) og nærmere omkring beregning af udenlandske brugere her: Whitepaper: Calculation real foreign users (engelsk)