Hvert tredje tall starter med 1

Astronom Newcomb kom på sporet da han så at noen boksider var mer slitt.

TENK PÅ ET TALL. Eller prøv å tenke på en lang liste med store tall, på fire sifre eller mer.

Det kan være aksjekurser, bilpriser, avstandsmål eller en oversikt over innbyggertallene i verdens land, for eksempel.

Det første sifferet i hvert av de mange tallene varierer, naturligvis. Prisene hos en bilforhandler kan for eksempel spenne fra 10 000 til 900 000 kroner.

Altså vil det være naturlig å tenke at det første sifferet i hvert tall varierer noenlunde jevnt fra 1 til 9.

At 1 er første siffer like ofte som 2 eller 4 eller 9. Ikke sant?

IKKE IFØLGE BENFORDS LOV. I stedet for hva mange av oss vil anta, at 9 er det første sifferet i store tall like ofte som andre siffer, sier den matematiske læresetningen Benfords lov følgende:

I en større mengde talldata fra det daglige liv, har 30 prosent av tallene 1 som første siffer.

17 prosent av tallene har 2 som første siffer, og hyppigheten synker videre helt ned til sifferet 9, som forekommer på førsteplass i så lite som 5 prosent av alle store tall.

Hvert tredje tall starter med 1

En kjapp sjekk i Wikipedias faktaoversikter over verdens land, viser at dette stemmer med virkeligheten.

Artikkelen fortsetter under annonsen

I så forskjellige kategorier som innbyggertall, areal og BNP, viser det seg at 1 er sterkt overrepresentert som det første sifferet i de lange tallrekkene.

INNBYGGERTALL

• 64 av 221 land har et innbyggertall som begynner på 1 (28,9 prosent)

• 10 av 221 land har et innbyggertall som begynner på 9 (4,5 prosent)

AREAL

• 64 av 232 land har et areal som begynner på 1 (27,5 prosent)

• 15 av 232 land har et areal som begynner på 9 (6,4 prosent)

BNP

• 55 av 180 land har et bruttonasjonalprodukt som begynner på 1 (30,5 prosent)

• 13 av 180 land har et bruttonasjonalprodukt som begynner på 9 (7,2 prosent)

Siffer-fordelingen er helt i tråd med Benfords lov.

Men hvorfor er det slik?

Og hvordan kan dette brukes til å avsløre svindel?

FØRST LITT HISTORIKK. Før datamaskinens tid var man avhengig av såkalte logaritmetabeller for å løse store og innviklede regnestykker.

I 1881 oppdaget den amerikanske astronomen Simon Newcomb at sidene i logaritmetabellen hans - som han brukte hver dag til å regne ut avstander i verdensrommet - var mer skitne og slitt på de stedene der tallkombinasjonene startet med sifferet 1.

Newcomb anså det ikke som sannsynlig at han eller andre vitenskapsmenn hadde en ubevisst forkjærlighet for logaritmer som begynte med 1, så han ble nysgjerrig på hva dette kunne komme av.

Han undersøkte andre forskeres tabeller, og fant akkurat samme tendens.

Sidene der logaritme-tallene begynte med sifferet 1, var mer slitt enn de som begynte på 2 - og så videre.

Newcomb publiserte en liten artikkel om dette, men oppdagelsen ble glemt i nesten 60 år.

I 1938 OPPDAGET Dr. Frank Benford, som jobbet for General Electric, den glemte artikkelen til Newcomb. Og han ble fascinert.

Frank Benford satte i gang med å analysere over 20 000 sett med tall for å se om dette kunne stemme, og om prinsippet gjaldt for hvilke talldata som helst.

Han tok for seg vidt forskjellige temaer.

Deriblant arealet til kjente elver, baseball-statistikk, tall i avis- og magasinartikler, strømregninger fra Solomon-øyene og gateadressene til de 342 mest kjente amerikanske vitenskapsmennene på den tiden.

Alle testene hans viste samme konklusjon:

Sifferet 1 viste seg å være første siffer i omkring 30 prosent av tallene hver eneste gang, og var alltid det mest framtredende første sifferet.

Til og med huset Benford bodde i, hadde et husnummer som begynte på tallet 1.

MEN HVORFOR OPPSTÅR dette fenomenet?

I en artikkel i New York Times forklarer matematikeren Mark Nigrini tallmagien med et eksempel fra den amerikanske børsen Dow Jones:

Hvis vi tenker oss at Dow Jones-indeksen er 1000, er det første sifferet 1.

For å få en indeks der det første sifferet er 2, må indeksen stige til 2000, og å gå fra 1000 til 2000 er en økning på 100 prosent.

La oss si at indeksen stiger med 20 prosent hvert år. Da vil det ta fem år å gå fra 1000 til 2000 - fra 1 til 2 som første siffer.

Men hvis indeksen starter på 5000, altså 5 som første siffer. For å gå fra 5000 til 6000 trengs bare en stigning på 20 prosent, og det går på bare ett år.

Når indeksen når 9000, trengs det bare sju måneder og en økning på 11 prosent å nå opp til 10 000. Og da starter karusellen på nytt. Igjen må du doble tallet - fra 10 000 til 20 000 - før du igjen når 2 som første siffer.

MARK J. NIGRINI VAR EN AV de første som foreslo at denne kunnskapen kunne brukes til å avsløre svindel og annen triksing med tall.

Tidlig på nittitallet inngikk Nigrini et samarbeid med skattemyndighetene i New York, og fikk tilgang til forfalskede skattedata. Han påviste at de forfalskede dataene hadde en betydelig overhyppighet av 5 og 6 i første siffer, mens sifferet 1 omtrent var fraværende.

Mens i de korrekt førte regnskapene passet tallene inn med kunnskapen fra Benfords lov.

Hvis tallene i et regnskap ikke stemmer overens med Benfords lov, kan det altså tyde på at det har skjedd noe uregelmessig. Og myndighetene kan gå inn og undersøke saken nærmere.

Dette prinsippet brukes i dag til å sjekke talldata innen blant annet forsikring, bokføring og valgresultater for å avdekke juks.

LOVEN ER OPPSIKTSVEKKENDE allmenngyldig:

Den gjelder uansett om aksjekurser måles i dollar, yen, euro eller norske kroner. Uansett om du måler avstandene på skrivebordet ditt i millimeter eller store landområder i kvadratkilometer.

Den gjelder også for matematiske og fysiske konstanter.

Men ikke alle tallrekker egner seg for denne metoden.

Benfords lov gjelder ikke for tall med naturlig like verdier, som IQ-målinger eller menneskers høyde. Eller tall i fastlagte intervaller, som telefonnumre og bilskilt.

Ei heller prisene på Vinmonopolet, hvor et kunstig høyt antall priser er lagt til 99 kroner, 199 kroner og så videre.

Denne artikkelen er skrevet av Magasinets nettredaksjon, og ikke publisert i papirutgaven. Har du spørsmål eller kommentarer, send dem til oss på mail.

OPPDAGET PRINSIPPET: Astronomen Simon Newcomb la merke til at tabellheftene hans var mest skitne og slitte på de sidene der tallene startet på 1. Og han lurte på hva dette kunne ha seg.
BEVISTE AT LOVEN GJELDER: Frank Benford testet over 20 000 sett med tall i 1938, og kom fram til at prinsippet gjelder i de aller fleste tilfeller.
IKKE TILFELDIG: I de aller fleste større tallrekker er 1 det første sifferet i langt flere tall enn 2, 3, 4 og ikke minst 9, som er det aller mest sjeldne førstesifferet.
<B>KAN AVSLØRE JUKS: Dersom en stor mengde talldata ikke følger dette prinsippet, kan det tyde på ugler i mosen - og hvis det skjer i for eksempel et regnskap kan det være nødvendig å undersøke saken nærmere. Wikipedias oversikt over verdens lands areal, stemmer derimot. Langt flere tall starter på 1 enn på 9.