Forumkategorier
Bruger | Indlæg | |
---|---|---|
MrsSweDane | 2018-04-30 00:26 | |
Lidt nørderi over ordlisterne Mens vi venter på at ÆØÅ kommer til at fungere på den nye ordliste, har jeg siddet og nørdet lidt med helt unyttige sammentællinger i ordlisten. Den nye ordliste, som altså i første omgang ikke har fået lagt ord med ÆØÅ rigtigt ind, består af i alt 355634 unikke ord. Nogle ord har forskellige betydninger, så i alt er 363688 ord repræsenteret i ordlisten. De fordeler sig ujævnt i forhold til ordlængden: Lgd Antal ---- ------ 2 161 3 1102 4 3359 5 7777 6 15628 7 24375 8 33663 9 41579 10 47202 11 48943 12 45251 13 37305 14 28531 15 20758 Lidt sjovt at tænke på, at de korteste ord, som anvendes mest, er dem, der er færrest af ;-) Sammenligner vi Ordkamps RO01 liste med den udgave, som forhåbentlig snart fungerer efter hensigten, er der fjernet 72903 ord (mange fordi de er længere end 15 tegn) og kommet 34427 nye ord til fordelt på helt nye ord og nye bøjninger. | ||
lepenepe | 2018-04-30 23:42 | |
Statistik er fantastisk - tak for den MrsSweDane! | ||
torbenrj | 2018-05-01 00:47 | |
Kan næsten bare ikke tro det... at der skulle være 4 gange så mange ord med 11 bogstaver - vel at mærke lovlige og altså ikke sammensatte - som med 2, 3, 4 og 5 bogstaver - tilsammen.... hvem kan overbevise mig om det??? | ||
MrsSweDane | 2018-05-01 18:05 | |
@torbenj: jeg ved ikke, hvad der skal til at overbevise dig ;-) Jeg har kopieret hele ordlisten ind i et regneark og beregnet længden af hvert ord. Derefter har jeg kopieret ordene til en kolonne pr ordlængde og lavet sammentællingen. I øvrigt indeholder ordbogen et pænt udvalg af sammensatte ord ;-) | ||