Alfabetisering
Der er ofte forskellige regler i forskellige sprog for hvordan man alfabetiserer, det vil sige opstiller ordene i alfabetisk rækkefølge, også selvom sprogene bruger de samme bogstaver.
Dansk
På dansk gældende følgende specielle regler:
- Aa skal alfabetiseres som å når det udtales som én vokal uanset om den betegnet en a-lyd eller en å-lyd. Hvis den eneste forskel på to ord er at det ene har å hvor den andet har aa, skal ordet med å stå først af de to ord.
- Aa skal kun alfabetiseres som to a'er når det udtales som særskilte vokaler, det vil sige når de to a'er tilhører hver sin stavelse som for eksempel i ordet ekstraarbejde.
- Fremmede bogstaver og accenter: Ü albetiseres som y, ä som æ, ö som ø, ð som d, þ som th, œ som oe. Hvis den eneste forskel på to ord er at det ene har et fremmed bogstav hvor den andet har det tilsvarende danske bogstav, skal ordet med det almindelige danske bogstav stå først af de to ord.
- Ved alfabetisering ses bort fra accenter. For eksempel alfabetiseres é, è og ë som e, og č og ç som c. Hvis den eneste forskel på to ord er, at det ene skrives med accent, mens den andet ikke gør, skal ordet uden accent stå først af de to ord.
Kilde: Retskrivningsordbogen.
Wikipedia
Programmet som styrer wikipedia, kan desværre ikke alfabetisere korrekt når den laver en liste over alle artikler i en bestemt kategori eller laver en alfabetisk liste med alle artikler startende fra et bestemt ord. Der sorteres altid efter ISO 8859-1 (en udvidet variant af ASCII). Dette medfører blandt andet følgende fejl i Wikipedias sortering:
- Aa behandles aldrig som å.
- Der skelnes mellem store og små bogstaver. De store bogstaver kommer før de små bogstaver. Således vil Wikipedia placere USA før Uafhængighed.
- Æ, ø, å og alle bogstaver med accenter (både de små og de store) kommer efter det lille z i en tilsyneladende vilkårlig rækkefølge (blandt andre: å, æ, é, ê, ö, ø).