sorteringen er den mindste af dine bekymringer, hvad du skal tænke på er tegnsættet for kolonnen/tabellen/databasen. Samlingen (regler for, hvordan data sammenlignes og sorteret ) er blot en følge af det.
MySQL understøtter flere Unicode-tegnsæt, utf8
og utf8mb4
være den mest interessante. utf8
understøtter Unicode-tegn i BMP
, dvs. en delmængde af hele Unicode. utf8mb4
, tilgængelig siden MySQL 5.5.3, understøtter alle af Unicode.
sorteringen at blive brugt med nogen af Unicode-kodningerne er højst sandsynligt xxx_general_ci
eller xxx_unicode_ci
. Førstnævnte er en generel sorterings- og sammenligningsalgoritme uafhængig af sprog, sidstnævnte er en mere komplet sproguafhængig algoritme, der understøtter flere Unicode-funktioner (f.eks. behandler "ß" og "ss" som ækvivalente), men er derfor også langsommere.
Se https://dev.mysql.com/ doc/refman/5.5/da/charset-unicode-sets.html .