Java er i stand til at gemme ALT gyldig Unicode-tekst. Den bruger UTF-16 internt.
Hvis du konfigurerer hele datastien korrekt, vil al tekst blive bevaret. Du skal sikre dig:
- Den korrekte streng når Java (i tilfælde af webapplikationer, tegnkodning af formularen, der indsendes).
- Java ved, at den skal tale til databasen i UTF-8, og databasen ved, at den skal forvente UTF-8 gennem forbindelsen. Dette sikrer du, når du opsætter databaseforbindelsen.
- Data gemmes som UTF-8 i databasen.
Bemærk, at [dokumentationen for MySQL] krav UTF-8 er ude af stand til at gemme tegn uden for det grundlæggende flersprogede plan (alle "normale" tegn ligger inden for BMP). UTF-8 er i sig selv perfekt i stand til at gemme alle unicode-tegn, og databasen burde også kunne kode disse tegn.
Java i sig selv er fint - husk bare, at nogle sjældne unicode-tegn faktisk er to tegn (kaldet en surrogatpar ) i Java.