Du skal sikre dig, at du bruger den ene korrekte og samme tegnkodning gennem hele processen. Jeg anbefaler dig kraftigt at afhente UTF-8
for det. Det dækker enhver menneskelig karakter kendt i verden. Hvert trin, der involverer håndtering af tegndata, bør instrueres i at bruge den samme kodning.
I SQL-kontekst skal du sikre dig, at DB'en og tabellen er oprettet med UTF-8
tegnsæt. I JDBC-sammenhæng skal du sikre dig, at JDBC-driveren bruger UTF-8
; dette kan ofte konfigureres af JDBC-forbindelsesstrengen. I Java-kodekontekst skal du sikre dig, at du bruger UTF-8
når du læser/skriver karakterdata fra/til streams; du kan angive det som 2. konstruktørargument i InputStreamReader
og OutputStreamWriter
.