Da vi testede Talend med Easysoft JDBC-ODBC Bridge, oplevede vi tekstkorruption, da vi skrev ikke-ASCII-data fra en SQL Server-database til en fil i CSV-format.
Løsningen var at ændre datatypen for problemkolonnen i Talend-skemaet fra en String
til en byte[]
. For at gøre dette:
- Få adgang til tJDBCInput-komponentens egenskaber.
- Vælg knappen Rediger skema.
- Ændrede datatypedefinitionen for den relevante kolonne.
Talends standard tegnkodning er UTF-8. Så længe data, der returneres af en JDBC-driver er ASCII, er data kodet med en anden tegnkodning ikke et problem:UTF-8-data, der kun indeholder ASCII-tegn, er identiske med data.