Du forveksler UTF-8 med Unicode.
0x00FC er Unicode kodepunkt for ü:
mysql> select char(0x00FC using ucs2);
+----------------------+
| char(0x00FC using ucs2) |
+----------------------+
| ü |
+----------------------+
I UTF-8 kodning, 0x00FC er repræsenteret af to bytes :
mysql> select char(0xC3BC using utf8);
+-------------------------+
| char(0xC3BC using utf8) |
+-------------------------+
| ü |
+-------------------------+
UTF-8 er blot en måde at kodning på Unicode-tegn i binær form. Det er beregnet til at være pladsbesparende, hvorfor ASCII-tegn kun tager en enkelt byte, og iso-8859-1-tegn såsom ü kun tager to bytes. Nogle andre tegn tager tre eller fire bytes, men de er meget mindre almindelige.