Ja det er korrekt. UTF-8 er en kodning til Unicode-tegnsættet, som understøtter stort set alle sprog i verden.
Jeg tror, den eneste forskel kommer med at sortere dine resultater, forskellige bogstaver kan komme i en anden rækkefølge på andre sprog (accenter, omlyd osv.). Også ved at sammenligne a til ä kan opføre sig anderledes i en anden kollation.
_ci suffiks betyder, at sortering og sammenligning sker c ase i ufølsom.
https://www.collation-charts.org/ kunne være interessant for dig.