sql >> Database teknologi >  >> RDS >> Oracle

Sådan finder du 4byte UTF8-tegn i Oracle

Måske har du gjort noget forkert med regexp-bygningen:Der er et kort eksempel.

-- create table: 
create table tmp_a as 
select unistr('\D841\DF0E') col from dual;
insert into tmp_a(col)
values(UNISTR('\D800\DC00'));
insert into tmp_a(col)
values(UNISTR('\D800\DC01'));
insert into tmp_a(col)
values(UNISTR('\D803\DC03'));
insert into tmp_a(col)
values(UNISTR('\041f'));
insert into tmp_a(col)
values('a');
insert into tmp_a(col)
values('b');


-- then check. There is should be 7 rows and only 4 should pass then "check"
select col, dump(col) , regexp_instr(col, '['||UNISTR('\F090\8080')||'-'||UNISTR('\F48F\BFBF')||']') as check from  tmp_a ;


-- finaly we could build next query with regexp_like as in your example 
select count(*) 
  from tmp_a 
 where regexp_like(col, '['||UNISTR('\F090\8080')||'-'||UNISTR('\F48F\BFBF')||']')

Det virker på Oracle 11.2.0.4 og 12.2.0.1



  1. Mysql:tilføjelse af fremmed nøgle giver ingen advarsel/fejl på MyISAM-tabeller

  2. INSERT INTO vs SELECT INTO

  3. PostgreSQL , Vælg mellem 2 tabeller, men kun det seneste element fra tabel 2

  4. Gruppér efter måned, returner 0, hvis der ikke blev fundet nogen post