MySQL 从不固定位置提取字符串元素

备注:测试数据库版本为MySQL 8.0

测试数据:

create table zqs(id int,str varchar(1000));

insert into zqs(id,str) values (1,'【京东】abc【中国电信】');
insert into zqs(id,str) values (1,'【京东】abc【中国电信】def');
insert into zqs(id,str) values (1,'****【京东】abc【中国电信】def');
insert into zqs(id,str) values (1,'****【京东】abc');
insert into zqs(id,str) values (1,'【京东】abc【中国电信】【中国联通】');

一.需求

经常遇到短信类似的需求,需要提取短信的标记信息,但是可能会存在多个短信标记
此例假设最多有3个标签,需要输出如下:

mysql> select * from zqs;
±-----±----------------------------------------------------+
| id | str |
±-----±----------------------------------------------------+
| 1 | 【京东】abc【中国电信】 |
| 1 | 【京东】abc【中国电信】def |
| 1 | **【京东】abc【中国电信】def |
| 1 | **【京东】abc |
| 1 | 【京东】abc【中国电信】【中国联通】 |
±-----±----------------------------------------------------+

要求输出如下:
±-------------±-------------------±-------------------+
| first_val | first_va2 | first_va3 |
±-------------±-------------------±-------------------+
| 【京东】 | 【中国电信】 | |
| 【京东】 | 【中国电信】 | |
| 【京东】 | 【中国电信】 | |
| 【京东】 | | |
| 【京东】 | 【中国电信】 | 【中国联通】 |
±-------------±-------------------±-------------------+

二.解决方案
Oracle 字符串截取函数 substr和instr配合使用即可,但是MySQL的instr函数是弱于Oracle的instr函数。
此时需要借助MySQL的正则表达式 regexp_instr函数以及substr函数配合

select  substr(str,
         regexp_instr(str,'【',1,1),
         regexp_instr(str,'】',1,1) - regexp_instr(str,'【',1,1) + 1 ) first_val, 
        substr(str,
         regexp_instr(str,'【',1,2),
         regexp_instr(str,'】',1,2) - regexp_instr(str,'【',1,2) + 1) first_va2, 
        substr(str,
         regexp_instr(str,'【',1,3),
         regexp_instr(str,'】',1,3) - regexp_instr(str,'【',1,3) + 1) first_va3
  from  zqs;

测试记录:

mysql> select  substr(str,
    ->          regexp_instr(str,'【',1,1),
    ->          regexp_instr(str,'】',1,1) - regexp_instr(str,'【',1,1) + 1 ) first_val,
    ->         substr(str,
    ->          regexp_instr(str,'【',1,2),
    ->          regexp_instr(str,'】',1,2) - regexp_instr(str,'【',1,2) + 1) first_va2,
    ->         substr(str,
    ->          regexp_instr(str,'【',1,3),
    ->          regexp_instr(str,'】',1,3) - regexp_instr(str,'【',1,3) + 1) first_va3
    ->   from  zqs;
+--------------+--------------------+--------------------+
| first_val    | first_va2          | first_va3          |
+--------------+--------------------+--------------------+
| 【京东】     | 【中国电信】       |                    |
| 【京东】     | 【中国电信】       |                    |
| 【京东】     | 【中国电信】       |                    |
| 【京东】     |                    |                    |
| 【京东】     | 【中国电信】       | 【中国联通】       |
+--------------+--------------------+--------------------+
5 rows in set (0.00 sec)

添加新评论