如何去掉 emoji 表情(或者四字节字)_文件上传绕过emoji宽字节-CSDN博客

网站介绍:文章浏览阅读3.1k次。如何去掉 emoji 表情或者四字节字一、背景二、介绍2.1 utf8 介绍2.2 utf-162.3 四字节识别2.4 java 代码过滤三、小结一、背景如果我们的数据库是 5.5.3 之前的版本,那么我们设置 字符集为 UTF8 , 这里的utf8 就是 utfmb3(most bytes 3), 就是 最大三个字节,而 有一些字是 使用4字节表示, 比如 emoji 表情 '????????????????, 还有一些汉字 ‘????’ ,这些都是四字节,在插入数据库时,会提示 报错:java_文件上传绕过emoji宽字节