`
ljl_ss
  • 浏览: 53563 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

第三方登入时昵称出现emoji表情致mysql插入失败

阅读更多
项目中出现用QQ等第方登入时获取到第三方平台的昵称中出现表情无法插入到mysql数据库
经查特殊表情为utf8mb4格式,数据据也有这个编码但改成那个编码也没插入成功,因为项目中不用展示这些表情 ,所以没去管了,所以干脆用空字符串替换掉,代码如下,代码中用到的Range类引自guava包中的类

  static Range<Character> utf84ByteRange = Ranges.closed("\u1F601".charAt(0), "\u1F64F".charAt(0));
    //把utf-8了字节编码的字符去掉
    //参见: http://cenalulu.github.io/linux/character-encoding/
    // 所谓Emoji就是一种在Unicode位于\u1F601-\u1F64F区段的字符
    private static  String replaceUtf84byte(String str) {
        if (StringUtils.isBlank(str)) return StringUtils.EMPTY;

        char[] chars = str.toCharArray();
        for (int i = 0; i < chars.length; i++) {
            if (Character.isSurrogate(chars[i])) { //参见: http://stackoverflow.com/questions/14981109/checking-utf-8-data-type-3-byte-or-4-byte-unicode
                Logger.warn(chars[i] + "字符为 surrogate code unit, utf-8为4字节编码, 替换成空格");
                chars[i] = ' '; //替换成空格
            }else if (utf84ByteRange.contains(chars[i])) {
                Logger.warn(chars[i] + "字符为 在\\u1F601-\\u1F64F, utf-8为4字节编码, 替换成空格");
                chars[i] = ' '; //替换成空格
            }
        }
        return new String(chars);
    }

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics