文章浏览阅读225次。今天遇到这样一个bug:客户端POST到服务器的一段数据导致服务器端发生未知异常。服务器端确认是编码转换错误。于是截取网络数据包进行分析,发现客户端POST的json数据中包含下面一段(hex形式):复制代码 ......
2023-11-11 19:43 阅读 阅读全文文章浏览阅读159次。解决爬虫中中文编码问题您的访问出错了result = chardet.detect(response.content)["encoding"] # 或返回值的 content 二进制值的编码 res_html = response.content.decode(result) # 改变 字符串编......
2024-01-24 11:43 阅读 阅读全文文章浏览阅读6.6k次。SparkStreaming从kafka读取文件流时(Java),默认是utf-8的,如果源文件的编码不是utf-8,那就会出现乱码现象,但是kafka的官网参数里没有关于编码的参数,不过kafka的源码里面是有的。源码如下:publicvoidconfigure......
2024-01-23 20:37 阅读 阅读全文文章浏览阅读6.6k次。SparkStreaming从kafka读取文件流时(Java),默认是utf-8的,如果源文件的编码不是utf-8,那就会出现乱码现象,但是kafka的官网参数里没有关于编码的参数,不过kafka的源码里面是有的。源码如下:publicvoidconfigure......
2024-01-23 20:37 阅读 阅读全文文章浏览阅读6.6k次。SparkStreaming从kafka读取文件流时(Java),默认是utf-8的,如果源文件的编码不是utf-8,那就会出现乱码现象,但是kafka的官网参数里没有关于编码的参数,不过kafka的源码里面是有的。源码如下:publicvoidconfigure......
2024-01-23 20:37 阅读 阅读全文ANSI ANSI编码 unicode和ansi都是字符代码的一种表示形式。 为使计算机支持更多语言,通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符。比如:汉字 '中' 在 ANSI编码中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。 不......
2024-01-21 09:55 阅读 阅读全文文章浏览阅读7.1k次。什么是编码与解码 1. 文字->(数字01代码):编码encode:就是把看得懂的内容,转换成看不懂的内容。 2. (数字01代码) -> 文字 : 解码decode:就是把看不懂的内容,转换成看懂的内容。服......
2023-11-11 21:17 阅读 阅读全文文章浏览阅读1.9w次,点赞7次,收藏3次。给同事做一个小程序,模拟网页的post请求。遇到问题,服务器是gb2312的编码,而okhttp默认返回和发送都换转成utf8的编码,造成数据返回变成了。。。乱码。。。那么解决思路就是将编码......
2023-11-11 12:19 阅读 阅读全文