JsonProtocal.php处理utf8编码的中文问题

guoxj 更新于2014-08-31

@walkor Demo里面提供的JsonProtocal.php 在处理中文上有点问题
原因在于strlen并不能正确返回长度
例如：
$zhStr = '中文混合eng！';
echo strlen($zhStr); // 输出：18
要换成mb_strlen 我也是查手册才知道的
同理还有substr函数。要换成mb_substr
由于我不了解php 才看了一天而已。但是改成下面这样就能工作了。
老大你看下。是否要加更多的逻辑。

class JsonProtocol
{
    // 根据首部四个字节（int）判断数据是否接收完毕
    public static function check($buffer)
    {
        // 读取首部四个字节
        $buffer_data = unpack('Ntotal_length', $buffer);
        // 得到这次数据的整体长度（字节）
        $total_length = $buffer_data;
        // 已经收到的长度（字节）
        $recv_length = mb_strlen($buffer,'utf-8');
        if($total_length>$recv_length)
        {
            // 还有这么多字节要接收
            return $total_length - $recv_length;
        }
        // 接收完毕
        return 0;
    }

    // 打包
    public static function encode($data)
    {
        // 选用json格式化数据
        $buffer = json_encode($data);
        // 包的整体长度为json长度加首部四个字节(首部数据包长度存储占用空间)
        $total_length = 4 + mb_strlen($buffer,'utf-8');
        return pack('N', $total_length) . $buffer;
    }

    // 解包
    public static function decode($buffer)
    {
        echo $buffer;
        $buffer_data = unpack('Ntotal_length', $buffer);
        // 得到这次数据的整体长度（字节）
        $total_length = $buffer_data;
        echo $total_length;
        // json的数据
        $json_string = mb_substr($buffer, 4, $total_length-4, 'utf-8');
        echo $json_string;
        return json_decode($json_string, true);
    }
}

 4405  5 0

5个回答

walkor 2014-08-30

打赏

合法的json里面不会包含中文的，中文会转换成类似 u5723\u8bde\u8282\u5343\u4e07\u597d\u793c\u5927\u5949\u9001
这样的字符

暂无评论

guoxj 2014-08-30

不一定哦。
{"E": "中文"} 也是合法的。
只要是utf8编码即可。
jsonlint.com 可以在此验证下

暂无评论

walkor 2014-08-30

打赏

jsonprotocol 验证过的，没有问题的

workerman中buffer长度都是按照字节计算，不是按照utf8编码或者其它编码的字符串的长度来计算的

另外浏览器json_encode和php json_encode 都是把utf8字符变成unicode来传递的，不会传递原始的中文字符

暂无评论

guoxj 2014-08-31

客户端是多样的。很多客户端不会去编码成unicode再发送。而是直接用utf8了。
jsonprotocol在处理中文上确实有问题。
如果一定要客户端禁止传递中文字符。那我不好说什么了

暂无评论

walkor 2014-08-31

打赏

1、workerman默认都是按照字节计算长度，框架本身不会考虑编码问题
2、jsonprotocol传输中文明文也是可以的，但是utf8中文字符必须按照3个字节来算，而不是1，不然就会出问题。
3、strlen是返回字符串的字节长度，而不是按照utf8等特定编码的字符串的长度。所以

$zhStr = '中文混合eng！';
echo strlen($zhStr); // 输出：18

返回的长度是没问题的。

最后，你的问题应该是混淆了字符串的字节长度和按照编码计算的长度，也就是客户端没有按照uft8中文字符是占3个字节来算长度导致的。这并不是jsonprotocol的问题。

暂无评论

相似问题

GatewayWorker 编码问题

php workerman cmd输出中文 cmd 设置编码 CHCP65001

分享个radio的单选组件编辑页选中状态的处理方案

workman进程处理问题

代码统一化处理

一个很奇怪的问题，关于中文乱码，读取数据库中文显示？？？

年代过于久远，无法发表回答

月贡献榜

1

walkor

🚀

2

jolalau

3

超高级的稻姬

4

nitron

5

chaz6chez

🐇workbunny

赞助商

在线客服系统源码

聊天源码|聊天室源码

+成为赞助商

热门问答

DeepSeek 本地部署教程(极其简单)

🤖 Webman AI接入DeepSeek教程 [赠送50￥+ 20$额度]

workerman发布v5版本

webman使用workerman/stomp适用于websocket stomp 协议吗?

当面集成的thinkphp ORM 是什么版本，是否是最新的ThinkPHP ORM 4.0

illuminate/database越来越臃肿，有考虑过自己出个orm么?

定时器是否是阻塞的？

webman-framework 发布1.6.0版本

Worker能这么整吗

大家是怎么解决手机号、身份证号这类数据的加密存储

基于workerman开发的在线客服系统源码

app,小程序,H5聊天源码

语音|视频|文字聊天

客服系统源码

小程序客服|h5客服|网页客服

×

🔝