PHP 实现base64编码文件上传出现问题详解

网络编程 2024/11/17 佚名

3 2 1

无为清净楼资源网 Design By www.qnjia.com

一、场景

领导：小A同学，我们要做一个样本上传进行分析的功能，你看下是否使用base64编码加进去，这样客户端的同学就不需要用form-data方式来上传了，直接使用json格式就可以上报，可以让格式上报统一。

小A：好的，领导，马上搞定！

咋看上面的对话没啥问题，很多公司团队内部为了一些标准化的问题，都会进行一些技术选型问题，但是噩梦也就从这个对话开始，功能实现当然都是很简单的，先来看简单流程图：

本身的流程是一个很简单的文件转换成base64上传，再服务端decode保存，在开发联调过程中没有问题，非常完美的走下去了。

二、问题来了

突然有一天终端同学误操作将一个37M文件上传，nginx与php-fpm文件上传限制均为（60M），但是在界面出现500错误，进入docker 日志查看有一条数据：

Allowed memory size of 8388608 bytes exhausted (tried to allocate 1298358 bytes)

玩php的基本都知道这是啥意思，就是代码运行过程中使用内存超过我们php.ini设置的memory_limit 的值，然后就屁颠屁颠进入php.ini找参数配置，很快找到：

memory_limit=128M

然后就转念一想，不应该出现这个问题，我们知道，php的内部变量使用cow（写时复制）机制来实现，那么内存申请只有在变量赋值变更才会进行

三、测验

接下来我们单独写一个程序来进行测试，将一个4.89M文件进行base64_encode 编码与base64_decode解码，查看各自占用内存以及过程中占用峰值内存

<"文件加载到内存：4.89M"

string(38) "过程中峰值使用的内存：5.25M"

string(33) "base64_encode占用内存：1.63M"

string(39) "过程中峰值使用的内存：11.76M"

string(30) "base64_decode占用内存：0M"

string(38) "过程中峰值使用的内存：13.4M"

通过上面结果可以看出

  加载文件使用内存没有太大问题，加载过程使用的峰值在5.25M，高出整体文件大小不多，这在文件加载过程有一些临时申请内存的问题
  base64_encode占用内存，这个在使用的时候，就已经将内存差不多进行一个double，而这基本上也是在内核解析过程中，进行了内存申请，可以理解，文件本身占用内存+base64_encode 解析后的内存，两份内存同时存在的
  base64_decode操作，这个操作就是解密了，解密过程中，这里直接就占用了3倍多的内存操作，问题就出在这里，在场景中出现的问题是一个37M的文件，为什么就把单个fpm的128M内存占满了呢

四、源码解析
base64_encode源码解析
首先找到对应的c文件 base64.c,找到里面php_base64_encode函数


PHPAPI zend_string *php_base64_encode(const unsigned char *str, size_t length) /* {{{ */
{
	const unsigned char *current = str;
	unsigned char *p;
	zend_string *result;

	result = zend_string_safe_alloc(((length + 2) / 3), 4 * sizeof(char), 0, 0);
	p = (unsigned char *)ZSTR_VAL(result);
    ...
}


我们先来分析这段代码，因为这里涉及到内存的问题，那么我们就看
result = zend_string_safe_alloc(((length + 2) / 3), 4 * sizeof(char), 0, 0);
这啥意思呢？
申请内存，最终调用的函数是：
safe_emalloc(size_t nmemb, size_t size, size_t offset)
在wiki上解释是：
void *safe_emalloc(size_t nmemb, size_t size, size_t offset)分配缓冲区来存放每块大小为 size 字节的 nmemb 块，并附加 offset 字节。类似于 emalloc(nmemb * size + offset)，但增加了针对溢出的特殊保护。
那么我可以简单的认为，就是在encode过程中，重新申请了内存，申请的内存大小是文件本身的 4/3 大小，加上原来的文件本身大小，那么峰值大小可以理解为
峰值内存= 7/3 *4.89 = 11.41
那么与我们实验过程中峰值大小基本是相符。
base64_decode操作
同样我们进行源码分析


PHPAPI zend_string *php_base64_decode_ex(const unsigned char *str, size_t length, zend_bool strict) /* {{{ */
{
	const unsigned char *current = str;
	int ch, i = 0, j = 0, padding = 0;
	zend_string *result;

	result = zend_string_alloc(length, 0);
	...
}


这里使用的zend_string_alloc来进行申请内存，那么底层使用的函数就是emalloc函数，来看下wiki的解释
void *emalloc(size_t size)分配 size 字节的内存。
这个就比较好理解了，传入参数内存再进行一个double拷贝就可以，
那么我们进行一个decode的内存峰值的计算：
峰值内存=(4/3+4/3) *4.89 =13.04
基本与我们测试的结果相差不多，因为精度关系，我们进行四舍五入的计算，测试代码是精准计算，所以会有小数点偏差。
五、总结
那这就可以理解为什么一个为什么在我们一个37M的文件，不能再128M内存进行base64_encode与base64_decode操作，当然这里有一些临时变量没有及时释放内存的情况，但是通过源码分析可以知道，要做一次这样场景来进行文件上传，单纯文件的内存损耗是2.6倍左右，所以为了节省内存，我们不要再用这个方式来进行操作了，很费内存的


以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

PHP,base64,编码文件,上传

标签：

PHP,base64,编码文件,上传

无为清净楼资源网 Design By www.qnjia.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

无为清净楼资源网 Design By www.qnjia.com

评论“PHP 实现base64编码文件上传出现问题详解”

暂无评论...

《魔兽世界》大逃杀！60人新游玩模式《强袭风暴》3月21日上线

暴雪近日发布了《魔兽世界》10.2.6 更新内容，新游玩模式《强袭风暴》即将于3月21 日在亚服上线，届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。

艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕，并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时，他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中，玩家将会进入一个全新的海盗主题大逃杀式限时活动，其中包含极高的风险和史诗级的奖励。
《强袭风暴》不是普通的战场，作为一个独立于主游戏之外的活动，玩家可以用大逃杀的风格来体验《魔兽世界》，不分职业、不分装备（除了你在赛局中捡到的），光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式，玩家在加入海盗主题的预赛大厅区域前，可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹，《巨龙崛起》和《魔兽世界：巫妖王之怒经典版》的玩家都可以获得奖励。

更新日志

2024年11月17日

PHP 实现base64编码文件上传出现问题详解

PHP,base64,编码文件,上传

Laravel Reponse响应客户端示例详解

PHP copy函数使用案例代码解析

评论“PHP 实现base64编码文件上传出现问题详解”

《魔兽世界》大逃杀！60人新游玩模式《强袭风暴》3月21日上线

更新日志

友情链接