Base64编码C语言实现

2021年1月26日19:37:03评论299 views字数 2659阅读8分51秒阅读模式

Base64编码C语言实现

Base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于{displaystyle log _{2}64=6}{displaystyle log _{2}64=6}，所以每6个比特为一个单元，对应某个可打印字符。3个字节相当于24个比特，对应于4个Base64单元，即3个字节可由4个可打印字符来表示。它可用来作为电子邮件的传输编码

编码

一开始先要算一下一共多少位，比如对 qwer 进行编码

按照每 3 字节可以转为 4 个的规则，len(qwer) mod 3 = 1 也就是说多出来 1 字节，那我们要补充 2 字节进去才能凑够 3 字节

放在 C 语言里可以这么写，其中 src 是待编码的数据

char table[65]="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
//定义的字典,根据这个找具体在哪里
fill_bit=((3-strlen(src)%3)%3);
for(int k=0;k<fill_bit;k++){
    src[data_length+k]='0';
}

然后就到了编码部分了，在此之前还要先介绍一下位操作

每个字节有 8 bit，比如 q 就是 01110001，按位与操作 & 做的就是相同为 1 不同为 0

那 q 与 3 进行与运算就是：

01110001 & 0011 = 1

左移、右移的概念在这里就是把它直接移动就好了，比如 q 右移 2 位：就是 01110001 的后两位给移动出去，只剩下前 6 位 011100，然后前面补两个 0

int j=0;
for(int i=0;i<data_length;i+=3){
    index=src[i]>>2;
    result[j++]=table[index];
    index=((src[i]&3)<<4)+(src[i+1]>>4);
    result[j++]=table[index];
    index=((src[i+1]&15)<<2)+(src[i+2]>>6);
    result[j++]=table[index];
    index=(src[i+2]&63);
    result[j++]=table[index];
    //<< >> 运算符的优先级低于+ -，注意加括号
}

index=src[i]>>2 是把第一个 'q' 向右移了 2 位，也就是取前 6 个 bit，得到了 011100 也就是 28

result[j++]=table[index] 然后在字典中找第几位，作为结果，在字典中第 28 个是 c，所以就有了编码后的第一个字符 'c'

src[i]&3 作用是取第一个 'q' 的后两位，然后 (src[i]&3)<<4 左移4位，再加第二个 'w' src[i+1]>>4 右移 4 位得到的前 4 位，一共 6 bit

src[i+1]&15 是取第二个 'w' 后四位（15 是 1111），左移 2 位，然后加上第三个 'e' 右移 6 位 src[i+2]>>6 得到的前 2 位，一共 6 bit

最后再直接取第三个 'e' 的后 6 位 src[i+2]&63（63 是 111111）

这样一个循环就结束了，把三个变成了四个

下一个循环中前面补充的两个 0，在这是:

011100 100000 000000 000000

然后把 '0' 字符替换为 '='

result_length=strlen(result);
for(int k=0;k<fill_bit;k++){
    result[result_length-1-k]=padding_char; 
}

cXdlcg==

解码

int findchr(char *array,char ch){
    for(int i=0;i<strlen(array);i++){
        if(array[i]==ch){
            return i;
        }
    }
    return 0;
}

对于前面编码的每一个字符，都要从 table 表里面去找对应的字符，比如 'A' 应该是 0

for(int i=0;i<base_len;i++){
    if(src[i]==padding_char)
        src[i]='A';
}
for(int i=0;i<base_len;i+=4){
    result[j++]=(findchr(table,src[i])<<2)+((findchr(table,src[i+1])& 0xF0)>>4);
    result[j++]=((findchr(table,src[i+1])& 0x0F)<<4)+((findchr(table,src[i+2])& 0x3C)>>2);
    result[j++]=((findchr(table,src[i+2])& 0x03)<<6)+(findchr(table,src[i+3]));
}

首先可以把前面的 = 换成 A（因为不存在末尾是 A 的那种 base64 编码值，因为这样的话应该本来后 6 位为 0，在 ascii 表中是没有的）

然后按照从表里面找出来的位置进行位操作，这里拿前面编码后的 cXdlcg== 来举例子

比如 'c' 在表中是第 28 位，00011100，向左移动 2 位，那他就是 01110000，再加上表中 'X'（23 也就是 00010111），向右移动 4 位得到 00000001，两者相加得到 01110001 即 113 也就是 'q'

剩下的也一样：

01110000 ＋ 00000111 = 01110111 = 119 = 'w'
01000000 + 00100101 = 01100101 = 101 = 'e'

到这里，一轮就结束了，用了 src[0]、src[1]、src[2]、src[3]，解码出来 qwe

接下来 src[4] 到了 'c'，00100011

01110000 + 00000010 = 01110010 = 114 = 'r'
00000000 + 00000000 = 00000000 = null
00000000 + 00000000 = 00000000 = null

解码结束

C 语言文件：

https://pan.baidu.com/s/1mBQA9dT48Y1ZgnBUOui5lg

提取码: g79b

ps.源码是很久之前保存的，忘了是在哪里找的了，又搜了一下估计是来自这里：

https://eqqie.cn/index.php/laji_note/785/

本文始发于微信公众号（陈冠男的游戏人生）：Base64编码C语言实现

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

Base64编码C语言实现

编码

解码

远程开发引起的隐形风险与合规守护

Perl 语言基础入门

Rust标准黑客工具设计实现分析

插件前台任意文件读取漏洞复现与分析 (CVE-2025-2294)

汇编语言Day07

JavaWeb代码审计实战开源系统学习心得

【知识回顾】RedTeam 工具开发原则 - 基础知识

脚本小子进阶之路——Shell编程简介

javaFx 教程二

实战某凤网站导致的代码审计

发表评论

在线咨询

微信