MD5算法可以用来对用户密码进行加密存储吗？

admin

146339
文章

119
评论

2025年2月10日23:44:52评论23 views字数 2551阅读8分30秒阅读模式

最近在做一些通保的项目，大量的信息系统都是在用MD5算法进行用户密码的加密。

如——“用户密码采用MD5加密存储、用户密码采用 MD5+salt 加密存储”

这样目前是被通保合规认可的。

不过，我有两点需要澄清：

1、MD5本身是一个散列函数，主要用于消息完整性保护的，非可逆（也就是说不能从用MD5处理过的值倒推回原始密码），并不是加密算法呢。

2、MD5算法本身并不具有强安全性，2004年，王小云教授带领的研究小组就破解了MD5算法；2014年2月，微软就宣布要废弃MD5算法。

下面分别从这两点说明，做通保的同学后续可以在这个基础上进一步讨论。

一、MD5是个啥？

MD5就是一个散列函数，用于提供消息完整性保护。这个是散列函数通用的功能，散列函数也叫哈希函数（Hash Function）是一种将任意长度的输入数据（通常称为“消息”或“键”）转换为固定长度输出（通常称为“哈希值”或“摘要”）的函数。

MD5，不管输入多少字节（可以是文件、图片、视频、压缩包、），输出永远是16个字节（16*8byte=128byte）。而且，输入如果改变了一个byte，输出就会完全不同。感兴趣的可以在网上找一些MD5在线计算工具，试试看。

Hello word！—— F4DECA240C3EB47E

Hello word —— AF77DDB8E72BF344

因为这个原因，MD5常用来做密码保护、文件完整性校验和数字签名。

密码保护：我们信息系统经常会存储用户密码的MD5后的值，而不存用户的原始密码，这样，当用户输入密码时候，会生成一个MD5值和存储的MD5值进行比较，当相等即认为校验通过。这样的好处是，即便密码数据库被盗，也无法通过MD5反推明文是什么。

文件完整性校验：网络中，经常出现丢包现象，为了校验收到的文件和发送的文件一致性，通常在发送文件时进行一次MD5，并将这个值一起发给接收端。接收端收到文件后再进行一次MD5，将这两个值做比较，这样就可以判断文件是否一致。

数字签名：发送方首先使用MD5算法对需要签名的消息进行哈希计算，生成一个固定长度的哈希值（128位）；然后，发送方使用自己的私钥对生成的哈希值进行加密，生成数字签名。

我们看到，这个签名是分两步走的，首先是要生成一个哈希值，然后是把这个哈希值加密。这样才形成了一个数字签名，只是简单的哈希一下，是不能叫数字签名的哦。因为很可能被篡改。只有通过这种不对称密码体系做加密，接收方才可以确认消息确实来自声称的发送者，这才能有数字签名的作用。

如果大家对MD5具体的算法感兴趣，可以看我下面的参考学习链接。人家都讲得很好，动画呈现，我就不文字赘述了。

二、MD5为啥不安全了？

前面我们说到，MD5实际上是一个散列算法而非加密算法，所以我们不会把MD5的散列值拿来还原原始明文。因为MD5的计算过程有大量的信息损失，无法还原。

举个例子：一个200G的电影转换成128bit的MD5值，那你能想象这个128bit的MD5值还原成一个200G的电影吗？

既然不能还原密码，有啥可攻击呢？不是非常安全吗？

接下来从三个专业术语来说明它的理论的不安全和工程应用的不安全。

1、原像攻击

原像攻击，就是从128bit的MD5值找到任意一个原始的明文。

首先，我们要知道，原始文件和MD5值并不是一一对应的。任何原始文件计算的MD5值都是128位的MD5值，128位也就2的128次方，是有穷的；而任何原始文件应该是无穷多个的∞。以无穷对有穷，那理论上来说，任意一个MD5值都有无穷个原始文件对应。

这个就叫做碰撞💥。

只不过，我们难以找到这些碰撞而已。用暴力穷举的方式也比较难，2的128次方相当于鄱阳湖的整个水分子量，我们要在鄱阳湖中捞出某个特点的水分子，成本会有多大？除非是些简单弱密码，已经被存入彩虹表库了（彩虹表是一种预先计算好的哈希值与原始数据的对应关系表，主要用于快速查找已知哈希值的明文密码。它对简单的密码或常见的哈希值有效，但对于复杂或随机的输入，彩虹表的作用有限）

这就说明，原像攻击不太可行。所以，目前很多信息系统还在用MD5存储用户密码，就是利用了原像攻击难以实施的因素。

2、第二原像攻击（抗弱碰撞性）

第二原像攻击，就是给定一个原始明文，找到另外一个原始明文的MD5值和它一样。

这个目前也无法实现，第二原像攻击也不太可行。

3、抗碰撞性

找出任意两个MD5值相同的消息。这个在2004年就被我国王小云教授团队从学术角度成功突破。2007年，Marc Stevens研究出了进一步的成果，可以从原始内容生成两个内容不一样，但MD5值一样的消息。比如MD5值一样，但完全不一样的可执行程序。

这样，使用MD5做文件校验和数字签名就不再可行。

举例：一个金融类的应用，用MD5做签名的摘要算法，可以生成不同金额但MD5值一样的支票，到时候就可以扯皮了，因为已经无法确认消息的唯一性了。

回到文字题目的问题：MD5算法可以用来对用户密码进行加密存储吗？

前面提到几个专业术语，我们看到MD5的不安全并非全场景覆盖，主要还是在抗碰撞性方面存在问题，而在原像攻击和第二原像攻击层面还未有成熟的破解方法。

所以，目前在工程上，我们还可以用MD5算法进行用户密码的哈希存储（严格来说不能叫加密存储），但是，建议新开发的信息系统就不要用它了。哪怕你MD5加个盐都更好一些（至少可以不落入第二原像攻击的范畴，仅仅限制在原像攻击范围）。

一定要哈希，用SHA-256、SHA-3更安全。

THE END

参考学习，来自B站：

1】https://www.bilibili.com/video/BV1u44y1z7t1/?spm_id_from=333.337.search-card.all.click&vd_source=aa4c23baba91b14bd2b7f0cf706ec680

2】https://www.bilibili.com/video/BV1S541127qR/?spm_id_from=333.337.search-card.all.click&vd_source=aa4c23baba91b14bd2b7f0cf706ec680

原文始发于微信公众号（透明魔方）：MD5算法可以用来对用户密码进行加密存储吗？

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

MD5算法可以用来对用户密码进行加密存储吗？

Linux 命令实用清单指北

KDD2025｜Benchmarking Graph Foundation Models

ANTLR改进 — 像使用Tree-sitter一样使用ANTLR

巴西警方逮捕 IT 员工，涉超 1 亿美元网络盗窃案

114.114.114.114 与 8.8.8.8，国内外最火 DNS 谁更强？

如何面试 k8s 运维开发相关岗位

这4件事，蓝队一定不要在客户现场做

如何阅读标准

图片会泄露哪些信息？——信息安全科普系列之图片元数据

每个CISO都必须回答的10个棘手网络安全问题

发表评论