【密码学】一文看懂字符集的概念

admin 2024年2月5日15:25:32评论14 views字数 675阅读2分15秒阅读模式

【密码学】一文看懂字符集的概念

【密码学】一文看懂字符集的概念

【密码学】一文看懂字符集的概念

码点知识补充

  1. 「基本多文种平面(BMP)」
    • 这是最初的Unicode字符集,也称为平面0。
    • 码点范围是从U+0000到U+FFFF,涵盖了大多数常用的字符。
    • 包括如英语、阿拉伯语、希伯来语和大部分现代文字。
  2. 「补充多文种平面(SMP)」
    • 又称为平面1。
    • 码点范围是从U+10000到U+1FFFF。
    • 涵盖了不那么常用但仍然十分重要的字符,比如哥特字母、古代文字和一些历史字符。
  3. 「补充表意文字平面(SIP)」
    • 又称为平面2。
    • 码点范围是从U+20000到U+2FFFF。
    • 包含了额外的中日韩汉字(CJK),有助于涵盖历史文献中罕见的字。
  4. 「其他平面」
    • Unicode理论上设计了17个平面(从平面0到平面16),每个平面拥有65536个码点。
    • 这包括了3到13平面(U+30000到U+DFFFF)目前大部分没有被使用,被称为“尚未指定的平面”。
  5. 「特殊用途的码点」
    • 高位替代区(High Surrogates,U+D800—U+DBFF)和低位替代区(Low Surrogates,U+DC00—U+DFFF):用于UTF-16编码。
    • 私有使用区(Private Use Areas,PUAs):从U+E000到U+F8FF,U+100000到U+10FFFF等区域,供私人使用,不会被Unicode赋予具体字符。
  6. 「控制字符和特殊字符」
    • Unicode还包含了多个控制字符区域,用于文本控制和格式化,这些通常不表示任何的打印字符。

参考资料

  • https://en.wikipedia.org/wiki/Unicode

原文始发于微信公众号(Coder小Q):【密码学】一文看懂字符集的概念

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2024年2月5日15:25:32
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   【密码学】一文看懂字符集的概念http://cn-sec.com/archives/2398315.html

发表评论

匿名网友 填写信息