GB2312原文到GB2312机内码

admin 2018年5月10日18:12:00评论695 views字数 381阅读1分16秒阅读模式
摘要

01-09区 为特殊字符区
10-15区 为自定义区
16-87区 为汉字编码区当小于 0x80的时候 则被视为ANSCI码,被解析为英文
当大于 0x80 的时候(最高位为一),这个时候会将此位和后面一位,一起作为gb2312解析


GB2312原文到GB2312机内码

ANSCII

GB2312原文到GB2312机内码

GB2312原文到GB2312机内码

汉字编码国家标准

区位码

01-09区 为特殊字符区
10-15区 为自定义区
16-87区 为汉字编码区

GB2312原文到GB2312机内码

兼容演变:

  1. 1. 区位码标准中没有定义控制字符 解决方案: 将整个区位码向后移动32位(具体表现为每一字节都加上0x20)得到GB2312原码(国标码) 2. 原版ASCII与我们的初版国际码不兼容 解决方案: 将整个BG2312源码向后移动0x80(具体表现为每一字节都加上0x80)得到GB2312机内码

GB2312原文到GB2312机内码

机内码解析

当小于 0x80的时候 则被视为ANSCI码,被解析为英文
当大于 0x80 的时候(最高位为一),这个时候会将此位和后面一位,一起作为gb2312解析

字符集和编码方式的关系

字符集就是一堆字符的排序排列方式的集合。可以说跟电脑没关系
编码方式 指的是字符与计算机存储对应的映射关系

文件BOM头

BYTE ORDER MARK (字节顺序标记)

GB2312原文到GB2312机内码

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2018年5月10日18:12:00
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   GB2312原文到GB2312机内码https://cn-sec.com/archives/51237.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息