UTF-8以 8位(即 1个字节)为单元对原始Unicode码进行编码,规定:多字节码(2个字节以上)以转换后第1个字节起头的连续“1”的数目(这些连续“1”称为标记位),表示转换成几个字节:“110”连续两个“1”,表示转换结果为2个字节,“1110”表示3个字节,而“11110”则表示4个字节……跟随在标记位之后的“0”,其作用是分隔标记位和字符码位 。第2~第4个字节的起头两个位固定设置为“10”,也作为标记,剩下的6个位才做为字符码位使用 。这样,2字节UTF-8码剩下11个字符码位,可用以转换0080~07FF的原始字符码,3字节剩下16个字符码位,可用以转换0800~FFFF的原始字符码,由此类推 。编码方式的模板如下:
Unicode符号范围(十六进制)|UTF-8编码方式(二进制)—————————————————————–0000 0000-0000 007F | 0xxxxxxx0000 0080-0000 07FF | 110xxxxx 10xxxxxx0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx编码使用的位数取决于语言,一般来讲,英文会被编码为1个字节,欧洲(拉丁),希伯来语和阿拉伯语用2个字节表示 。中文,日文,韩文和其他亚洲字符使用3个字节 。你可能发现了,原本为了解决占用过长的问题,但实际编码后中文长度变为了3字节,如果你的客户都是国内用户,使用GBK能部分提高网页内文本的传输效率 。
编码声明方式看起来正确声明编码类型很重要,那么,我们该如何指定编码呢?
只需在<head>中的meta声明使用的字符集即可,如下:
<html lang="en"><head><meta charset="utf-8"></head>除了以上方式外,我们还可以从HTTP请求/响应的Content-Type表头中声明 。
最后总结【数字11110的意思 11110什么意思】以上就是关于编码的一些简单的介绍,除了列举出的编码外,还有很多其他更多类型的编码,如果大家对其他的内容有补充,欢迎通过留言告诉我 。
- 李沁的男朋友是谁2022 李沁的结婚照
- 联想对中国做了什么 联想是怎么背叛中国的 知乎
- 电脑版微信扫描二维码 怎么扫描手机上的二维码图片
- DEGAlA衣服什么牌子的 degaia是什么牌子中文女装
- 自己的房子出租会影响风水吗 租客走前门进出对风水有影响吗
- 老屋翻新风水 老屋屋檐破碎风水
- 济南长途客运中心电话 济南风水最好的位置
- 隐居的世外高人 隐居的高人叫什么
- 微笑语录正能量一段话 微笑的句子唯美短句
- 美好时光回忆的唯美短句 回忆的句子唯美短句
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
