QR二维码原理简介
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
QR二维码原理简介深圳市文鼎创数据科技有限公司
修订历史记录
目录
QR二维码原理简介 (1)
1.二维码简介 (3)
2.QR二维码的组成结构 (4)
2.1基础知识 (4)
2.2数据编码 (5)
2.3结束符和补齐符 (7)
2.4补齐码(Padding Bytes) (8)
2.5纠错码 (8)
2.6最终编码 (9)
3.形成二维码图案 (10)
3.1定位和功能性图案 (10)
3.2数据和数据纠错码 (14)
3.3掩码图案 (15)
1.二维码简介
二维码技术的研究始于20世纪80年代末,在二维码符号表示技术研究方面已研制出多种码制,有PDF417、QR Code、Code 49、Code 16K、Code One等。二维码比传统的Bar Code 条形码能存更多的信息,也能表示更多的数据类型:比如:字符,数字,日文,中文等等。如今应用最常见的二维码是QR Code,全称Quick Response Code。
2.QR二维码的组成结构
2.1基础知识
首先,QR二维码(以下简称二维码)一共有40个尺寸,官方叫版本Version。Version 1是21 x 21的矩阵,Version 2是25 x 25的矩阵,每增加一个version,就会增加4的尺寸,公式是:(V-1)*4 + 21(V是版本号)最高Version 40,(40-1)*4+21 = 177,所以最高是177 x 177 的正方形。
下面我们看看一个二维码的样例:
2.1.1定位图案
•Position Detection Pattern是定位图案,用于标记二维码的矩形大小。这三个定位图案有白边叫Separators for Postion Detection Patterns。之所以三个而不是四个意思就是三个就可以标识一个矩形了。
•Timing Patterns也是用于定位的。原因是二维码有40种尺寸,尺寸过大了后需要有根标准线,不然扫描的时候可能会扫歪了。
•Alignment Patterns 只有Version 2以上(包括Version2)的二维码需要这个东东,同样是为了定位用的。
2.1.2功能性数据
•Format Information 存在于所有的尺寸中,用于存放一些格式化数据的。
•Version Information 在>= Version 7以上,需要预留两块3 x 6的区域存放一些版本信息。
2.1.3数据码和纠错码
•除了上述的那些地方,剩下的地方存放Data Code 数据码和Error Correction Code 纠错码。
2.2数据编码
我们先来说说数据编码。QR码支持如下的编码:
2.2.3Numeric mode数字编码,从0到9。如果需要编码的数字的个数不是3的倍数,那么,最后剩下的1或2位数会被转成4或7bits,则其它的每3位数字会被编成10,12,14bits,编成多长还要看二维码的尺寸(下面有一个表Table 3说明了这点)
Alphanumeric mode字符编码。包括0-9,大写的A到Z(没有小写),以及符号$ % * + – . / : 包括空格。这些字符会映射成一个如2.2.1所示的字符索引表(其中的SP是空格,Char是字符,Value是其索引值)编码的过程是把字符两两分组,然后转成表2.2.1所示的45进制,然后转成11bits的二进制,如果最后有一个落单的,那就转成6bits的二进制。而编码模式和字符的个数需要根据不同的Version尺寸编成9, 11或13个二进制(如下表中Table 3)
2.2.1 字符索引表
Byte mode, 字节编码,可以是0-255的ISO-8859-1字符。有些二维码的扫描器可以自动检测是否是UTF-8的编码。
Kanji mode这是日文编码,也是双字节编码。同样,也可以用于中文编码。日文和汉字的编码会减去一个值。如:在0X8140 to 0X9FFC中的字符会减去8140,在0XE040到0XEBBF中的字符要减去0XC140,然后把结果前两个16进制位拿出来乘以0XC0,然后再加上后两个
16进制位,最后转成13bit的编码。如下图示例:
Extended Channel Interpretation (ECI) mode主要用于特殊的字符集。并不是所有的扫描器都支持这种编码。
Structured Append mode用于混合编码,也就是说,这个二维码中包含了多种编码格式。
FNC1 mode这种编码方式主要是给一些特殊的工业或行业用的。比如GS1条形码之类的。下面两张表中,
•Table 2 是各个编码格式的“编号”,这个东西要写在Format Information中。注:中文是1101
•Table 3 表示了,不同版本(尺寸)的二维码,对于,数字,字符,字节和Kanji模式下,对于单个编码的2进制的位数。(在二维码的规格说明书中,有各种各样的编码规范表,后面还会提到)
示例一:数字编码
2.2.3Numeric mode数字编码,从0到9。如果需要编码的数字的个数不是3的倍数,那么,
最后剩下的1或2位数会被转成4或7bits,则其它的每3位数字会被编成10,12,14bits,编成多长还要看二维码的尺寸(下面有一个表Table 3说明了这点)
在Version 1的尺寸下,纠错级别为H的情况下,下面是01234567这八个数字的编码流程。
1. 把上述数字分成三组: 012 345 67
2. 把他们转成二进制:
012 转成0000001100;
345 转成010*******;
67 转成1000011。
3. 把这三个二进制串起来: 0000001100 010******* 1000011。
4. 把数字的个数转成二进制[version 1-H(表示版本号为1,纠错等级H)在TABLE3中对应的字符长度编码的二进制位数是10 bits ]:
01234567 这几个数字的个数的二进制是0000001000。
5. 把数字编码的标志0001和第4步的编码加到前面: 0001 0000001000 0000001100 010******* 1000011。
示例二:字符编码
在Version 1的尺寸下,纠错级别为H的情况下,下面是AC-42这五个字符的编码流程。
1. 从字符索引表中找到AC-42 这五个字条的索引(10,12,41,4,2)。
2. 两两分组: (10,12) (41,4) (2)。
3.把每一组转成11bits的二进制:
(10,12) :10*45+12 等于462 转成00111001110;
(41, 4 ) :41*45+4 等于1849 转成11100111001;
(2 , ) : 等于2 转成000010。
4. 把这些二进制连接起来:00111001110 11100111001 000010
5. 把字符的个数转成二进制[(Version 1-H)(表示版本号为1,纠错等级H) 在TABLE3中对应的字符长度编码的二进制位数是9 bits ]:5个字符,5转成000000101
6. 在头上加上编码标识0010 和第5步的个数编码: 0010 000000101 00111001110 11100111001 000010
从以上两个例子可以看出:
数字编码和字符编码的格式为
4个bits的编码标识+字符长度编码(位数需要查表)+数字或者字符编码
2.3结束符和补齐符
假如我们有个HELLO WORLD的字符串要编码,根据上面的示例二,我们可以得到下面的编码,
我们还要加上结束符: