Base64是一種基于64個(gè)可打印字符來表示二進(jìn)制數(shù)據(jù)的表示方法。由于2的6次方等于64,所以每6個(gè)為一個(gè)單元,對應(yīng)某個(gè)可打印字符。
成都一家集口碑和實(shí)力的網(wǎng)站建設(shè)服務(wù)商,擁有專業(yè)的企業(yè)建站團(tuán)隊(duì)和靠譜的建站技術(shù),十年企業(yè)及個(gè)人網(wǎng)站建設(shè)經(jīng)驗(yàn) ,為成都1000+客戶提供網(wǎng)頁設(shè)計(jì)制作,網(wǎng)站開發(fā),企業(yè)網(wǎng)站制作建設(shè)等服務(wù),包括成都營銷型網(wǎng)站建設(shè),品牌網(wǎng)站制作,同時(shí)也為不同行業(yè)的客戶提供成都網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)的服務(wù),包括成都電商型網(wǎng)站制作建設(shè),裝修行業(yè)網(wǎng)站制作建設(shè),傳統(tǒng)機(jī)械行業(yè)網(wǎng)站建設(shè),傳統(tǒng)農(nóng)業(yè)行業(yè)網(wǎng)站制作建設(shè)。在成都做網(wǎng)站,選網(wǎng)站制作建設(shè)服務(wù)商就選成都創(chuàng)新互聯(lián)公司。
三個(gè)bites有24個(gè)比特,對應(yīng)于4個(gè)Base64單元,即3個(gè)字節(jié)需要用4個(gè)可打印字符來表示。它可用來作為電子郵件的傳輸編碼。
在Base64中的可打印字符包括字母A-Z、a-z、數(shù)字0-9,這樣共有62個(gè)字符,此外兩個(gè)可打印符號在不同的系統(tǒng)中而不同。
如在mime(多用途郵件擴(kuò)展)中,Base64的使用的64個(gè)可打印字符
A-Za-z:大小寫字母各26個(gè)
0-9:加上10個(gè)數(shù)字
+:加號
/:斜杠
一共64個(gè)字符,等號“=”用來作為后綴用途
對應(yīng)的轉(zhuǎn)換關(guān)系為
0-63:A-Za-z0-9+/
轉(zhuǎn)換的時(shí)候,將三個(gè)byte的數(shù)據(jù),先后放入一個(gè)24bit的緩沖區(qū)中,先來的byte占高位。數(shù)據(jù)不足3byte的話,于緩沖器中剩下的bit用0補(bǔ)足。然后,每次取出6(因?yàn)?6=64)個(gè)bit,按照其值選擇ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/
中的字符作為編碼后的輸出。不斷進(jìn)行,直到全部輸入數(shù)據(jù)轉(zhuǎn)換完成。
當(dāng)原數(shù)據(jù)長度不是3的整數(shù)倍時(shí), 如果最后剩下一個(gè)輸入數(shù)據(jù),在編碼結(jié)果后加2個(gè)“=”;如果最后剩下兩個(gè)輸入數(shù)據(jù),編碼結(jié)果后加1個(gè)“=”;如果沒有剩下任何數(shù)據(jù),就什么都不要加,這樣才可以保證數(shù)據(jù)還原的正確性。
實(shí)例分析:
編碼:"Lailaiji"
通過查ASCII表找到對應(yīng)關(guān)系
L:0x4c | a:0x61 | i:0x69 | l:0x6C | j:0x6A
因此轉(zhuǎn)換成二進(jìn)制為:0100 1100 , 0110 0001 , 0110 1001 , 0110 1100 , 0110 0001 , 0110 1001 , 0110 1010 , 0110 1001
第一步:先取三個(gè)字節(jié)的數(shù)據(jù)即:0100 1100 , 0110 0001 , 0110 1001,然后從這個(gè)三字節(jié)中取出6位即010011,在最高位補(bǔ)充兩個(gè)位00使其成為1個(gè)byte,即0001 0011,剩余的18位也如此循環(huán),最終這三個(gè)字節(jié)將擴(kuò)展成為4個(gè)字節(jié)即:0001 0011, 0000 0110, 0000 0101, 0010 1001
第二步,從剩余的字節(jié)序列中再重復(fù)第一步,走到小于3個(gè)字節(jié)
第三步,這時(shí)剩余字節(jié)為:0110 1010,0110 1001不足3個(gè)字節(jié),需要在從低位以0進(jìn)行補(bǔ)充,即成0110 1010,0110 1001,0000 0000重復(fù)第一步,得到:0001 1010,0010 0110, 0010 0100, 0000 0000,
經(jīng)過以后的運(yùn)算后,我們將得到一組位序列:
0001 0011, 0000 0110, 0000 0101, 0010 1001
0001 1011,0000 0110, 0000 0101, 0010 1001
0001 1010,0010 0110, 0010 0100, 0000 0000
轉(zhuǎn)換成十進(jìn)制為:19,6,5,41,27,6,5,41,26,38,36,0
對應(yīng)的字符為:T,G,F,p,b,G,F,p,a,m,k,A
特別注重的是,最后一個(gè)字節(jié)0000 0000即0x00,通過查表為A,由于最后這8位是補(bǔ)充的,所以它應(yīng)當(dāng)被轉(zhuǎn)換成=號,而不是A
因此:最終結(jié)果為:TGFpbGFpamk=
PHP實(shí)現(xiàn):
encode($input); echo "Encode:",$output.PHP_EOL; $output = $obj->decode($output); echo "Decode:",$output.PHP_EOL; class MyBase64{ private $_table = array(); private $_revtable = array(); public function __construct(){ $this->_initTable(); } public function decode($string) { $orign_len = strlen($string); $j = 0; $ret = null; for($i=0; $i<$orign_len; $i+=4) { $chr1 = $this->getRevChr($string[$i]); $chr2 = $this->getRevChr($string[$i+1]); $chr3 = $this->getRevChr($string[$i+2]); $chr4 = $this->getRevChr($string[$i+3]); $_chr1 = $chr1<<2 | ($chr2&0x3F) >>4; $_chr2 = ($chr2&0x0F)<<4 | ($chr3&0xFC) >>2; $_chr3 = ($chr3&0x03)<<6 | $chr4; $ret .= chr($_chr1); $ret .= chr($_chr2); $ret .= chr($_chr3); } $ret = rtrim($ret); return $ret; } private function getRevChr($chr) { if(isset($this->_revtable[$chr])) { return $this->_revtable[$chr]; }else{ return 0; } } public function _decode($string) { $orign_len = strlen($string); $de = null; $kv = array_flip($this->_table); $b = null; for($i = 0 ;$i < $orign_len;$i++) { $chr = $string[$i]; if($chr != '='){ $c = $kv[$chr]; }else{ $c = chr(0); } printf("%x",$c); $b[] = pack('C',$c); echo PHP_EOL; } for($i = 0 ;$i < count($b);$i+=3){ $ch2 = ($b[$i]<<2) | ($b[$i+1]>>4); $ch3 = ($b[$i+1]<<4) | ($b[$i+2]>>2); $ch4 = ($b[$i+2]<<6) | ($b[$i+3]); printf('%08b,%08b,%08b',$ch2,$ch3,$ch4); echo PHP_EOL; printf('%08b,%08b',($b[$i]<<2) , ($b[$i+1]>>4)); echo PHP_EOL; } } public function encode($string) { $orign_len = strlen($string); $len = intval(ceil($orign_len/3)*3); $bin = pack('a'.$len,$string); $gen = null; for($i=0; $i<$len; $i+=3) { $ch2 = ord($bin[$i]) >> 2; $ch3 = ((ord($bin[$i]) & 0x03) << 4) | (ord($bin[$i+1]) >> 4); $ch4 = ((ord($bin[$i+1]) & 0x0F) << 2) | ((ord($bin[$i+2]) & 0xC0) >> 6); $ch5 = ord($bin[$i+2]) & 0x3F; $gen.= $this->_table[$ch2]; $gen.= $this->_table[$ch3]; $gen.= $this->_table[$ch4]; $gen.= $this->_table[$ch5]; } if($orign_len-$len){ $gen = substr($gen,0, -abs($orign_len-$len)); for($i=0;$i<$len-$orign_len;$i++) { $gen .= '='; } } return $gen; } private function _initTable() { $tbl = array(); for($i=ord('A');$i<=ord('Z');$i++) { $tbl[] = chr($i); } for($i=ord('a');$i<=ord('z');$i++) { $tbl[] = chr($i); } for($i=ord('0');$i<=ord('9');$i++) { $tbl[] = chr($i); } $tbl[] = '+'; $tbl[] = '/'; $reverse = array_flip($tbl); $this->_table = $tbl; $this->_revtable = $reverse; } }