如何將RRD數(shù)據(jù)庫中數(shù)據(jù)導(dǎo)入MYSQL中

本篇文章為大家展示了如何將RRD數(shù)據(jù)庫中數(shù)據(jù)導(dǎo)入MySQL中，內(nèi)容簡明扼要并且容易理解，絕對能使你眼前一亮，通過這篇文章的詳細(xì)介紹希望你能有所收獲。

創(chuàng)新互聯(lián)公司是一家集網(wǎng)站建設(shè),正鑲白企業(yè)網(wǎng)站建設(shè),正鑲白品牌網(wǎng)站建設(shè),網(wǎng)站定制,正鑲白網(wǎng)站建設(shè)報價,網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,正鑲白網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè)，幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力。可充分滿足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿，時刻以成就客戶成長自我，堅持不斷學(xué)習(xí)、思考、沉淀、凈化自己，讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。

將RRD數(shù)據(jù)庫中數(shù)據(jù)導(dǎo)入MYSQL中
一、RRD數(shù)據(jù)庫及RRDTOOL簡介
意為Round Robin Database。設(shè)計理念為按照round-robin的方式進(jìn)行存儲，在一個周期之后（可自己定義），新的
數(shù)據(jù)會覆蓋掉原來的數(shù)據(jù)。所以RRD數(shù)據(jù)庫適合用來存儲動態(tài)數(shù)據(jù)，并且不需長期存儲。因為是周期性的覆蓋舊的數(shù)據(jù)
所以數(shù)據(jù)庫的大小基本上就會固定下來，并不會隨著時間而增大。

RRDTOOL是由Tobias Oetiker開發(fā)的自由軟件，使用RRD作為存儲格式。RRDTOOL提供了很多工具用來對RRD數(shù)據(jù)庫 www.2cto.com
進(jìn)行操作，包括創(chuàng)建，更新，查詢，以及生成顯示圖等。RRDTOOL同時也提供了很多語言的API以方便操作。

Ganglia是一個分布式的監(jiān)控系統(tǒng)，采用RRD數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲和可視化。Hadoop包里即有一個與ganglia相關(guān)
的配置文件，修改一些參數(shù)和對ganglia進(jìn)行一些設(shè)置即可對hadoop集群進(jìn)行監(jiān)控。每個不同的屬性的數(shù)據(jù)都存在一個
RRD數(shù)據(jù)庫里。

二、將數(shù)據(jù)導(dǎo)入MYSQL中
也會存在這樣的情況，可能想對rrdtool采集到的數(shù)據(jù)進(jìn)行長期存儲，從而進(jìn)行一些分析。而RRD數(shù)據(jù)庫的數(shù)據(jù)是不斷
更新的，雖然也可以保留長期的數(shù)據(jù)，但精度不夠。比如說一個RRD數(shù)據(jù)庫的步長為15秒，也就是說，每隔15秒，
就會有一個新的值存入（比如內(nèi)存使用率），同時覆蓋一個舊的值。一個RRD數(shù)據(jù)庫存儲5761個這樣的數(shù)據(jù)（一天+15 www.2cto.com
秒).而且隨著時間的推移總是存儲最近一天的數(shù)據(jù)。然后在通過這些值不斷地計算步長更高的值，比如我們可以通過
這些15秒的數(shù)據(jù)算出360s的數(shù)據(jù)（平均值），然后以360s為步長將這些值再存進(jìn)去，不過這時候可以存儲的時間區(qū)間就
更長了，同樣的行數(shù)可以存儲24天的數(shù)據(jù)。以此類推，也可以以一天為單位存儲一年的數(shù)據(jù)，不過這時候的精度就只有
一天了，那些舊的15s的數(shù)據(jù)都已經(jīng)被覆蓋掉了。如果想要把這些數(shù)據(jù)都存儲起來，就需要通過腳本定時進(jìn)行數(shù)據(jù)導(dǎo)入。
LINUX上做這些是很方便的，perl,python,lua,ruby都是不錯的選擇，shell也可以。然后用crond設(shè)置在一定時間
定時執(zhí)行即可。以下是python的示例代碼：
（注：python學(xué)的一般，基本上是邊看書，邊寫的代碼，問題不少，請各位指正。）

首先是初始化，創(chuàng)建數(shù)據(jù)庫及相應(yīng)的表：
import os
import MySQLdb
import string

root="/var/lib/ganglia/rrds/hap-clu"
dirs=os.listdir(root)

map1=string.maketrans('.','_')
map2=string.maketrans('-','_')

conn=MySQLdb.connect(host='localhost', user='root',passwd='123456')
cursor=conn.cursor() www.2cto.com

for onedir in dirs:
dbname=onedir.translate(map1).translate(map2)
cursor.execute("create database if not exists "+dbname)
conn.commit()
conn.select_db(dbname)
# print onedirname
print "DB:"+dbname+" ."
files=os.listdir(root+"/"+onedir)
for onefile in files:
tablename=onefile[:-4].translate(map1)
if(dbname=="__SummaryInfo__"):
cursor.execute("create table if not exists "+tablename+"(time_id int not null primary key,value varchar(30),num varchar(30))")
else:
cursor.execute("create table if not exists "+tablename+"(time_id int not null primary key,value varchar(30))")
conn.commit()
# print "CREATE TABLE "+tablename
print "CREATE DATABASE "+dbname+" "

cursor.close();

這里面有不少說明的地方：
1.存儲的目錄：ganglia里面默認(rèn)是這個目錄，不過可以修改。其他不同應(yīng)用也應(yīng)該不同。最后的那個hap-clu是集群 www.2cto.com
的名字。在這個目錄下，每個節(jié)點占一個目錄，目錄名一般為IP地址，最后還有一個summary的目錄。對應(yīng)著，為每個
目錄（節(jié)點）創(chuàng)建一個數(shù)據(jù)庫，每個屬性一個表。
2.MYSQL數(shù)據(jù)庫和表的命名規(guī)則中不允許有"."和"-"，所以對應(yīng)的數(shù)據(jù)庫名和表名要做相應(yīng)的轉(zhuǎn)換。這里使用的是
translate函數(shù)。

3.原本以為這個腳本只需執(zhí)行一次，不過在實際應(yīng)用過程中，發(fā)現(xiàn)表的數(shù)量和數(shù)據(jù)庫的數(shù)量可能會增加。比如有新添加的
節(jié)點，就需要及時為它創(chuàng)建數(shù)據(jù)庫。對于一些已存在的節(jié)點，有可能有些屬性的數(shù)據(jù)是后來才檢測到的。比如我碰到的情況
就是運行了一段時間之后關(guān)于swap的統(tǒng)計信息才出來，RRD數(shù)據(jù)庫也才創(chuàng)建。我不知道這是配置的問題還是常態(tài)。但為了
順利運行，這個腳本也要每天和插入數(shù)據(jù)的腳本一樣定時運行，并且在后者之前。

插入數(shù)據(jù)的腳本：
import os
import commands
import MySQLdb
import string
import rrdtool
#from xml.etree.ElementTree import ElementTree
www.2cto.com

#working directory
root="/var/lib/ganglia/rrds/hap-clu"
dirs=os.listdir(root)

#mysql table name limit
map1=string.maketrans('.','_')
map2=string.maketrans('-','_')

conn=MySQLdb.connect(host='localhost', user='root',passwd='123456')
cursor=conn.cursor()

for onedir in dirs:
dbname=onedir.translate(map1).translate(map2)
conn.select_db(dbname)

print "DB:"+dbname+" ."
files=os.listdir(root+"/"+onedir)
os.chdir(root+"/"+onedir)
for onefile in files:
# it seems that all is AVERAGE
tablename=onefile[:-4].translate(map1)
data=rrdtool.fetch(onefile,"AVERAGE")
firsttime=data[0][0] www.2cto.com
count=0
while count < 5761:
time=firsttime+15*count
value=data[2][count][0]
if value==None:
count+=1
continue
if dbname=="__SummaryInfo__":
num=data[2][count][1]
fvalue=[time,str(value),str(num)]
try:
cursor.execute("insert into "+tablename+" values(%s,%s,%s)",fvalue)
except MySQLdb.IntegrityError:
pass
else: www.2cto.com
fvalue=[time,str(value)]
try:
cursor.execute("insert into "+tablename+" values(%s,%s)",fvalue)
# print "OK"+str(count)
except MySQLdb.IntegrityError:
pass www.2cto.com

count+=1
conn.commit()
print "UPDATING TABLE "+tablename
cursor.close();

說明：

1.python有RRDTOOL的模塊，相應(yīng)的命令都已經(jīng)可以通過模塊內(nèi)的函數(shù)直接調(diào)用，并且結(jié)果是的列表或者元組
，很容易遍歷。另外有一種方法就是通過調(diào)用外部命令將rrd導(dǎo)出到XML中（RRDTOOL內(nèi)置有此功能），好處是XML
里面的數(shù)據(jù)極其相近，缺點是太繁瑣，效率也不高，還要解析XML。
2.count是RRD里存儲的數(shù)據(jù)的行數(shù)，這里為了省事直接設(shè)置成了默認(rèn)的值。嚴(yán)謹(jǐn)?shù)脑拺?yīng)該是先通過RRDTOOL INFO取得
想關(guān)的結(jié)構(gòu)信息，得到這個值，然后再調(diào)用。rrdtool.fetch即可取得所存儲的所有值。
3.關(guān)于commit。剛開時對API不熟悉，沒有加這一句，結(jié)果數(shù)據(jù)都沒導(dǎo)進(jìn)去。第一次加在每次insert 之后，結(jié)果插入 www.2cto.com
速度奇慢，更新一次要差不多一天，根本沒有用。放到后面之后就很快了。

4.因為插入的頻率和RRD更新的頻率不一樣，為了保證數(shù)據(jù)的連續(xù)性（不丟失），插入的頻率要比更新的頻率高。這樣會有
很多重復(fù)的數(shù)據(jù)，這里用主鍵（時間戳，為UNIX秒數(shù)）和IntegrityError來跳過那些已經(jīng)插入的數(shù)據(jù)。當(dāng)初這樣做的時候
已經(jīng)考慮到一個問題，就是當(dāng)表里原有行數(shù)很多時，到后面插入的速度有多慢？（單個表每天更新的數(shù)據(jù)為5700行左右，一個
月為17萬行左右，一年就會超過200萬行）?，F(xiàn)在我運行的結(jié)果是表中已有5萬行數(shù)據(jù)，插入速度并沒有明顯的減慢，想接著再
運行一段時間觀察一下。如果太慢就得換一個方法。

上述內(nèi)容就是如何將RRD數(shù)據(jù)庫中數(shù)據(jù)導(dǎo)入MYSQL中，你們學(xué)到知識或技能了嗎？如果還想學(xué)到更多技能或者豐富自己的知識儲備，歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

分享題目：如何將RRD數(shù)據(jù)庫中數(shù)據(jù)導(dǎo)入MYSQL中
文章起源：http://weahome.cn/article/gdgpgj.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

如何將RRD數(shù)據(jù)庫中數(shù)據(jù)導(dǎo)入MYSQL中

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管