實際上為了更好的描述實體之間的關系,我們要是再繼續(xù)使用Redis的話,是不是感覺實體之間的關系不夠那么的明顯,雖然也是屬于NoSQL的一種,但是相對來說,Redis,表現實體之間的關系就沒有那么清晰了,為了更好的描述實體之間的關系,就會使用圖形數據庫來進行了,那么今天阿粉介紹的,就是一個圖形化的數據可,Neo4J。
專注于為中小企業(yè)提供成都網站制作、做網站、外貿營銷網站建設服務,電腦端+手機端+微信端的三站合一,更高效的管理,為中小企業(yè)那坡免費做網站提供優(yōu)質的服務。我們立足成都,凝聚了一批互聯網行業(yè)人才,有力地推動了近1000家企業(yè)的穩(wěn)健成長,幫助中小企業(yè)通過網站建設實現規(guī)模擴充和轉變。
Neo4j是一個世界領先的開源的基于圖的數據庫。 它是使用Java語言完全開發(fā)的。那么什么是圖數據庫呢?圖數據庫是以圖結構的形式存儲數據的數據庫。 它以節(jié)點,關系和屬性的形式存儲應用程序的數據。正如RDBMS以表的“行,列”的形式存儲數據,GDBMS以圖的形式存儲數據。
RDBMS與圖數據庫的區(qū)別
1.Tables 表Graphs 圖表
2.Rows 行Nodes 節(jié)點
3.Columns and Data 列和數據 Properties and its values屬性及其值
4.Constraints 約束Relationships 關系
5.Joins 加入Traversal 遍歷
說完了圖形數據庫,我們就來看看這個 Neo4J 數據庫吧
neo4j是用Java語言編寫的圖形數據庫,運行時需要啟動JVM進程,因此,需安裝JAVA SE的JDK。關于 Java 怎么安裝,我就不用再多廢話了吧,到時候別忘了檢測一下 Java 的版本就好了, java -version
接下來我們就是要進行一個安裝了,我們先去官網,下載社區(qū)版,企業(yè)版要收費的,注意哈。
官網地址
下載完成,直接開始安裝,傻瓜式操作即可。
Neo4j應用程序有如下主要的目錄結構:
注意,如果你使用的是Zip的壓縮包來進行的使用的話,那么你就需要注意一些地方,比如你如果是用 Zip 的包解壓之后,并且想要通過 bat 的命令啟動,直接在目錄下進行 cmd ,然后 neo4j.bat ,這時候可能會出現一個問題,就是版本可能會出現問題,你如果下載使用的是最新版的 Neo4J ,那么就可能會讓你使用 JDK 11 ,而阿粉就是踩過了這個大坑之后,才發(fā)現,bat 閃退的原因。
這樣就是說明我們的 JDk 的版本對應的和 Neo4J 需要的 JDK 是不匹配的,我們就需要換一下我們的 JDK 了。把他換成 JDK 11 就好了,再次啟動。
這時候,我們就直接訪問 localhost:7474 的端口,直接就能看到如下的畫面, 1.jpg
剛進入的時候可能需要大家輸入帳號密碼,默認的帳號密碼就是,neo4j 修改成你想要的就行了。
這樣登錄進去我們就能開始正式學習 Neo4J 的所有內容了。
Neo4j - CQL語法
我們在講語法之前首先我們先得看看 Neo4J 的構建模塊,不然之后的查詢都是無意義的。
Neo4j圖數據庫主要有以下構建塊 -
節(jié)點是圖表的基本單位。 它包含具有鍵值對的屬性,如下所示
屬性是用于描述圖節(jié)點和關系的鍵值對
關系是圖形數據庫的另一個主要構建塊。 它連接兩個節(jié)點,如下所示。
Label將一個公共名稱與一組節(jié)點或關系相關聯。 節(jié)點或關系可以包含一個或多個標簽。 我們可以為現有節(jié)點或關系創(chuàng)建新標簽。 我們可以從現有節(jié)點或關系中刪除現有標簽。
Neo4j數據瀏覽器 一旦我們安裝Neo4j,我們可以訪問Neo4j數據瀏覽器使用以下URL
http:// localhost:7474 / browser /
CREATE 語法
CREATE ( : )
它是我們要創(chuàng)建的節(jié)點名稱。
它是一個節(jié)點標簽名稱
我們可以創(chuàng)建一個節(jié)點,然后給他安排上一個標簽
CREATE (emp:Employee)
當我們看到
Added 1 label, created 1 node, completed after 74 ms.
這就創(chuàng)建成功了,
那么怎么查看呢?
MATCH語法
MATCH ( : ) return xxx
是這個樣子的
但是看到里面竟然沒有東西,就相當于是一個空的對象,那是不是就應該給里面放入屬性的操作呢?沒錯,肯定有
CREATE (emp:Employee{ id : 1001 ,name :"lucy", age : 10})
Added 1 label, created 1 node, set 3 properties, completed after 163 ms. 創(chuàng)建成功。
我們再次查看就能看到
如果我們想只要其中的一些對象的屬性,而不是全部屬性,那應該怎么操作呢?
RETURN語法
RETURN 可以返回的是一個對象,也可以是對象中的屬性,比如:
結果就是下面這個樣子的,大家看一下,是不是感覺還是挺好用的。
** WHERE語法**
WHERE
為什么在前面的位置阿粉說,CQL 是和 SQL 類型的,這完全是因為很多東西和 SQL 是類似的。
結果如下:
相同的還有
布爾運算符 描述 AND 和 OR 或者 NOT 非 XOR 異或
比較運算符 描述 = “等于”運算符 “不等于”運算符 “小于”運算符 “大于”運算符 = “小于或等于”運算符。 = “大于或等于”運算符。
DELETE語法
刪除語法必然是有的,因為有創(chuàng)建,肯定有刪除。
DELETE
但是這個命令也不是單獨使用的哈,
MATCH (e: Employee) DELETE e
直接刪除成功。
基礎的東西講完了,阿粉就得說說這個比較重要的內容了,關系,
我們之前創(chuàng)建節(jié)點的時候,那叫一個簡單舒適加愉快,但是創(chuàng)建關系就比較復雜了,因為需要考慮如何匹配到有關系的兩個節(jié)點,以及關系本身的屬性如何設置。這里我們就簡單學一下如何建立節(jié)點之間的關系。
由于Neo4j CQL語法是以人類可讀的格式。 Neo4j CQL也使用類似的箭頭標記來創(chuàng)建兩個節(jié)點之間的關系。
每個關系( )包含兩個節(jié)點
在Neo4j中,兩個節(jié)點之間的關系是有方向性的。 它們是單向或雙向的。
如果我們嘗試創(chuàng)建一個沒有任何方向的關系,那么就會報錯。
關系創(chuàng)建語法
CREATE ( )-[ ]-( )
我們這里直接使用創(chuàng)建新的節(jié)點來創(chuàng)建關系。
提示創(chuàng)建成功
這里關系名稱是“CONTAINS”
關系標簽是“contains”。
這么看是看不出有啥關系的,但是,我們可以從另外的一個位置
這樣看下來,這個 Neo4J 簡單操作是不是就學會了,阿粉接下來的文章中講怎么使用 Java 來操作 Neo4J 數據庫。歡迎大家來觀看。
2. 什么是NoSQL?
2.1 NoSQL 概述
NoSQL(NoSQL = Not Only SQL ),意即“不僅僅是SQL”,
泛指非關系型的數據庫。隨著互聯網web2.0網站的興起,傳統(tǒng)的關系數據庫在應付web2.0網站,特別是超大規(guī)模和高并發(fā)的SNS類型的web2.0純動態(tài)網站已經顯得力不從心,暴露了很多難以克服的問題,而非關系型的數據庫則由于其本身的特點得到了非常迅速的發(fā)展。NoSQL數據庫的產生就是為了解決大規(guī)模數據集合多重數據種類帶來的挑戰(zhàn),尤其是大數據應用難題,包括超大規(guī)模數據的存儲。
(例如谷歌或Facebook每天為他們的用戶收集萬億比特的數據)。這些類型的數據存儲不需要固定的模式,無需多余操作就可以橫向擴展。
2.2 NoSQL代表
MongDB、 Redis、Memcache
3. 關系型數據庫與NoSQL的區(qū)別?
3.1 RDBMS
高度組織化結構化數據
結構化查詢語言(SQL)
數據和關系都存儲在單獨的表中。
數據操縱語言,數據定義語言
嚴格的一致性
基礎事務
ACID
關系型數據庫遵循ACID規(guī)則
事務在英文中是transaction,和現實世界中的交易很類似,它有如下四個特性:
A (Atomicity) 原子性
原子性很容易理解,也就是說事務里的所有操作要么全部做完,要么都不做,事務成功的條件是事務里的所有操作都成功,只要有一個操作失敗,整個事務就失敗,需要回滾。比如銀行轉賬,從A賬戶轉100元至B賬戶,分為兩個步驟:1)從A賬戶取100元;2)存入100元至B賬戶。這兩步要么一起完成,要么一起不完成,如果只完成第一步,第二步失敗,錢會莫名其妙少了100元。
C (Consistency) 一致性
一致性也比較容易理解,也就是說數據庫要一直處于一致的狀態(tài),事務的運行不會改變數據庫原本的一致性約束。
I (Isolation) 獨立性
所謂的獨立性是指并發(fā)的事務之間不會互相影響,如果一個事務要訪問的數據正在被另外一個事務修改,只要另外一個事務未提交,它所訪問的數據就不受未提交事務的影響。比如現有有個交易是從A賬戶轉100元至B賬戶,在這個交易還未完成的情況下,如果此時B查詢自己的賬戶,是看不到新增加的100元的
D (Durability) 持久性
持久性是指一旦事務提交后,它所做的修改將會永久的保存在數據庫上,即使出現宕機也不會丟失。
3.2 NoSQL
代表著不僅僅是SQL
沒有聲明性查詢語言
沒有預定義的模式
鍵 - 值對存儲,列存儲,文檔存儲,圖形數據庫
最終一致性,而非ACID屬性
非結構化和不可預知的數據
CAP定理
高性能,高可用性和可伸縮性
分布式數據庫中的CAP原理(了解)
CAP定理:
Consistency(一致性), 數據一致更新,所有數據變動都是同步的
Availability(可用性), 好的響應性能
Partition tolerance(分區(qū)容錯性) 可靠性
P: 系統(tǒng)中任意信息的丟失或失敗不會影響系統(tǒng)的繼續(xù)運作。
定理:任何分布式系統(tǒng)只可同時滿足二點,沒法三者兼顧。
CAP理論的核心是:一個分布式系統(tǒng)不可能同時很好的滿足一致性,可用性和分區(qū)容錯性這三個需求,
因此,根據 CAP 原理將 NoSQL 數據庫分成了滿足 CA 原則、滿足 CP 原則和滿足 AP 原則三 大類:
CA - 單點集群,滿足一致性,可用性的系統(tǒng),通常在可擴展性上不太強大。
CP - 滿足一致性,分區(qū)容忍性的系統(tǒng),通常性能不是特別高。
AP - 滿足可用性,分區(qū)容忍性的系統(tǒng),通常可能對一致性要求低一些。
CAP理論就是說在分布式存儲系統(tǒng)中,最多只能實現上面的兩點。
而由于當前的網絡硬件肯定會出現延遲丟包等問題,所以分區(qū)容忍性是我們必須需要實現的。
所以我們只能在一致性和可用性之間進行權衡,沒有NoSQL系統(tǒng)能同時保證這三點。
說明:C:強一致性 A:高可用性 P:分布式容忍性
舉例:
CA:傳統(tǒng)Oracle數據庫
AP:大多數網站架構的選擇
CP:Redis、Mongodb
注意:分布式架構的時候必須做出取舍。
一致性和可用性之間取一個平衡。多余大多數web應用,其實并不需要強一致性。
因此犧牲C換取P,這是目前分布式數據庫產品的方向。
4. 當下NoSQL的經典應用
當下的應用是 SQL 與 NoSQL 一起使用的。
代表項目:阿里巴巴商品信息的存放。
去 IOE 化。
ps:I 是指 IBM 的小型機,很貴的,好像好幾萬一臺;O 是指 Oracle 數據庫,也很貴的,好幾萬呢;M 是指 EMC 的存儲設備,也很貴的。
難點:
數據類型多樣性。
數據源多樣性和變化重構。
數據源改造而服務平臺不需要大面積重構。
關系數據庫經過幾十年的發(fā)展,已經非常成熟,但同時也存在不足:
表結構是強約束的,業(yè)務變更時擴充很麻煩。
如果對大數據量的表進行統(tǒng)計運算,I/O會很高,因為即使只針對某列進行運算,也需要將整行數據讀入內存。
全文搜索只能使用 Like 進行整表掃描,性能非常低。
針對這些不足,產生了不同的 NoSQL 解決方案,在某些場景下比關系數據庫更有優(yōu)勢,但同時也犧牲了某些特性,所以不能片面的迷信某種方案,應將其作為 SQL 的有利補充。
NoSQL != No SQL,而是:
NoSQL = Not Only SQL
典型的 NoSQL 方案分為4類:
Redis 是典型,其 value 是具體的數據結構,包括 string, hash, list, set, sorted set, bitmap, hyperloglog,常被稱為數據結構服務器。
以 list 為例:
LPOP key 是移除并返回隊列左邊的第一個元素。
如果用關系數據庫就比較麻煩了,需要操作:
Redis 的缺點主要體現在不支持完成的ACID事務,只能保證隔離性和一致性,無法保證原子性和持久性。
最大的特點是 no-schema,無需在使用前定義字段,讀取一個不存在的字段也不會導致語法錯誤。
特點:
以電商為例,不同商品的屬性差異很大,如冰箱和電腦,這種差異性在關系數據庫中會有很大的麻煩,而使用文檔數據庫則非常方便。
文檔數據庫的主要缺點:
關系數據庫是按行來存儲的,列式數據庫是按照列來存儲數據。
按行存儲的優(yōu)勢:
在某些場景下,這些優(yōu)勢就成為劣勢了,例如,計算超重人員的數據,只需要讀取體重這一列進行統(tǒng)計即可,但行式存儲會將整行數據讀取到內存中,很浪費。
而列式存儲中,只需要讀取體重這列的數據即可,I/O 將大大減少。
除了節(jié)省I/O,列式存儲還有更高的壓縮比,可以節(jié)省存儲空間。普通行式數據庫的壓縮比在 3:1 到 5:1 左右,列式數據庫在 8:1 到 30:1,因為單個列的數據相似度更高。
列式存儲的隨機寫效率遠低于行式存儲,因為行式存儲時同一行多個列都存儲在連續(xù)空間中,而列式存儲將不同列存儲在不連續(xù)的空間。
一般將列式存儲應用在離線大數據分析統(tǒng)計場景,因為這時主要針對部分列進行操作,而且數據寫入后無須更新。
關系數據庫通過索引進行快速查詢,但在全文搜索的情景下,索引就不夠了,因為:
假設有一個交友網站,信息表如下:
需要匹配性別、地點、語言列。
需要匹配性別、地點、愛好列。
實際搜索中,各種排列組合非常多,關系數據庫很難支持。
全文搜索引擎是使用 倒排索引 技術,建立單詞到文檔的索引,例如上面的表信息建立倒排索引:
所以特別適合根據關鍵詞來查詢文檔內容。
上面介紹了幾種典型的NoSQL方案,及各自的適用場景和特點,您可以根據實際需求進行選擇。
NoSQL,泛指非關系型的數據庫。隨著互聯網web2.0網站的興起,傳統(tǒng)的關系數據庫在應付web2.0網站,特別是超大規(guī)模和高并發(fā)的SNS類型的web2.0純動態(tài)網站已經顯得力不從心,暴露了很多難以克服的問題,而非關系型的數據庫則由于其本身的特點得到了非常迅速的發(fā)展。NoSQL數據庫的產生就是為了解決大規(guī)模數據集合多重數據種類帶來的挑戰(zhàn),尤其是大數據應用難題。
雖然NoSQL流行語火起來才短短一年的時間,但是不可否認,現在已經開始了第二代運動。盡管早期的堆棧代碼只能算是一種實驗,然而現在的系統(tǒng)已經更加的成熟、穩(wěn)定。不過現在也面臨著一個嚴酷的事實:技術越來越成熟——以至于原來很好的NoSQL數據存儲不得不進行重寫,也有少數人認為這就是所謂的2.0版本。這里列出一些比較知名的工具,可以為大數據建立快速、可擴展的存儲庫。
NoSQL(NoSQL = Not Only SQL ),意即“不僅僅是SQL”,是一項全新的數據庫革命性運動,早期就有人提出,發(fā)展至2009年趨勢越發(fā)高漲。NoSQL的擁護者們提倡運用非關系型的數據存儲,相對于鋪天蓋地的關系型數據庫運用,這一概念無疑是一種全新的思維的注入。
對于NoSQL并沒有一個明確的范圍和定義,但是他們都普遍存在下面一些共同特征:
不需要預定義模式:不需要事先定義數據模式,預定義表結構。數據中的每條記錄都可能有不同的屬性和格式。當插入數據時,并不需要預先定義它們的模式。
無共享架構:相對于將所有數據存儲的存儲區(qū)域網絡中的全共享架構。NoSQL往往將數據劃分后存儲在各個本地服務器上。因為從本地磁盤讀取數據的性能往往好于通過網絡傳輸讀取數據的性能,從而提高了系統(tǒng)的性能。
彈性可擴展:可以在系統(tǒng)運行的時候,動態(tài)增加或者刪除結點。不需要停機維護,數據可以自動遷移。
分區(qū):相對于將數據存放于同一個節(jié)點,NoSQL數據庫需要將數據進行分區(qū),將記錄分散在多個節(jié)點上面。并且通常分區(qū)的同時還要做復制。這樣既提高了并行性能,又能保證沒有單點失效的問題。
異步復制:和RAID存儲系統(tǒng)不同的是,NoSQL中的復制,往往是基于日志的異步復制。這樣,數據就可以盡快地寫入一個節(jié)點,而不會被網絡傳輸引起遲延。缺點是并不總是能保證一致性,這樣的方式在出現故障的時候,可能會丟失少量的數據。
BASE:相對于事務嚴格的ACID特性,NoSQL數據庫保證的是BASE特性。BASE是最終一致性和軟事務。
NoSQL數據庫并沒有一個統(tǒng)一的架構,兩種NoSQL數據庫之間的不同,甚至遠遠超過兩種關系型數據庫的不同。可以說,NoSQL各有所長,成功的NoSQL必然特別適用于某些場合或者某些應用,在這些場合中會遠遠勝過關系型數據庫和其他的NoSQL。