真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

nosql英文論文,nosql的英文全稱

分布式系統(tǒng)領域有哪些經(jīng)典論文

分布式領域論文譯序

專注于為中小企業(yè)提供成都網(wǎng)站設計、網(wǎng)站建設、外貿(mào)網(wǎng)站建設服務,電腦端+手機端+微信端的三站合一,更高效的管理,為中小企業(yè)隰縣免費做網(wǎng)站提供優(yōu)質(zhì)的服務。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動了上千余家企業(yè)的穩(wěn)健成長,幫助中小企業(yè)通過網(wǎng)站建設實現(xiàn)規(guī)模擴充和轉變。

sqlnosql年代記

SMAQ:海量數(shù)據(jù)的存儲計算和查詢

一.google論文系列

1. google系列論文譯序

2. The anatomy of a large-scale hypertextual Web search engine (譯 zz)

3. web search for a planet :the google cluster architecture(譯)

4. GFS:google文件系統(tǒng) (譯)

5. MapReduce: Simplied Data Processing on Large Clusters (譯)

6. Bigtable: A Distributed Storage System for Structured Data (譯)

7. Chubby: The Chubby lock service for loosely-coupled distributed systems (譯)

8. Sawzall:Interpreting the Data--Parallel Analysis with Sawzall (譯 zz)

9. Pregel: A System for Large-Scale Graph Processing (譯)

10. Dremel: Interactive Analysis of WebScale Datasets(譯zz)

11. Percolator: Large-scale Incremental Processing Using Distributed Transactions and Notifications(譯zz)

12. MegaStore: Providing Scalable, Highly Available Storage for Interactive Services(譯zz)

13. Case Study GFS: Evolution on Fast-forward (譯)

14. Google File System II: Dawn of the Multiplying Master Nodes

15. Tenzing - A SQL Implementation on the MapReduce Framework (譯)

16. F1-The Fault-Tolerant Distributed RDBMS Supporting Google's Ad Business

17. Elmo: Building a Globally Distributed, Highly Available Database

18. PowerDrill:Processing a Trillion Cells per Mouse Click

19. Google-Wide Profiling:A Continuous Profiling Infrastructure for Data Centers

20. Spanner: Google’s Globally-Distributed Database(譯zz)

21. Dapper, a Large-Scale Distributed Systems Tracing Infrastructure(筆記)

22. Omega: flexible, scalable schedulers for large compute clusters

23. CPI2: CPU performance isolation for shared compute clusters

24. Photon: Fault-tolerant and Scalable Joining of Continuous Data Streams(譯)

25. F1: A Distributed SQL Database That Scales

26. MillWheel: Fault-Tolerant Stream Processing at Internet Scale(譯)

27. B4: Experience with a Globally-Deployed Software Defined WAN

28. The Datacenter as a Computer

29. Google brain-Building High-level Features Using Large Scale Unsupervised Learning

30. Mesa: Geo-Replicated, Near Real-Time, Scalable Data Warehousing(譯zz)

31. Large-scale cluster management at Google with Borg

google系列論文翻譯集(合集)

二.分布式理論系列

00. Appraising Two Decades of Distributed Computing Theory Research

0. 分布式理論系列譯序

1. A brief history of Consensus_ 2PC and Transaction Commit (譯)

2. 拜占庭將軍問題 (譯) --Leslie Lamport

3. Impossibility of distributed consensus with one faulty process (譯)

4. Leases:租約機制 (譯)

5. Time Clocks and the Ordering of Events in a Distributed System(譯) --Leslie Lamport

6. 關于Paxos的歷史

7. The Part Time Parliament (譯 zz) --Leslie Lamport

8. How to Build a Highly Available System Using Consensus(譯)

9. Paxos Made Simple (譯) --Leslie Lamport

10. Paxos Made Live - An Engineering Perspective(譯)

11. 2 Phase Commit(譯)

12. Consensus on Transaction Commit(譯) --Jim Gray Leslie Lamport

13. Why Do Computers Stop and What Can Be Done About It?(譯) --Jim Gray

14. On Designing and Deploying Internet-Scale Services(譯) --James Hamilton

15. Single-Message Communication(譯)

16. Implementing fault-tolerant services using the state machine approach

17. Problems, Unsolved Problems and Problems in Concurrency

18. Hints for Computer System Design

19. Self-stabilizing systems in spite of distributed control

20. Wait-Free Synchronization

21. White Paper Introduction to IEEE 1588 Transparent Clocks

22. Unreliable Failure Detectors for Reliable Distributed Systems

23. Life beyond Distributed Transactions:an Apostate’s Opinion(譯zz)

24. Distributed Snapshots: Determining Global States of a Distributed System --Leslie Lamport

25. Virtual Time and Global States of Distributed Systems

26. Timestamps in Message-Passing Systems That Preserve the Partial Ordering

27. Fundamentals of Distributed Computing:A Practical Tour of Vector Clock Systems

28. Knowledge and Common Knowledge in a Distributed Environment

29. Understanding Failures in Petascale Computers

30. Why Do Internet services fail, and What Can Be Done About It?

31. End-To-End Arguments in System Design

32. Rethinking the Design of the Internet: The End-to-End Arguments vs. the Brave New World

33. The Design Philosophy of the DARPA Internet Protocols(譯zz)

34. Uniform consensus is harder than consensus

35. Paxos made code - Implementing a high throughput Atomic Broadcast

36. RAFT:In Search of an Understandable Consensus Algorithm

分布式理論系列論文翻譯集(合集)

三.數(shù)據(jù)庫理論系列

0. A Relational Model of Data for Large Shared Data Banks --E.F.Codd 1970

1. SEQUEL:A Structured English Query Language 1974

2. Implentation of a Structured English Query Language 1975

3. A System R: Relational Approach to Database Management 1976

4. Granularity of Locks and Degrees of Consistency in a Shared DataBase --Jim Gray 1976

5. Access Path Selection in a RDBMS 1979

6. The Transaction Concept:Virtues and Limitations --Jim Gray

7. 2pc-2階段提交:Notes on Data Base Operating Systems --Jim Gray

8. 3pc-3階段提交:NONBLOCKING COMMIT PROTOCOLS

9. MVCC:Multiversion Concurrency Control-Theory and Algorithms --1983

10. ARIES: A Transaction Recovery Method Supporting Fine-Granularity Locking and Partial Rollbacks Using Write-Ahead Logging-1992

11. A Comparison of the Byzantine Agreement Problem and the Transaction Commit Problem --Jim Gray

12. A Formal Model of Crash Recovery in a Distributed System - Skeen, D. Stonebraker

13. What Goes Around Comes Around - Michael Stonebraker, Joseph M. Hellerstein

14. Anatomy of a Database System -Joseph M. Hellerstein, Michael Stonebraker

15. Architecture of a Database System(譯zz) -Joseph M. Hellerstein, Michael Stonebraker, James Hamilton

四.大規(guī)模存儲與計算(NoSql理論系列)

0. Towards Robust Distributed Systems:Brewer's 2000 PODC key notes

1. CAP理論

2. Harvest, Yield, and Scalable Tolerant Systems

3. 關于CAP

4. BASE模型:BASE an Acid Alternative

5. 最終一致性

6. 可擴展性設計模式

7. 可伸縮性原則

8. NoSql生態(tài)系統(tǒng)

9. scalability-availability-stability-patterns

10. The 5 Minute Rule and the 5 Byte Rule (譯)

11. The Five-Minute Rule Ten Years Later and Other Computer Storage Rules of Thumb

12. The Five-Minute Rule 20 Years Later(and How Flash Memory Changes the Rules)

13. 關于MapReduce的爭論

14. MapReduce:一個巨大的倒退

15. MapReduce:一個巨大的倒退(II)

16. MapReduce和并行數(shù)據(jù)庫,朋友還是敵人?(zz)

17. MapReduce and Parallel DBMSs-Friends or Foes (譯)

18. MapReduce:A Flexible Data Processing Tool (譯)

19. A Comparision of Approaches to Large-Scale Data Analysis (譯)

20. MapReduce Hold不???(zz)

21. Beyond MapReduce:圖計算概覽

22. Map-Reduce-Merge: simplified relational data processing on large clusters

23. MapReduce Online

24. Graph Twiddling in a MapReduce World

25. Spark: Cluster Computing with Working Sets

26. Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing

27. Big Data Lambda Architecture

28. The 8 Requirements of Real-Time Stream Processing

29. The Log: What every software engineer should know about real-time data's unifying abstraction

30. Lessons from Giant-Scale Services

五.基本算法和數(shù)據(jù)結構

1. 大數(shù)據(jù)量,海量數(shù)據(jù)處理方法總結

2. 大數(shù)據(jù)量,海量數(shù)據(jù)處理方法總結(續(xù))

3. Consistent Hashing And Random Trees

4. Merkle Trees

5. Scalable Bloom Filters

6. Introduction to Distributed Hash Tables

7. B-Trees and Relational Database Systems

8. The log-structured merge-tree (譯)

9. lock free data structure

10. Data Structures for Spatial Database

11. Gossip

12. lock free algorithm

13. The Graph Traversal Pattern

六.基本系統(tǒng)和實踐經(jīng)驗

1. MySQL索引背后的數(shù)據(jù)結構及算法原理

2. Dynamo: Amazon’s Highly Available Key-value Store (譯zz)

3. Cassandra - A Decentralized Structured Storage System (譯zz)

4. PNUTS: Yahoo!’s Hosted Data Serving Platform (譯zz)

5. Yahoo!的分布式數(shù)據(jù)平臺PNUTS簡介及感悟(zz)

6. LevelDB:一個快速輕量級的key-value存儲庫(譯)

7. LevelDB理論基礎

8. LevelDB:實現(xiàn)(譯)

9. LevelDB SSTable格式詳解

10. LevelDB Bloom Filter實現(xiàn)

11. Sawzall原理與應用

12. Storm原理與實現(xiàn)

13. Designs, Lessons and Advice from Building Large Distributed Systems --Jeff Dean

14. Challenges in Building Large-Scale Information Retrieval Systems --Jeff Dean

15. Experiences with MapReduce, an Abstraction for Large-Scale Computation --Jeff Dean

16. Taming Service Variability,Building Worldwide Systems,and Scaling Deep Learning --Jeff Dean

17. Large-Scale Data and Computation:Challenges and Opportunitis --Jeff Dean

18. Achieving Rapid Response Times in Large Online Services --Jeff Dean

19. The Tail at Scale(譯) --Jeff Dean Luiz André Barroso

20. How To Design A Good API and Why it Matters

21. Event-Based Systems:Architect's Dream or Developer's Nightmare?

22. Autopilot: Automatic Data Center Management

七.其他輔助系統(tǒng)

1. The ganglia distributed monitoring system:design, implementation, and experience

2. Chukwa: A large-scale monitoring system

3. Scribe : a way to aggregate data and why not, to directly fill the HDFS?

4. Benchmarking Cloud Serving Systems with YCSB

5. Dynamo Dremel ZooKeeper Hive 簡述

八. Hadoop相關

0. Hadoop Reading List

1. The Hadoop Distributed File System(譯)

2. HDFS scalability:the limits to growth(譯)

3. Name-node memory size estimates and optimization proposal.

4. HBase Architecture(譯)

5. HFile:A Block-Indexed File Format to Store Sorted Key-Value Pairs

6. HFile V2

7. Hive - A Warehousing Solution Over a Map-Reduce Framework

8. Hive – A Petabyte Scale Data Warehouse Using Hadoop

轉載請注明作者:phylips@bmy 2011-4-30

大數(shù)據(jù)時代數(shù)據(jù)管理方式研究

大數(shù)據(jù)時代數(shù)據(jù)管理方式研究

1數(shù)據(jù)管理技術的回顧

數(shù)據(jù)管理技術主要經(jīng)歷了人工管理階段、文件系統(tǒng)階段和數(shù)據(jù)庫系統(tǒng)階段。隨著數(shù)據(jù)應用領域的不斷擴展,數(shù)據(jù)管理所處的環(huán)境也越來越復雜,目前廣泛流行的數(shù)據(jù)庫技術開始暴露出許多弱點,面臨著許多新的挑戰(zhàn)。

1.1 人工管理階段

20 世紀 50 年代中期,計算機主要用于科學計算。當時沒有磁盤等直接存取設備,只有紙帶、卡片、磁帶等外存,也沒有操作系統(tǒng)和管理數(shù)據(jù)的專門軟件。該階段管理的數(shù)據(jù)不保存、由應用程序管理數(shù)據(jù)、數(shù)據(jù)不共享和數(shù)據(jù)不具有獨立性等特點。

1.2 文件系統(tǒng)階段

20 世紀 50 年代后期到 60 年代中期,隨著計算機硬件和軟件的發(fā)展,磁盤、磁鼓等直接存取設備開始普及,這一時期的數(shù)據(jù)處理系統(tǒng)是把計算機中的數(shù)據(jù)組織成相互獨立的被命名的數(shù)據(jù)文件,并可按文件的名字來進行訪問,對文件中的記錄進行存取的數(shù)據(jù)管理技術。數(shù)據(jù)可以長期保存在計算機外存上,可以對數(shù)據(jù)進行反復處理,并支持文件的查詢、修改、插入和刪除等操作。其數(shù)據(jù)面向特定的應用程序,因此,數(shù)據(jù)共享性、獨立性差,且冗余度大,管理和維護的代價也很大。

1.3數(shù)據(jù)庫階段

20 世紀 60 年代后期以來,計算機性能得到進一步提高,更重要的是出現(xiàn)了大容量磁盤,存儲容量大大增加且價格下降。在此基礎上,才有可能克服文件系統(tǒng)管理數(shù)據(jù)時的不足,而滿足和解決實際應用中多個用戶、多個應用程序共享數(shù)據(jù)的要求,從而使數(shù)據(jù)能為盡可能多的應用程序服務,這就出現(xiàn)了數(shù)據(jù)庫這樣的數(shù)據(jù)管理技術。數(shù)據(jù)庫的特點是數(shù)據(jù)不再只針對某一個特定的應用,而是面向全組織,具有整體的結構性,共享性高,冗余度減小,具有一定的程序與數(shù)據(jù)之間的獨立性,并且對數(shù)據(jù)進行統(tǒng)一的控制。

2大數(shù)據(jù)時代的數(shù)據(jù)管理技術

大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。大數(shù)據(jù)有 3 個 V,一是大量化(Volume),數(shù)據(jù)量是持續(xù)快速增加的,從 TB級別,躍升到 PB 級別;二是多樣化(Variety),數(shù)據(jù)類型多樣化,結構化數(shù)據(jù)已被視為小菜一碟,圖片、音頻、視頻等非結構化數(shù)據(jù)正以傳統(tǒng)結構化數(shù)據(jù)增長的兩倍速快速創(chuàng)建;三是快速化 (Velocity),數(shù)據(jù)生成速度快,也就需要快速的處理能力,因此,產(chǎn)生了“1 秒定律”,就是說一般要在秒級時間范圍內(nèi)給出分析結果,時間太長就失去價值了,這個速度要求是大數(shù)據(jù)處理技術和傳統(tǒng)的數(shù)據(jù)挖掘技術最大的區(qū)別。

2.1 關系型數(shù)據(jù)庫(RDBMS)

20 世紀 70 年代初,IBM 工程師 Codd 發(fā)表了著名的論文“A Relational Model of Data for Large Shared DataBanks”,標志著關系數(shù)據(jù)庫時代來臨。關系數(shù)據(jù)庫的理論基礎是關系模型,是借助于集合代數(shù)等數(shù)學概念和方法來處理數(shù)據(jù)庫中的數(shù)據(jù),現(xiàn)實世界中的實體以及實體之間的聯(lián)系非常容易用關系模型來表示。容易理解的模型、容易掌握的查詢語言、高效的優(yōu)化器、成熟的技術和產(chǎn)品,使得關系數(shù)據(jù)庫占據(jù)了數(shù)據(jù)庫市場的絕對的統(tǒng)治地位。隨著互聯(lián)網(wǎng) web2.0 網(wǎng)站的興起,半結構化和非結構化數(shù)據(jù)的大量涌現(xiàn),傳統(tǒng)的關系數(shù)據(jù)庫在應付 web2.0 網(wǎng)站特別是超大規(guī)模和高并發(fā)的 SNS(全稱 Social Networking Services,即社會性網(wǎng)絡服務) 類型的 web2.0 純動態(tài)網(wǎng)站已經(jīng)顯得力不從心,暴露了很多難以克服的問題。

2.2 noSQL數(shù)據(jù)庫

順應時代發(fā)展的需要產(chǎn)生了 noSQL數(shù)據(jù)庫技術,其主要特點是采用與關系模型不同的數(shù)據(jù)模型,當前熱門的 noSQL數(shù)據(jù)庫系統(tǒng)可以說是蓬勃發(fā)展、異軍突起,很多公司都熱情追捧之,如:由 Google 公司提出的 Big Table 和 MapReduce 以及 IBM 公司提出的 Lotus Notes 等。不管是那個公司的 noSQL數(shù)據(jù)庫都圍繞著大數(shù)據(jù)的 3 個 V,目的就是解決大數(shù)據(jù)的 3個 V 問題。因此,在設計 noSQL 時往往考慮以下幾個原則,首先,采用橫向擴展的方式,通過并行處理技術對數(shù)據(jù)進行劃分并進行并行處理,以獲得高速的讀寫速度;其次,解決數(shù)據(jù)類型從以結構化數(shù)據(jù)為主轉向結構化、半結構化、非結構化三者的融合的問題;再次,放松對數(shù)據(jù)的 ACID 一致性約束,允許數(shù)據(jù)暫時出現(xiàn)不一致的情況,接受最終一致性;最后,對各個分區(qū)數(shù)據(jù)進行備份(一般是 3 份),應對節(jié)點失敗的狀況等。

對數(shù)據(jù)的應用可以分為分析型應用和操作型應用,分析型應用主要是指對大量數(shù)據(jù)進行分類、聚集、匯總,最后獲得數(shù)據(jù)量相對小的分析結果;操作型應用主要是指對數(shù)據(jù)進行增加、刪除、修改和查詢以及簡單的匯總操作,涉及的數(shù)據(jù)量一般比較少,事務執(zhí)行時間一般比較短。目前數(shù)據(jù)庫可分為關系數(shù)據(jù)庫和 noSQL數(shù)據(jù)庫,根據(jù)數(shù)據(jù)應用的要求,再結合目前數(shù)據(jù)庫的種類,所以目前數(shù)據(jù)庫管理方式主要有以下 4 類。

(1)面向操作型的關系數(shù)據(jù)庫技術。

首先,傳統(tǒng)數(shù)據(jù)庫廠商提供的基于行存儲的關系數(shù)據(jù)庫系統(tǒng),如 DB2、Oracle、SQL Server 等,以其高度的一致性、精確性、系統(tǒng)可恢復性,在事務處理方面仍然是核心引擎。其次,面向?qū)崟r計算的內(nèi)存數(shù)據(jù)庫系統(tǒng),如 Hana、Timesten、Altibase 等通過把對數(shù)據(jù)并發(fā)控制、查詢和恢復等操作控制在內(nèi)存內(nèi)部進行,所以獲得了非常高的性能,在很多特定領域如電信、證券、網(wǎng)管等得到普遍應用。另外,以 VoltDB、Clustrix 和NuoDB 為代表的 new SQL 宣稱能夠在保持 ACDI 特性的同時提高了事務處理性能 50 倍 ~60 倍。

(2)面向分析型的關系數(shù)據(jù)庫技術。

首先,TeraData 是數(shù)據(jù)倉庫領域的領頭羊,Teradata 在整體上是按 Shared Nothing 架構體系進行組織的,定位就是大型數(shù)據(jù)倉庫系統(tǒng),支持較高的擴展性。其次,面向分析型應用,列存儲數(shù)據(jù)庫的研究形成了另一個重要的潮流。列存儲數(shù)據(jù)庫以其高效的壓縮、更高的 I/O 效率等特點,在分析型應用領域獲得了比行存儲數(shù)據(jù)庫高得多的性能。如:MonetDB 和 Vertica是一個典型的基于列存儲技術的數(shù)據(jù)庫系統(tǒng)。

(3)面向操作型的 noSQL 技術。

有些操作型應用不受 ACID 高度一致性約束,但對大數(shù)據(jù)處理需要處理的數(shù)據(jù)量非常大,對速度性能要求也非常高,這樣就必須依靠大規(guī)模集群的并行處理能力來實現(xiàn)數(shù)據(jù)處理,弱一致性或最終一致性就可以了。這時,操作型 noSQL數(shù)據(jù)庫的優(yōu)點就可以發(fā)揮的淋漓盡致了。如,Hbase 一天就可以有超過 200 億個到達硬盤的讀寫操作,實現(xiàn)對大數(shù)據(jù)的處理。另外,noSQL數(shù)據(jù)庫是一個數(shù)據(jù)模型靈活、支持多樣數(shù)據(jù)類型,如對圖數(shù)據(jù)建模、存儲和分析,其性能、擴展性是關系數(shù)據(jù)庫無法比擬的。

(4)面向分析型的 noSQL 技術。

面向分析型應用的 noSQL 技術主要依賴于Hadoop 分布式計算平臺,Hadoop 是一個分布式計算平臺,以 HDFS 和 Map Reduce 為用戶提供系統(tǒng)底層細節(jié)透明的分布式基礎架構?!禜adoop 經(jīng)典實踐染技巧》傳統(tǒng)的數(shù)據(jù)庫廠商 Microsoft,Oracle,SAS,IBM 等紛紛轉向 Hadoop 的研究,如微軟公司關閉 Dryad 系統(tǒng),全力投入 Map Reduce 的研發(fā),Oracle 在 2011 年下半年發(fā)布 Big Plan 戰(zhàn)略計劃,全面進軍大數(shù)據(jù)處理領域,IBM 則早已捷足先登“,沃森(Watson)”計算機就是基于 Hadoop 技術開發(fā)的產(chǎn)物,同時 IBM 發(fā)布了 BigInsights 計劃,基于 Hadoop,Netezza 和 SPSS(統(tǒng)計分析、數(shù)據(jù)挖掘軟件)等技術和產(chǎn)品構建大數(shù)據(jù)分析處理的技術框架。同時也涌現(xiàn)出一批新公司來研究Hadoop 技術,如 Cloudera、MapRKarmashpere 等。

3數(shù)據(jù)管理方式的展望

通過以上分析,可以看出關系數(shù)據(jù)庫的 ACID 強調(diào)數(shù)據(jù)一致性通常指關聯(lián)數(shù)據(jù)之間的邏輯關系是否正確和完整,而對于很多互聯(lián)網(wǎng)應用來說,對這一致性和隔離性的要求可以降低,而可用性的要求則更為明顯,此時就可以采用 noSQL 的兩種弱一致性的理論 BASE 和 CAP.關系數(shù)據(jù)庫和 noSQL數(shù)據(jù)庫并不是想到對立的矛盾體,而是可以相互補充的,根據(jù)不同需求使用不同的技術,甚至二者可以共同存在,互不影響。最近幾年,以 Spanner 為代表新型數(shù)據(jù)庫的出現(xiàn),給數(shù)據(jù)庫領域注入新鮮血液,這就是融合了一致性和可用性的 newSQL,這種新型思維方式或許會是未來大數(shù)據(jù)處理方式的發(fā)展方向。

4 結束語

隨著云計算、物聯(lián)網(wǎng)等的發(fā)展,數(shù)據(jù)呈現(xiàn)爆炸式的增長,人們正被數(shù)據(jù)洪流所包圍,大數(shù)據(jù)的時代已經(jīng)到來。正確利用大數(shù)據(jù)給人們的生活帶來了極大的便利,但與此同時也給傳統(tǒng)的數(shù)據(jù)管理方式帶來了極大的挑戰(zhàn)。

NewSQL為何使傳統(tǒng)關系數(shù)據(jù)庫黯然失色?

傳統(tǒng)數(shù)據(jù)庫仍舊會有一席之地,至于NewSQL的優(yōu)勢又是什么,簡單和大家說說:

首先關于“中間件+關系數(shù)據(jù)庫分庫分表”算不算NewSQL分布式數(shù)據(jù)庫問題,國外有篇論文pavlo-newsql-sigmodrec,如果根據(jù)該文中的分類,Spanner、TiDB、OB算是第一種新架構型,Sharding-Sphere、Mycat、DRDS等中間件方案算是第二種(文中還有第三種云數(shù)據(jù)庫,本文暫不詳細介紹)。

基于中間件(包括SDK和Proxy兩種形式)+傳統(tǒng)關系數(shù)據(jù)庫(分庫分表)模式是不是分布式架構?我覺得是的,因為存儲確實也分布式了,也能實現(xiàn)橫向擴展。但是不是“偽”分布式數(shù)據(jù)庫?從架構先進性來看,這么說也有一定道理。

“偽”主要體現(xiàn)在中間件層與底層DB重復的SQL解析與執(zhí)行計劃生成、存儲引擎基于B+Tree等,這在分布式數(shù)據(jù)庫架構中實際上冗余低效的。為了避免引起真?zhèn)畏植际綌?shù)據(jù)庫的口水戰(zhàn),本文中NewSQL數(shù)據(jù)庫特指這種新架構NewSQL數(shù)據(jù)庫。

NewSQL數(shù)據(jù)庫相比中間件+分庫分表的先進在哪兒?畫一個簡單的架構對比圖:

傳統(tǒng)數(shù)據(jù)庫面向磁盤設計,基于內(nèi)存的存儲管理及并發(fā)控制,不如NewSQL數(shù)據(jù)庫那般高效利用;

中間件模式SQL解析、執(zhí)行計劃優(yōu)化等在中間件與數(shù)據(jù)庫中重復工作,效率相比較低;

NewSQL數(shù)據(jù)庫的分布式事務相比于XA進行了優(yōu)化,性能更高;

新架構NewSQL數(shù)據(jù)庫存儲設計即為基于paxos(或Raft)協(xié)議的多副本,相比于傳統(tǒng)數(shù)據(jù)庫主從模式(半同步轉異步后也存在丟數(shù)問題),在實現(xiàn)了真正的高可用、高可靠(RTO30s,RPO=0);

NewSQL數(shù)據(jù)庫天生支持數(shù)據(jù)分片,數(shù)據(jù)的遷移、擴容都是自動化的,大大減輕了DBA的工作,同時對應用透明,無需在SQL指定分庫分表鍵。


網(wǎng)站名稱:nosql英文論文,nosql的英文全稱
瀏覽路徑:http://weahome.cn/article/dscjcjs.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部