NoSQL数据库大全收集整理

2019-03-27 01:04|来源: 网路

摘要:随着大数据的不断发展,非关系型的数据库现在成了一个极其热门的新领域,非关系数据库产品的发展非常迅速。现今的计算机体系结构在数据存储方面要有庞大的水平扩展性,而NoSQL也正是致力于改变这一现状。目前Google的 BigTable和Amazon 的Dynamo使用的就是NoSQL型数据库,本文介绍了10种出色的NoSQL数据库。

虽然NoSQL流行语火起来才短短一年的时间,但是不可否认,现在已经开始了第二代运动。尽管早期的堆栈代码只能算是一种实验,然而现在的系统已经更加的成熟、稳定。不过现在也面临着一个严酷的事实:技术越来越成熟——以至于原来很好的NoSQL数据存储不得不进行重写,也有少数人认为这就是所谓的2.0版本。这里列出一些比较知名的工具,可以为大数据建立快速、可扩展的存储库。

1. Casssandra

Cassandra最初由Facebook开发,后来成了Apache开源项目,它是一个网络社交云计算方面理想的数据库。它集成了其他的流行工具如Solr,现在已经成为一个完全成熟的大型数据存储工具。Cassandra是一个混合型的非关系的数据库,类似于Google的BigTable。其主要功能比Dynomite(分布式的Key-Value存储系统)更丰富,但支持度却不如文档存储MongoDB。Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对Cassandra的一个写操作,会被复制到其他节点上去,而对Cassandra的读操作,也会被路由到某个节点上面去读取。在最近的一次测试中,Netflix建立了一个288个节点的集群

2. Lucene/Solr

Lucene是Apache软件基金会4 jakarta项目组的一个子项目,这是一个开放源代码的全文检索引擎工具包,就是说它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构。不过大多数人并不认同Lucene是一个数据库,因为大多数人只是用它来检索大量的文本块,不过它的确采用了与其他NoSQL数据存储相似的模型。如果说查询并不是仅仅局限于精确的匹配,而是寻找出那些出现在块中的字或者字段的话,毫无疑问,Lucene/Solr是最好的查询方式。

3. Riak

Riak是由技术公司basho开发的一个类似Dynamo的分布式Key-Value系统。其以分布式,水平扩展性,高容错性等特点著称。从事Riak工作最有趣的部分是可以使用JavaScript或者Erlang来做Map/Reduce查询,它们会查询每个节点,收集结果,而且可以重复,如果需要使用的结果进行重新进行搜寻的话。该系统还为类似于Solr的搜索提供全文索引,同时还提供一个控制面板,可以查看集群的信息。

4. CouchDB

CouchDB是用Erlang开发的面向文档的数据库系统,不过它不是一个传统的关系数据库,而是面向文档的数据库,其数据存储方式有点类似lucene的index文件格式,CouchDB最大的意义在于它是一个面向web应用的新一代存储系统。作为一个分布式的数据库,CouchDB可以把存储系统分布到n台物理的节点上面,并且很好的协调和同步节点之间的数据读写一致性。CouchDB支持REST API,可以让用户使用JavaScript来操作CouchDB数据库,也可以用JavaScript编写查询语句,可以想像一下,用AJAX技术结合CouchDB开发出来的CMS系统会是多么的简单和方便。

CouchDB还有一个更加商业化的“表亲”——Couchbase,不过它提供缓存功能,更好的分片,增量查询,更好的索引和一些其他的功能。其实Couchbase与CouchDB也是紧密相关的,Couchbase产品包含了CouchDB的一个副本。

5. Neo4J

大多数的NoSQL数据库只是存储键和值的一个灵活的捆绑。不过Neo4J的存储的是对象之间的关系,或者说这种结构就是数学中的“图”。Neo4J是一个面向网络(“图”)的数据库,也就是说,它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络上而不是表中,当然也可以把Neo4J看作是一个高性能的图引擎,该引擎具有成熟和健壮的数据库的所有特性。该工具包括很多有关搜索和分析的关系的算法,它能够帮助寻找谁是我的朋友,或者寻找朋友的朋友。这些“图的遍历”算法,可以节省很多指针查询的麻烦。

6. Oracle的NoSQL

也许是NoSQL运动太红火的原因,Oracle决定开发一款产品,将键/值对拆分在整个节点集上,这样的优势在于提供了一个灵活的事务保护措施,进而可以确保从数据在节点上等待存储开始到通过网络被成功备份结束,都尽在掌握之中。

Oracle的NoSQL Database,是在10月4号的甲骨文全球大全上发布的Big Data Appliance的其中一个组件,Big Data Appliance是一个集成了Hadoop、NoSQL Database、Oracle数据库Hadoop适配器、Oracle数据库Hadoop装载器及R语言的系统。

7. MongoDB

MongoDB是一个基于分布式文件存储的数据库,介于关系数据库和非关系数据库之间,是非关系数据库当中功能最丰富,最像关系数据库的。MongoDB最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。MongoDB支持RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。

MongoDB是高性能开源文档数据库,也是目前最受关注的NoSQL技术之一,以敏捷、可扩展和对企业应用友好(支持事务,一致性和数据完整性保证,有大企业应用案例)而著称。有人甚至认为LAMP中的M应该用MongoDB取代MySQL,其火热程度可见一斑。使用MongoDB的公司包括Foursquare, Craiglist, 迪士尼,SAP,Intuit,EA等,国内淘宝、大众点评、视觉中国等公司有应用。(最新版MongoDB 2.2下载)

8. Hadoop的HBase

HBase(Hadoop Database),是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据。

虽然大多数人都认为Hadoop及其所有的工具都是作为管理大规模集群的一种机制,其实不然,Hadoop也包括数据库,在HBase中也是通过节点来传播数据。Hadoop的Map /Reduce的架构是非常适合于复杂的计算任务或查询工作。领土在不断的扩张,新的数据库像Accumulo就是Hadoop平台的一个延伸。(Apache Accumulo是一个可靠的、可伸缩的、高性能的排序分布式的Key-Value存储解决方案,基于单元访问控制以及可定制的服务器端处理。使用Google BigTable设计思路,基于Apache Hadoop、Zookeeper和Thrift构建)

9. BigTable/ Accumulo/ Hypertable

BigTable是非关系的数据库,是一个稀疏的、分布式的、持久化存储的多维度排序Map。Bigtable的设计目的是可靠的处理PB级别的数据,并且能够部署到上千台机器上。Bigtable已经实现了下面的几个目标:适用性广泛、可扩展、高性能和高可用性。Bigtable已经在超过60个Google的产品和项目上得到了应用,包括Google Analytics、GoogleFinance、Orkut、Personalized Search、Writely和GoogleEarth。

谷歌的BigTable开启了NoSQL的热潮,现在很多公司都模仿谷歌的架构搭建了自己的平台。谷歌的AppEngine用户可以把键/值对存储在数据库中,而Hadoop的用户可以把它们放在Accumulo上,其他的可以使用Hypertable。所有的这些基本上都属于键/值存储,只不过添加了一些额外的功能,增加了搜索的速度而已。

10. DynamoDB

DynamoDB是亚马逊的key-value模式的存储平台,可用性和扩展性都很好,性能也不错:读写访问中99.9%的响应时间都在300ms内。DynamoDB的NoSQL解决方案,也是使用键/值对存储的模式,平且通过服务器把所有的数据存储在SSD上的三个不同的区域。如果有更高的传输需求,DynamoDB也可以在后台添加更多的服务器。(编译/@CSDN王鹏,审校/包研)

原文链接:InfoWorld


转自:http://www.cnblogs.com/shuaixf/archive/2012/10/13/2722115

相关问答

更多
  • Get:是以实体的方式得到由请求URI所指定资源的信息,如果请求URI只是一个数据产生过程,那么最终要在响应实体中返回的是处理过程的结果所指向的资源,而不是处理过程的描述。 Post:用来向目的服务器发出请求,要求它接受被附在请求后的实体,并把它当作请求队列中请求URI所指定资源的附加新子项,Post被设计成用统一的方法实现下列功能: 1:对现有资源的解释 2:向电子公告栏、新闻组、邮件列表或类似讨论组发信息。 3:提交数据块 4:通过附加操作来扩展数据库 从上面描述可以看出,Get是向服务器发索取数据的一 ...
  • myisam_recover = 64K#允许的GROUP_CONCAT()函数结果的最大长度 transaction_isolation = REPEATABLE-READ innodb_file_per_table #innodb_status_file = 1
  • 分类一:键值数据库 Redis, Voldemort, Oracle BDB,国内的ssdb 分类二:列存储数据库 Cassandra, HBase 分类三:文档型数据库 CouchDB, MongoDb,国内的SequoiaDB 分类四:图形(Graph)数据库 Neo4J, InfoGrid, Infinite Graph
  • 1. Casssandra 2. Lucene/Solr 3. Riak 4. CouchDB 5. Neo4J 6. Oracle的NoSQL 7. MongoDB 8. Hadoop的HBase 9. BigTable/ Accumulo/ Hypertable 10. DynamoDB 貌似 MongoDB 很有名。
  • 我认为' NoSQL实际使用的是什么 '对于NoSQL数据库的实际使用情况来说是一个很好的阅读。 让我在这里引用他们中的一些: 管理大量非事务性数据流:Apache日志,应用程序日志,MySQL日志,点击流等。 同步在线和离线数据。 这是CouchDB的一个定位。 所有负载下的响应时间都很快。 在复杂联接的查询负载变得对于RDBMS来说太大时避免重连接。 低延迟至关重要的软实时系统。 游戏就是一个例子。 需要支持各种不同的写入,读取,查询和一致性模式的应用程序。 有50%的读取系统为50%写入,95%写入或 ...
  • 不同的NoSQL解决方案之间的区别远远超过传统的SQL数据库。 例如,有一些简单的最终一致的键值数据存储,如Cassandra和其他更多功能丰富的文档存储,如MongoDB 。 但是,您不应盲目寻求功能最丰富的解决方案,因为在这种情况下,您不妨使用关系数据库。 SQL提供了您可能需要的所有功能,保证,教程,文档,易于实现等。 NoSQL通常是这些事物(或所有事物)之间的权衡,以及水平可扩展性的简易性。 您应该研究不同的解决方案,并选择最符合您的应用要求的解决方案。 请记住考虑关系数据库,因为SQL完全符合您 ...
  • 这取决于你的要求,你的项目类型等,而不是grails。 你指定了真正不同的技术,并且每个技术都有各自的优点和缺点。 首先: Hadoop只是一个分布式文件存储。 但它有一个键值nosql db,在其上面称为HBase,是大数据处理的最佳选择 MongoDB是一个面向文档的存储,适用于需要存储大量无模式数据的情况 Cassandra是关键值列式数据库,当您拥有并定义数据结构时,Cassandra是最佳选择 所以,它不是关于grails,而是关于你需要使用的,只有在你选择了合适的存储之后,你必须看看web框架 ...
  • 每个维基百科( https://en.wikipedia.org/wiki/ScaleBase )它是一个分布式MySQL实现。 它支持SQL。 因此,根据定义,它不符合“NoSQL”的条件 Per wikipedia (https://en.wikipedia.org/wiki/ScaleBase) it is a distributed MySQL implementation. It supports SQL. So, by definition, it doesn't qualify as "NoS ...
  • JPA完全是为RDBMS数据存储区定义的。 见Oracles规范。 有一些众所周知的JPA实现扩展了它们对JPA的支持,也允许一些非RDBMS数据存储与同一个API一起使用(原来的那个是DataNucleus JPA ,但是Hibernate和EclipseLink已经复制了这个以来)。 虽然您可以使用相同的API进行持久化,但您必须意识到自己做出了一些妥协,因为特别是查询语言并不总是适合非RDBMS数据存储。 没有计划(我知道)有非RDBMS的JPA规范。 有一个适用于RDBMS和非RDBMS的JDO ( ...
  • 当你想要轻松的时候,我猜想MongoDB。 那里有一些很棒的Mongo图书馆。 MongoMapper: http : //mongomapper.com/ Mongoid: http ://mongoid.org/ LightMongo: https : //github.com/elliotcm/light_mongo Mongomatic: http ://mongomatic.com/ 但每个NOSQL数据库都有自己的优点和缺点。 MongoDB很简单,其他人专注于其他功能。 When you're ...