知识点
软件工具
相关文章
更多最近更新
更多MongoDB学习(二):数据类型和基本概念
2019-03-27 09:24|来源: 网络
数据类型也可以看这篇文章:MongoDB的体系结构_深入浅出MongoDB(三)
数据类型
基本数据类型
MongoDB的文件存储格式为BSON,同JSON一样支持往其它文档对象和数组中再插入文档对象和数组,同时扩展了JSON的数据类型.与数据库打交道的那些应用。例如,JSON没有日期类型,这会使得处理本来简单的日期问题变得非常繁琐。只有一种数字类型,没法区分浮点数和整数,更不能区分32位和64位数字。也没有办法表示其他常用类型,如正则表达式或函数。
下面是MongoDB的支持的数据类型:
null null用于表示空值或者不存在的字段。 {"x":null}
布尔 布尔类型有两个值'true'和'false1'. {"X":true}
32位整数 类型不可用。JavaScript仅支持64位浮点数,所以32位整数会被自动转换。
64位整数 不支持这个类型。shell会使用一个特殊的内嵌文档来显示64位整数,
64位浮点数 shell中的数字都是这种类型。下面的表示都是浮点数: {"X" : 3.1415926} {"X" : 3}
字符串 UTF-8字符串都可表示为字符串类型的数据: {"x" : "foobar"}
符号 不支持这种类型。shell将数据库里的符号类型转换成字符串。
对象id 对象id是文档的12字节的唯一 ID, {"X" :ObjectId() }
日期 日期类型存储的是从标准纪元开始的毫秒数。不存储时区: {"X" : new Date()}
正则表达式 文档中可以包含正则表达式,采用JavaScript的正则表达式语法: {"x" : /foobar/i}
代码 文档中还可以包含JavaScript代码:{"x" : function() { /* …… */ }}
二进制数据 二进制数据可以由任意字节的串组成。不过shell中无法使用。
最大值 BSON包括一个特殊类型,表示可能的最大值。shell中没有这个类型。
最小值 BSON包括一个特殊类型,表示可能的最小值。shell中没有这个类型。
未定义 文档中也可以使用未定义类型:{"x":undefined}
数组 值的集合或者列表可以表示成数组:{"x" : ["a", "b", "c"]}
内嵌文档 文档可以包含别的文档,也可以作为值嵌入到父文档中,数据可以组织得更自然些,不用非得存成扁平结构的:{"x" : {"food" : "noodle"}}
数字
JavaScript中只有一种“数字”类型。因为MongoDB中有3种数字类型(32位整数、64位整数和64位浮点数),shell必须绕过JavaScript的限制。默认情况下,shell中的数字都被MongoDB当做是双精度数。这意味着如果你从数据库中获得的是一个32位整数,修改文档后,将文档存回数据库的时候,这个整数也被转换成了浮点数,即便保持这个整数原封不动也会这样的。所以明智的做法是尽量不要在shell下覆盖整个文档。
日期
JavaScript的Date对象用做MongoDB的日期类型,创建一个新的Date对象时,通常会调用new Data("")。
基本概念
下面将按照学习RDMS时先介绍类似行、表、数据库概念的知识,然后在去学习增删改查等操作。
1.文档
文档是MongoDB中数据的基本单元(类似于关系型数据库中的行,但是比行要复杂得多)。多个键及其关联的值有序地放置在一起便是文档。MongoDB的文件存储格式为BSON。
BSON是Binary JSON 的简称,是一个JSON文档对象的二进制编码格式。BSON同JSON一样支持往其它文档对象和数组中再插入文档对象和数组,同时扩展了JSON的数据类型。如:BSON有Date类型和BinDate类型。BSON有三个特点:轻量性、可遍历性、高效性
文档就可以这样表示:
{ "firstName": "egger", "lastName":"wong" }
注意点:
文档中的键/值对是有序的。
文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌人的文档)。
MongoDB区分类型和大小写。
MongoDB的文档不能有重复的键。
文档的键是字符串。除了少数例外情况,键可以使用任意UTF-8字符。
键不能含有\0 (空字符)。这个字符用来表示键的结尾。
.和$有特别的意义,只有在特定环境下才能使用。
以下划线"_"开头的键是保留的(不是严格要求的)。
2.集合
集合就是一组文档(类似于关系型数据库中的表),可以被看做是没有模式的表。
无模式
集合是无模式的。这意味着一个集合里面的文档可以是各式各样的。例如,下面两个文档可以存在于同一个集合里面:
{"name": "egger"}
{"age":18}
上面的文档不光是值的类型不同(字符串和整数),它们的键也是完全不一样的。
虽然集合里面可以放置任何文档,但是推荐使用多个集合:
把各种各样的文档都混在一个集合里面,无论对于开发者还是管理员来说都是噩梦。
在一个集合里面査询特定类型的文档在速度上也很不划算,分开做多个集合要快得多。
把同种类型的文档放在一个集合里,这样数据会更加集中。
当创建索引的时候,文档会有附加的结构(尤其是有唯一索引的时候)。索引是按照集合来定义的。把同种类型的文档放入同一个集合里面,可以使索引更加有效。
命名
我们可以通过名字来标识集合。集合名可以是满足下列条件的任意UTF-8字符串。
集合名不能是空字符串""。
集合名不能含有\0字符(空字符),这个字符表示集合名的结尾。
集合名不能以"system."开头,这是为系统集合保留的前缀。
用户创建的集合名字不能含有保留字符$。有些驱动程序的确支持在集合名里面包含$,这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合,否则千万不要在名字里出现$。
子集合
组织集合的一种惯例是使用"."字符分开的按命名空间划分的子集合。在MongoDB中使用子集合来组织数据是很好的方法
例如,一个个人信息可能包含两个集合,分别是person.name和person.age。这样做的目的只是为了使组织结构更好些,也就是说person这个集合(这里根本就不需要存在)及其子集合没有任何关系。把数据库的名字放到集合名前面,得到就是集合的完全限定名,称为命名空间。命名空间的长度不得超过121字节,在实际使用当中应该小于100字节。
很多MongoDB工具中都包含子集合。
GridFS是一种存储大文件的协议,使用子集合来存储文件的元数据,这样就与内容块分开了
MongoDB的Web控制台通过子集合的方式将数据组织在DBTOP部分.
绝大多数驱动程序都提供语法糖,为访问指定集合的子集合提供方便。
3.数据库
MongoDB中多个集合可以组成数据库。MongoDB的单个实例可以容纳多个独立的数据库,每一个都有自己的集合和权限,不同的数据库也放置在不同的文件中。
数据库也通过名字来标识。数据库名可以是满足以下条件的任意UTF-8字符串。
不能是空字符串("")。
不得含有' '(空格)、.、$、/、\和\0 (空宇符)。
应全部小写。
最多64字节。
有一些数据库名是保留的,可以直接访问这些有特殊作用的数据库。
• admin
从权限的角度来看,这是“root”数据库。要是将一个用户添加到这个数据库,这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行,比如列出所有的数据库或者关闭服务器。
• local
这个数据永远不会被复制,可以用来存储限于本地单台服务器的任意集合
• config
当Mongo用于分片设置时,config数据库在内部使用,用于保存分片的相关信息。
本文链接:MongoDB学习(二):数据类型和基本概念,转自:http://www.cnblogs.com/egger/archive/2013/04/27/3047191.html
相关问答
更多-
JAVA中掌握JDBC的基本概念,并能够完成基本的数据库读写操作。[2021-10-29]
1.建立数据库database,建立数据表student。 字段: sid 学号 文本 sname 姓名 文本 ssex 性别 文本(2字节) saddress 地址 文本 stel 电话 文本 2.类代码 /****************************************************** 使用: 设置数据库路径、sql语句、最大返回行数,使用getHTMLTable()返回html表格形式的字符串 executeSQL(String,String)执行SQL语句返回一个对象,请 ... -
mongodb的id的数据类型怎么写objectid[2022-04-04]
1、前4个字节(即前八位字符串)是一个UNIX时间戳,精确到秒,实际上隐藏了文档创建的时间(将其换算成十进制,再格式化一下即可发现) 2、接下来的3个字节,是所在主机的唯一标识符,一般是机器主机名的散列值,这样就确保了不同主机生成不同的机器hash值,在分布式中不造成冲突,这也就是在同一台机器生成的ObjectId中间的字符串都是一模一样的原因 3、这两个字节PID是为了在同一台机器不同的mongodb进程产生的ObjectId不冲突,即进程标识符 4、前面的字节保证了一秒内不同机器不同进程生成的Objec ... -
怎样修改mongodb中数据类型[2023-04-29]
MongoDB的文档使用BSON(Binary JSON)来组织数据,BSON类似于JSON,JSON只是一种简单的表示数据的方式,只包含了6种数据类型(null、布尔、数字、字符串、数组及对象),不能完全满足复杂业务的需要,因此,BSON还提供日期、32位数字、64位数字等类型。以下对mongoDB的类型进行简要说明: 1、 null null类型用于表示空值或不存在的字段,如:{“one”:null} 2、 布尔类型 布尔类型有两上值,’true’和’false’ ,如:{“one”:true} 3、 ... -
python 概念 list,string,tuple 类型区别 以及 数据类型区别[2022-05-07]
标准答案我是不知道,但是string的元素只能是字符;而list, tuple中的元素几乎可以为任意类型(包括list, tuple, dict等)。 -
python 概念 list,string,tuple 类型区别 以及 数据类型区别[2022-04-30]
标准答案我是不知道,但是string的元素只能是字符;而list, tuple中的元素几乎可以为任意类型(包括list, tuple, dict等)。 -
栈和队列 基本概念[2022-04-19]
栈,是一种先进后出的数据结构, 队列,是一种先进先出的数据结构, 栈,有一个指针,指向栈顶元素 队列,有两个指针,一个指向队尾,一个指向队首 栈,只能从顶进,从顶出 队列,从队尾进,从队首出 栈,像一个木桶,我们往里面放面包,我们只能从桶口处往里面放,然后再从桶口处往外取,这就形成了栈的先进后出的特性。 队列,像一个管子,我们从管子的屁股处往里面塞糖豆,肯定是最先塞进去的糖豆先从管子的头处掉出去,这就形成了队列的先进先出的特性。 这是我能达到的最精简的程度了,希望你能看懂。^_^ -
贝塞尔函数的基本概念[2022-11-03]
是数学上的一类特殊函数的总称。一般贝塞尔函数是下列常微分方程(一般称为贝塞尔方程)的标准解函数: 这类方程的解是无法用初等函数系统地表示的。 贝塞尔函数的具体形式随上述方程中任意实数 变化而变化(相应地, 被称为其对应贝塞尔函数的阶数)。实际应用中最常见的情形为 是整数 ,对应解称为n阶贝塞尔函数。 尽管在上述微分方程中, 本身的正负号不改变方程的形式,但实际应用中仍习惯针对 和 定义两种不同的贝塞尔函数(这样做能带来好处,比如消除了函数在 点的不光滑性)。 -
例如,一些单位数字插入为长整数 PyMongo将python 2.x存储为BSON int64,无论值如何,python int为BSON int32 或 BSON int64,具体取决于int的值。 有关python类型到BSON类型的映射,请参见此处的表 。 时间戳作为字符串插入 假设时间戳以ISO-8601格式传递,这是正确的。 如果要将时间戳存储为BSON日期时间,则传递python datetime对象。 同样,作为YY-MM-DD存储在MySQL中的日期更改为YY-MM-DD 00:00:00( ...
-
C#+ MongoDB - ObjectId,不使用MongoDB数据类型/属性(C# + MongoDB - ObjectId without using MongoDB DataTypes/Attributes)[2022-04-15]
选项1:坚持使用BsonId并使用Facade模式 [BsonId]属性是你用来表示_id属性应该链接到一个特定的属性。 没有办法解决这个问题(完全忽略你的crud操作中的_id,这似乎是一个糟糕的主意)。 所以,如果你想将你的“实体”对象从“数据层”中分离出来,那么就使用一个poco类。 - 使用poco课程替代记录。 该类仅用于数据存储:快速获取mongo数据的方法,以及与bson文档一起工作的绝佳选择。 - 在您的实体层上使用该poco类的门面 。 我不觉得重新发明轮子很有用,所以我通常会问我们的开发 ... -
关于数据类型(Regarding data types)[2022-06-28]
变量的数据类型决定了它可以存储的数据类型以及可能采用的值。 它还有助于确定可以对变量执行的操作类型。 说Python没有数据类型是错误的。 即使在Python中,每个值都有一个数据类型,但您并不总是需要声明变量的数据类型。 根据每个变量的原始赋值,Python会计算出它的类型并在内部跟踪它。 The data type of a variable determines what kind of data it can store and what possible values it may take. I ...