安装
下载: Download MongoDB Community Server | MongoDB
说明: 现在基本都安装的是4.4以后的版本。安装完成后使用 mongod 来查看是否安装成功
会输出一堆内容
而如果想要操作数据库,则需要安装一个工具,mongosh-2.2.12-x64.msi
地址: Try MongoDB Tools - Download Free Here | MongoDB
如果 这个shell 不安装,目前输入 mongo 会提示不是内部或外部命令
我这里没有安装,因为我使用的是 pymongo 来操作数据库暂时搁置
我这里使用的是图形化界面
打开后直接点击连接即可
下载地址: Try MongoDB Tools - Download Free Here | MongoDB
安装到和 MongoDB 同一个目录即可
安装 pymongo
pip install pymongo
连接 MongoDB
连接 MongoDB 时,需要使用PyMongo 库里的MongoClient 方法, 一般而言, 传入 MongoDB 的IP及端口号即可。 MongoClient 方法的第一个参数为地址 host , 第二个参数为端口 port (如果不传入此参数,默认为 27017)
import pymongo
client = pymongo.MongoClient(host='localhost', port= 27017)
这样就可以创建 MongoDB 的连接对象了
另外还可以直接给 MongoClient 的第一个参数 host 传入 MongoDB 的连接字符串, 它以 mongodb 开头
client = MongoClient('mongodb://loaclhost:270717/')
这可以达到同样的效果
指定数据库
在 MongoDB 中,可以建立多个数据库, 所以我们需要指定操作哪个数据库。这里我们以指定 test数据库为例
db = client.test
也可以
db = client['test']
效果等价
指定合集
MongoDB 的每个数据库又都包含许多集合(collection) , 这些集合类似于关系型数据库中的表。
这里指定一个集合,名称为 students
collection = db.students
或者
collection = db['students']
插入数据
在students 中插入一条数据数据
这里有的老版会看到使用的是 insert 这个方法已经弃用了
result = collection.insert_one(student)
print(result)
InsertOneResult(ObjectId('669f7a2f7892de6a90c80867'), acknowledged=True)
插入多条数据
student1 = {
'id': '20170101',
'name': 'Jordan',
'age': 20,
'gender': 'male'
}student2 = {
'id': '20170202',
'name': 'Mike',
'age': 21,
'gender': 'male'
}
result = collection.insert_many([student1,student2])
print(result)
InsertManyResult([ObjectId('669f7a967892de6a90c80868'), ObjectId('669f7a967892de6a90c80869')], acknowledged=True)
对于单个数据可以使用 inserted_id 来获取单个 ID 如果是多个则需要使用 inserted_ids 来获取
print(result.inserted_ids)
[ObjectId('669f7a967892de6a90c80868'), ObjectId('669f7a967892de6a90c80869')]
查询
我们可以利用 find_one 和 find 来查询数据,前者是查询单个结果,后者则会返回一个生成器对象
result = collection.find_one({'name': 'Mike'})
print(type(result))
print(result)
<class 'dict'> {'_id': ObjectId('669f7a967892de6a90c80869'), 'id': '20170202', 'name': 'Mike', 'age': 21, 'gender': 'male'}
可以发现是字典类型,它多了 _id 属性, 这就是 MongoDB 在插入过程中自动添加的
此外我们也可以根据 ObjectId 来查询数据, 此时需要使用 bson 库里的 objectid
from bson.objectid import ObjectId
result = collection.find_one({'_id': ObjectId('669f7a967892de6a90c80869')})
print(result)
{'_id': ObjectId('669f7a967892de6a90c80869'), 'id': '20170202', 'name': 'Mike', 'age': 21, 'gender': 'male'}
其结果依然是字典类型, 里面的 669f7a967892de6a90c80869 是前面复制的
如果查询结果不存在,则会返回 None
如果要查询多条数据,可以用 find 方法
results = collection.find({'age': 20})
print(results)
for result in results:
print(result)
<pymongo.cursor.Cursor object at 0x000001DEE1293050> {'_id': ObjectId('669f79bd7892de6a90c80865'), 'id': '20170101', 'name': 'Jordan', 'age': 20, 'gender': 'male'} {'_id': ObjectId('669f7a2f7892de6a90c80867'), 'id': '20170101', 'name': 'Jordan', 'age': 20, 'gender': 'male'} {'_id': ObjectId('669f7a967892de6a90c80868'), 'id': '20170101', 'name': 'Jordan', 'age': 20, 'gender': 'male'}
返回结果是 Cursor 类型,相当于一个生成器, 通过遍历能过获取所有结果,其每个结果都是字典类型
如果要查询 age 大于20 的数据
results = collection.find({'age': {'$ge':20}})
这里查询的键值已经不是单纯的数字了,而是一个字典, 其键名为比较符号 $gt 意思是大于
键值为 20
这里列出一些符号
符号 | 含义 | 实例 |
$lt | 小于 | {’age' : {'$lt': 20}} |
$gt | 大于 | {’age' : {'$gt': 20}} |
$lte | 小于等于 | {’age' : {'$lte': 20}} |
$gte | 大于等于 | {’age' : {'$gte': 20}} |
$ne | 不等于 | {’age' : {'$ne': 20}} |
$in | 在范围内 | {’age' : {'$in': [20, 23]}} |
$nin | 不在范围内 | {’age' : {'$nin': [20, 23]}} |
另外还可以执行正则匹配查询
result = collection.find({'name': {'$regex': '^M.*'}})
这里使用 $regex 来指定正则匹配, ^M.* 代表 以 M 开头的正则表达式
下面是一些功能符号
符号 | 含义 | 实例 | 实例含义 |
$regex | 匹配正则表达式 | {'name': {'$regex': '^M.*'}} | name 以M为开头 |
$exists | 属性是否存在 | {'name': {'$exists': True}} | 存在name 属性 |
$ype | 类型判断 | {'age': {'$type': 'int' }} | age 的 类型为 int |
$mod | 数字模操作 | {'age': {'$mod':[5, 0] }} | age 模 5 余 0 |
$text | 文本查询 | {'$text': {'$search': 'Mike' }} | text类型的属性中包含 Mike 字符串 |
$where | 高级条件查询 | {'$where' : 'obj.fans_count == obj.follows_count'} | 自身粉丝数等于关注数 |
计数
要统计查询结果包含多少条数据
以前版本的 count 方法已经弃用
count = collection.estimated_document_count()
print(count)
如果要带条件查询
count = collection.count_documents({'age': 20})
print(count)
排序
排序时 调用 sort 方法
results = collection.find().sort('name', pymongo.ASCENDING)
print([result['name'] for result in results])
['Jordan', 'Jordan', 'Jordan', 'Mike']
偏移
某些情况下,我们可能只需要其中的某几个元素,这个时候可以用 skip 方法设置偏移几个位置
results = collection.find().sort('name', pymongo.ASCENDING).skip(2)
print([result['name'] for result in results])
['Jordan', 'Mike']
另外还可以使用 limit 方法指定获取的元素个数
results = collection.find().sort('name', pymongo.ASCENDING).limit(2)
print([result['name'] for result in results])
['Jordan', 'Jordan']
如果不使用 limit 方法加以限制,原本会返回 4 个结果, 而加了限制之后会返回 2 两个结果
值得注意的时, 在数据库中数据量非常庞大的时候, 最好不要使用大偏移量来查询数据,因为这样可能会导致内存溢出。可以使用如下方法
from bson.objectid import ObjectId
collection.find({'_id' :{'$ge': {ObjectId('669f79bd7892de6a90c80865')}}})
这里需要记录之前的 ID
更新
对于数据更新可以使用 update_one 修改一条数据,update_many 修改多条数据
condition = {'name': 'Kevin'}
student = collection.find_one(condition)
newstudent = {"$set" : {"age": 25}}
result = collection.update_one(condition, newstudent)
print(result)
UpdateResult({'n': 1, 'nModified': 1, 'ok': 1.0, 'updatedExisting': True}, acknowledged=True)
这里我们更新的是 name 值为 Mike的学生数据的 age , 首先指定查询条件, 然后将数据查询出来,修改其 age 后调用 update_one 方法将原本条件和修改后的数据传入
返回结果是字典形式, ok 代表执行成功, nModified 代表影响的数据条数
修改多条数据
condition = {'age': {'$gt': 20}}
result = collection.update_many(condition, {'$inc': {'age': 1}})
print(result)
print(result.matched_count, result.modified_count)
UpdateResult({'n': 2, 'nModified': 2, 'ok': 1.0, 'updatedExisting': True}, acknowledged=True) 2 2
删除
删除 使用 delete_one() 删除一条, delete_many() 删除多条
result = collection.delete_one({'name': 'Kevin'})
print(result)
DeleteResult({'n': 1, 'ok': 1.0}, acknowledged=True)
delete_many() 删除多条
result = collection.delete_many({'age': {'$lt': 25}})
print(result.deleted_count)
2