MongoDB聚合运算符:$first

文章目录

    • 语法
    • 使用
      • 定义文档顺序
      • 数组操作
      • 缺失值的处理
    • 举例
      • 数据缺失的情况
      • 在$setWindowFields阶段中使用

$first聚合运算符返回分组中第一个文档指定表达式的结果,只有分组文档是有序的情况下才有意义。

$first可用于下列阶段:

  • $bucket
  • $bucketAuto
  • $group
  • setWindowFields

语法

{ $first: <expression> }

$不需要任何参数。

使用

定义文档顺序

  • $setWindowFields阶段,需要使用sortBy字段来定义文档顺序
  • 对于其他管道阶段,可以在其前面增加一个$sort阶段

数组操作

如果表达式解析为数组,则:

  • 对于一组文档,$first返回第一个文档的整个数组,不会遍历数组元素,类似于$group$setWindowFields阶段。
  • 对于单个文档,$first则返回数组的第一个元素,这类似于$addFields阶段

缺失值的处理

分组内的文档可能会有字段或字段值缺失,对于这种情况:

  • 如果前一管道阶段没有文档输入,则$group阶段什么也不返回
  • 如果字段$first处理的字段不存在,则返回null
  • 对于$setWindowFields,空窗口返回null,比如分区的第一个文档的文档窗口为{ documents:[ -1, -1] }

举例

使用下面的脚本创建sales集合:

db.sales.insertMany( [{ "_id" : 1, "item" : "abc", "price" : 10, "quantity" : 2, "date" : ISODate("2014-01-01T08:00:00Z") },{ "_id" : 2, "item" : "jkl", "price" : 20, "quantity" : 1, "date" : ISODate("2014-02-03T09:00:00Z") },{ "_id" : 3, "item" : "xyz", "price" : 5, "quantity" : 5, "date" : ISODate("2014-02-03T09:05:00Z") },{ "_id" : 4, "item" : "abc", "price" : 10, "quantity" : 10, "date" : ISODate("2014-02-15T08:00:00Z") },{ "_id" : 5, "item" : "xyz", "price" : 5, "quantity" : 10, "date" : ISODate("2014-02-15T09:05:00Z") },{ "_id" : 6, "item" : "xyz", "price" : 5, "quantity" : 5, "date" : ISODate("2014-02-15T12:05:10Z") },{ "_id" : 7, "item" : "xyz", "price" : 5, "quantity" : 10, "date" : ISODate("2014-02-15T14:12:12Z") }
] )

item字段对文档进行分组,使用$first运算符返回每个条目中的首次销售日期:

db.sales.aggregate([{ $sort: { item: 1, date: 1 } },{$group:{_id: "$item",firstSale: { $first: "$date" }}}]
)

操作返回下面的结果:

[{ _id: 'jkl', firstSale: ISODate("2014-02-03T09:00:00.000Z") },{ _id: 'xyz', firstSale: ISODate("2014-02-03T09:05:00.000Z") },{ _id: 'abc', firstSale: ISODate("2014-01-01T08:00:00.000Z") }
]

数据缺失的情况

使用下面的脚本创建badData集合,其中有些字段缺失,有些值缺失:

db.badData.insertMany( [{ "_id": 1, "price": 6, "quantity": 6 },{ "_id": 2, "item": "album", "price": 5 , "quantity": 5  },{ "_id": 7, "item": "tape", "price": 6, "quantity": 6 },{ "_id": 8, "price": 5, "quantity": 5  },{ "_id": 9, "item": "album", "price": 3, "quantity": '' },{ "_id": 10, "item": "tape", "price": 3, "quantity":  4 },{ "_id": 12, "item": "cd", "price": 7  }
] )

badData集合按照item字段分组并使用$fist将第一个$quantity的值放入inStock字段输出:

db.badData.aggregate( [{ $sort: { item: 1, price: 1 } },{ $group:{_id: "$item",inStock: { $first: "$quantity" }}}
] )

结果如下:

[{ _id: null, inStock: 5 },{ _id: 'album', inStock: '' },{ _id: 'cd', inStock: null },{ _id: 'tape', inStock: 4 }
]

在$setWindowFields阶段中使用

使用下面的脚本创建cakeSales集合:

db.cakeSales.insertMany( [{ _id: 0, type: "chocolate", orderDate: new Date("2020-05-18T14:10:30Z"),state: "CA", price: 13, quantity: 120 },{ _id: 1, type: "chocolate", orderDate: new Date("2021-03-20T11:30:05Z"),state: "WA", price: 14, quantity: 140 },{ _id: 2, type: "vanilla", orderDate: new Date("2021-01-11T06:31:15Z"),state: "CA", price: 12, quantity: 145 },{ _id: 3, type: "vanilla", orderDate: new Date("2020-02-08T13:13:23Z"),state: "WA", price: 13, quantity: 104 },{ _id: 4, type: "strawberry", orderDate: new Date("2019-05-18T16:09:01Z"),state: "CA", price: 41, quantity: 162 },{ _id: 5, type: "strawberry", orderDate: new Date("2019-01-08T06:12:03Z"),state: "WA", price: 43, quantity: 134 }
] )

此示例在$setWindowFields阶段使用$first输出每个州的第一个蛋糕销售订单类型:

db.cakeSales.aggregate( [{$setWindowFields: {partitionBy: "$state",sortBy: { orderDate: 1 },output: {firstOrderTypeForState: {$first: "$type",window: {documents: [ "unbounded", "current" ]}}}}}
] )

在本例中:

  • partitionBy: "$state"对集合中的文档按照州state进行分区,分别为CAWA
  • sortBy: { orderDate: 1 }对每个分区内的文档按照orderDate从小到大进行排序,$orderDate最早的在最前面
  • output将文档窗口内的第一个文档的订单类型type赋予一个新字段firstOrderTypeForState

执行结果如下:

{ "_id" : 4, "type" : "strawberry", "orderDate" : ISODate("2019-05-18T16:09:01Z"),"state" : "CA", "price" : 41, "quantity" : 162, "firstOrderTypeForState" : "strawberry" }
{ "_id" : 0, "type" : "chocolate", "orderDate" : ISODate("2020-05-18T14:10:30Z"),"state" : "CA", "price" : 13, "quantity" : 120, "firstOrderTypeForState" : "strawberry" }
{ "_id" : 2, "type" : "vanilla", "orderDate" : ISODate("2021-01-11T06:31:15Z"),"state" : "CA", "price" : 12, "quantity" : 145, "firstOrderTypeForState" : "strawberry" }
{ "_id" : 5, "type" : "strawberry", "orderDate" : ISODate("2019-01-08T06:12:03Z"),"state" : "WA", "price" : 43, "quantity" : 134, "firstOrderTypeForState" : "strawberry" }
{ "_id" : 3, "type" : "vanilla", "orderDate" : ISODate("2020-02-08T13:13:23Z"),"state" : "WA", "price" : 13, "quantity" : 104, "firstOrderTypeForState" : "strawberry" }
{ "_id" : 1, "type" : "chocolate", "orderDate" : ISODate("2021-03-20T11:30:05Z"),"state" : "WA", "price" : 14, "quantity" : 140, "firstOrderTypeForState" : "strawberry" }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/752063.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

初阶结构体

在这篇文章中我们只讲一些结构体的一些基础的知识&#xff0c;后续会继续补充关于结构体的高阶知识。 1.结构体声明 1.1结构体的基本知识 结构是一些值的集合&#xff0c;这些值称为成员变量。结构的每个成员可以是不同类型的变量。 结构可以用来描述复杂对象&#xff0c;在…

day10-SpringBootWeb案例-1

一、准备工作 1 需求&环境搭建 步骤&#xff1a; 准备数据库表(dept、emp)创建 springboot 工程&#xff0c;引入对应的起步依赖&#xff08;web、mybatis、mysql 驱动、lombok&#xff09;配置文件 application.properties 中引入 mybatis 的配置信息&#xff0c;准备对应…

CI/CD实战-gitlab代码仓库 2

gitlab安装部署 实验虚拟机最小需求&#xff1a;4g内存&#xff0c;4核cpu 下载源&#xff1a;Index of /gitlab-ce/yum/el7/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 安装依赖性&#xff1a; 安装软件&#xff1a; 修改依赖性配置文件 重新自动化配置 登录…

如何在 iPhone 上使用蓝牙鼠标

iPhone 不支持使用传统的鼠标指针。 然而&#xff0c;有一个名为“AssistiveTouch”的功能可以在屏幕上模拟类似光标的指针。 启用它的方法如下&#xff1a; 打开 iPhone 上的“设置”应用程序。转到“辅助功能”。向下滚动并选择“触摸”。点击“辅助触控”。切换开关以打开 …

Rust 01.变量、类型、函数

转义输出&#xff1a; fn main() {let a 12;println!("a {{{}}}", a); } //a {12}type let is_true: bool true;println!("is_true {}", is_true);let is_false false;println!("is_false {}, {}", is_false, is_true);//char 在rust里面…

快速排序(数据结构)

1. 前言&#xff1a; 这两种排序经常使用&#xff0c;且在算法题中经常遇见。 这里我们简单分析讨论一下。 1. 快速排序 平均时间复杂度&#xff1a;O&#xff08;nlogn&#xff09; 最坏时间复杂度&#xff1a; O&#xff08;n^2&#xff09; 1.1. 左右向中遍历: 取最右侧4…

MiniGPT-5: 通过生成性视觉标记实现交错式视觉与语言生成

MiniGPT-5: Interleaved Vision-And-Language Generation via Generative Vokens 摘要 近年来&#xff0c;大型语言模型(LLM)在自然语言处理(NLP)领域的突破性进展引起了全球AI开发者的关注。这些模型在文本生成和理解方面设定了新的基准。然而&#xff0c;尽管在文本生成方面…

HarmonyOS NEXT应用开发—发布图片评论

介绍 本示例将通过发布图片评论场景&#xff0c;介绍如何使用startAbilityForResult接口拉起相机拍照&#xff0c;并获取相机返回的数据。 效果图预览 使用说明 通过startAbilityForResult接口拉起相机&#xff0c;拍照后获取图片地址。 实现思路 创建CommentData类&#…

Linux TCP参数——tcp_abort_on_overflow

tcp_abort_on_overflow 英文翻译理解&#xff1a;溢出中止 所以&#xff0c;溢出指的是什么溢出&#xff1f; Linux中会维护socket全连接队列&#xff0c;所以这里的溢出指的是全连接队列的溢出。 全连接队列是什么&#xff1f; 全连接队列指的就是TCP三次握手中的第三次握手…

腾讯云轻量应用服务器2核4G5M代表什么意思?

腾讯云服务器2核4G5M带宽配置是代表什么&#xff1f;代表2核CPU、4G内存、5M公网带宽&#xff0c;这是一款轻量应用服务器&#xff0c;系统盘为60GB SSD云硬盘&#xff0c;活动页面 txybk.com/go/txy 活动打开如下图&#xff1a; 腾讯云2核4G5M服务器 如上图所示&#xff0c;这…

sqllab第29-33通关笔记

29关知识点&#xff1a; 单引号闭合绕过联合注入 payload:id0%27unionselect1,2,database()%271报错注入 id1%27andextractvalue(1,concat(0x7e,database(),0x7e))%271下面就不演示了&#xff0c;上面给出了payload&#xff0c;感觉没有任何过滤信息&#xff0c;那个waf应该是…

嵌入式系统架构设计

本博客地址&#xff1a;https://security.blog.csdn.net/article/details/136745118 一. 嵌入式系统硬件 1、传统嵌入式系统主要硬件包括&#xff1a; ● 微处理器&#xff1a;微控制器&#xff08;MCU&#xff09;&#xff0c;微处理器&#xff08;MPU&#xff09; ● 存储器…

HCIA——TCP协议详解

目录 1、TCP概念及协议头部格式 1.1TCP特点 1.2TCP协议协议头部格式 1.3字段进行介绍 1.3.1源端口和目的端口 1.3.2序号(seq) 1.3.3确认序号(ack) 1.3.4数据偏移 1.3.5标志位 1.3.6窗口 1.3.7校验和 1.3.8紧急指针 2、TCP的可靠性 2.1 TCP可靠性的保障 2.2排序机…

Android Studio实现内容丰富的安卓博客发布平台

获取源码请点击文章末尾QQ名片联系&#xff0c;源码不免费&#xff0c;尊重创作&#xff0c;尊重劳动 项目编号078 1.开发环境android stuido jdk1.8 eclipse mysql tomcat 2.功能介绍 安卓端&#xff1a; 1.注册登录 2.查看博客列表 3.查看博客详情 4.评论博客&#xff0c; 5.…

Winform编程详解十:ListBox 列表框

一、属性介绍 1. (Name) 控件的对象标识符ID 2. Items 控件的数据集合 3. BackColor 控件的背景颜色 4. BorderStyle 控件的边框样式 5. Cursor 鼠标移过该控件显示的光标样式 6. Font 控件的字体样式 7. ForeColor 控件的文本颜色 8. UseWaitCursor 使用鼠标的等待光…

Llama 2: 深入探讨ChatGPT的开源挑战者

Llama 2&#xff1a;开源挑战者深度解析 摘要 本文深入探讨了Llama 2的能力&#xff0c;并提供了在Google Colab上通过Hugging Face和T4 GPU设置这个高性能大型语言模型的详细指南。Llama 2是由Meta与Microsoft合作开发的开源大型语言模型&#xff0c;旨在重新定义生成式人工…

HBase在表操作--显示中文

启动HBase后&#xff0c;Master和RegionServer两个服务器&#xff0c;分别对应进程为HMaster和HRegionServe。&#xff08;可通过jps查看&#xff09; 1.进入表操作 hbase shell 2.查看当前库中存在的表 list 3.查看表中数据&#xff08;注&#xff1a;学习期间可用&#…

RUST egui部署到github

Dist 接上文&#xff0c;当用trunk serve编译部署后&#xff0c;工程目录下就会有一个dist目录&#xff0c;这个目录就是用来部署用的。 &#xff1a;&#xff09; Github repo 创建一个github repo&#xff0c;这个repo的名称有固定格式要求&#xff0c;就是你自己的用户名…

将FastSAM中的TextPrompt迁移到MobileSAM中

本博文简单介绍了SAM、FastSAM与MobileSAM,主要关注于TextPrompt功能的使用。从性能上看MobileSAM是最实用的,但其没有提供TextPrompt功能,故而参考FastSAM中的实现,在MobileSAM中嵌入TextPrompt类。并将TextPrompt能力嵌入到MobileSAM官方项目提供的gradio.py部署代码中,…

【JVM】生产内存占用异常优化 (一)

记录一次 - 内存占用优化 某个导出&#xff0c;导出数据量过大总是导致OOM&#xff0c;但是根据需求&#xff0c;导出数据大小并没有那么大 按照导出数据的查询来看 SELECTg.inventory_code,g.visit_record_code,g.recovery_price AS transactionAmount FROM crm_goods g ...…