DataFrame RHS语法查询语句

RHS:https://github.com/acoboh/query-filter-jpa/blob/main/README.md

规则:
查询字段名:查询条件(条件值) 关系符 查询字段名:查询条件(条件值) ...

查询条件有:
‒ eq: 等于
‒ gt: 大于
‒ gte: 大于等于
‒ lt: 小于
‒ lte: 小于等于
‒ ne: 不等于
‒ cn: 包含
‒ ncn: 不包含
‒ re: 正则
‒ sw: 以xxx开头
‒ ew: 以xxx结尾

关系符有:
‒ and: 与
‒ or: 或

排序:
在最后边使用 sort 关键字排序,如果逆序排序,就在字段前加个负号(-)。如:sort(a) 或者 sort(-a)

例:
有如下一个表:
id gene mid e10
1 abc1 23 12
2 test1 35 32
3 abc2 16 21

// 查询 gene = abc1
query = gene:eq(abc1)
得到:
abc1 23 12
虽然这样也能查出来,但是最好用下面这样的命令:
query = id:eq(1)
这样可以提高查询效率

// 查询 mid > 10 且 小于 20
query = mid:gt(10) and mid:lt(20)
得到:
abc2 16 21

// 查询 gene 包含 abc 并按 gene 顺序排序
query = gene:cn(abc) sort(gene)
得到:
abc1 23 12
abc2 16 21

// 查询 gene 包含 abc 并按 gene 逆序排序
query = gene:cn(abc) sort(-gene)
得到:
abc2 16 21
abc1 23 12

【注】不能任意使用空格 只能在两个元素之间使用空格。支持用括号()来表示优先级。

代码

点击查看代码
import re
import pandas as pd
from functools import lru_cacheclass QueryManage:"""Convert the query statement to pandas syntax"""# operate mapOPR_MAP = {"eq": lambda x, y: f"['{x}']=={y}","gt": lambda x, y: f"['{x}']>{y}","gte": lambda x, y: f"['{x}']>={y}","lt": lambda x, y: f"['{x}']<{y}","lte": lambda x, y: f"['{x}']<={y}","ne": lambda x, y: f"['{x}']!={y}","cn": lambda x, y: f"['{x}'].str.contains('{y}')","ncn": ("~", lambda x, y: f"['{x}'].str.contains('{y}')"),"sw": lambda x, y: f"['{x}'].str.contains(r'^{y}')","ew": lambda x, y: f"['{x}'].str.contains(r'{y}$')",# 're': '',}# relationship mapRLP_MAP = {"and": "&", "or": "|"}# sortSORT = lambda x: (f"sort_values('{x.replace('-', '')}',ascending=False)"if "-" in xelse f"sort_values('{x}')")# pattern filter field# PFF = re.compile(f"(?P<field>(\w+)):(?P<operate>(\w+))\((?P<value>(\w+))\)")PFF = re.compile(f"(?P<leftParen>(^\(*))(?P<field>(\w+)):(?P<operate>(\w+))\((?P<value>(\w+))\)(?P<rightParen>(\)*$))")# pattern filter sortPFS = re.compile(r"sort\((-*\w+)\)")def __init__(self, resource: pd.DataFrame):self.resource = resourcedef _validCheck(self, condition: list):assert condition[-1] not in self.__class__.RLP_MAP, ValueError("query invalid")def _parse(self, condition: list):cond = ""sort = ""switch = Falsefor elem in condition:switch = not switchif switch:patRes = self.__class__.PFF.match(elem)assert patRes, ValueError("query invalid")if patRes.group("leftParen"):cond += "("opr = self.__class__.OPR_MAP.get(patRes.group("operate"))assert opr, ValueError(f"invalid operate {patRes.group('operate')}")if isinstance(opr, tuple):sign, opr_ = oprcond += f"({sign}self.resource{opr_(patRes.group('field'), patRes.group('value'))})"else:cond += f"(self.resource{opr(patRes.group('field'), patRes.group('value'))})"if patRes.group("rightParen"):cond += ")"else:rlp = self.__class__.RLP_MAP.get(elem.lower())if rlp:cond += rlpelse:# sort fieldfs = self.__class__.PFS.findall(elem)assert fs, ValueError("query invalid")sort = self.__class__.SORT(fs[0])return cond, sort@lru_cache(maxsize=10)def query(self, condition: str):try:cond = condition.strip().split(" ")self._validCheck(cond)cond, sort = self._parse(cond)print("cond: ", cond, sort)return (eval(f"self.resource[{cond}].{sort}")if sortelse eval(f"self.resource[{cond}]"))except AttributeError:raise ValueError("query invalid")if __name__ == "__main__":df = pd.DataFrame({"a": [1, 2, 3, 4, 5], "b": ["abc", "bcd", "cfg", "adv", "ecf"]})qm = QueryManage(df)# a==2res = qm.query("a:eq(2)")print("a==2 :\n", res)# a==2 or a==4res = qm.query("a:eq(2) or a:eq(4)")print("a==2 or a==4 :\n", res)# b.contains('b') and a==1res = qm.query("b:cn(b) and a:eq(1)")print("b.contains('b') and a==1 :\n", res)# ~b.contains('a')res = qm.query("b:ncn(a)")print("~b.contains('a') :\n", res)# a>1 sort(-a)res = qm.query("a:gt(1) sort(-a)")print("a>1 sort(-a) :\n", res)# (a ==1 or a==3) and b.contains('f')res = qm.query("(a:eq(1) or a:eq(3)) and b:cn(f)")print("(a ==1 or a==3) and b.contains('f') :\n", res)# a ==1 or a==3 and b.contains('f')res = qm.query("a:eq(1) or a:eq(3) and b:cn(f)")print("a ==1 or a==3 and b.contains('f') :\n", res)# b.startwith(a)res = qm.query("b:sw(a)")print("b.startwith(a) :\n", res)# b.endwith(c)res = qm.query("b:ew(c)")print("b.endwith(c) :\n", res)

执行结果image

image

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/50709.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[读论文] LawBench: Benchmarking Legal Knowledge of Large Language Models

Abstract LLM 在各个方面都表现出了强大的能力。然而&#xff0c;当将它们应用于高度专业化、安全关键的法律领域时&#xff0c;尚不清楚他们拥有多少法律知识以及他们是否能够可靠地执行与法律相关的任务。为了弥补这一差距&#xff0c;文章提出了一个综合性评估基准 LawBench…

【SpringBoot】5 Swagger

官网 https://swagger.io/ 介绍 Swagger 是一套基于 OpenAPI 规范构建的开源工具&#xff0c;可以帮助开发者实现设计、构建、记录、使用 Rest API。 Swagger 是一款根据 Restful 风格生成的接口开发文档&#xff0c;并且支持做测试的一款中间软件。 Swagger主要包括三部分&…

力扣141环形链表问题|快慢指针算法详细推理,判断链表是否有环|龟兔赛跑算法

做题链接 目录 前言&#xff1a; 一、算法推导&#xff1a; 1.假设有环并且一定会相遇&#xff0c;那么一定是在环内相遇&#xff0c;且是快指针追上慢指针。 2.有环就一定会相遇吗&#xff1f;快指针是每次跳两步&#xff0c;有没有可能把慢指针跳过去&#xff1f; 3.那一定…

Spring Security认证授权介绍

一、目标 真正控制系统权限的&#xff0c;需要引入专门的安全框架才行&#xff0c;所以&#xff0c;我们今天重点来学习Spring家族中的一员Spring Security安全框架。最终呢&#xff0c;我们会使用Spring Security框架来控制养老项目的后台管理系统 能够熟悉常见的权限控制的方…

恒源云oss命令上传数据与下载数据

云服务器解压zip项目代码 (根目录) unzip 【】unzip /root/.../[已有的压缩包名].zip -d [解压到的目标文件夹路径]云服务器压缩zip项目代码 (根目录) zip -r 【自定义】.zip 【】/z

【通信模块】LoraWAN网络简介

LoRaWAN网络 技象科技相关文章总结&#xff0c;学习笔记&#xff0c;原文链接如下&#xff0c;转载请标明该出处&#xff1a; LORA&#xff1a; https://www.techphant.cn/tag/l-2 LORAWAN&#xff1a;https://www.techphant.cn/tag/l-3 其他&#xff1a;如LAN https://www…

【EMC专题】为什么芯片规格书ESD性能中看不到MM(机器放电模型)

在文章:【ESD专题】1.ESD基础及IEC61000-4-2标准 中我们讲到对于ESD静电放电模型,可分为器件级和系统级。其中器件级ESD包括三种类型,HBM人体放电模型、MM机械放电模型和CDM元件充电模型。 ①HBM(Human Body Model:人体放电模型):假设由人体静电对芯片放电 例:没有做好…

【Linux】一些基本指令

文章目录 前言Linux下基本指令Linux下一些常见的通配符Linux下的引号引用whoamiwholswhichaliaswhereisfindtouchmkdirrmdir & rmmancpmvcatmorelessheadtailechodatecalgrepzip & unziptarrz & szuname几个重要的热键关机 前言 在学习操作系统的时候&#xff0c;我…

本地部署,Whisper: 开源语音识别模型

目录 简介 特点 应用 使用方法 总结 GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak SupervisionRobust Speech Recognition via Large-Scale Weak Supervision - openai/whisperhttps://github.com/openai/whisper 简介 Whisper 是一个由 O…

LabVIEW开发射频测试和测量系统

本文将介绍如何使用LabVIEW开发一个射频&#xff08;RF&#xff09;测试和测量系统。该系统的主要功能是对射频信号进行测量和控制&#xff0c;提供用户友好的界面来进行各种操作。 硬件组成 射频信号发生器&#xff1a;用于生成特定频率和功率的射频信号。 射频功率计&#…

windows安装Python

一.下载Python 网址&#xff1a;Python官网 1.选取稳定版本进行下载 2.选好之后&#xff0c;download点击 3.划到页面底部&#xff0c;选择下载 二.安装 1.安装&#xff0c;这里因为之前弄过&#xff0c;所以长得不一样 首次安装的介绍 自定义安装和立即安装的区别&#x…

奇异值分解(SVD)时间复杂度分析与优化

奇异值分解是一种矩阵分解的方法&#xff0c;大学线性代数里面也讲过奇异值分解的方法&#xff0c;因此这是一个为大家所熟知的算法。 1 SVD 时间复杂度分析 给定一个 m n m \times n mn 的矩阵 a \boldsymbol{a} a&#xff0c;按照下面公式做分解&#xff0c;其中 Σ \S…

Java+TestNG

TestNG是Java中的一个测试框架&#xff0c;主要用于编写和执行自动化测试用例。它是一个功能强大的测试工具&#xff0c;旨在提供一个比JUnit更强大、更灵活的测试框架。TestNG的设计目标是简化广泛的测试需求&#xff0c;从单元测试&#xff08;隔离测试一个类&#xff09;到集…

福派斯牛肉高脂猫粮,为何成猫舍首选?揭秘其神奇功效!

&#x1f43e; 说到猫咪的伙食&#xff0c;咱们当铲屎官的可是操碎了心&#xff01;想让自家毛孩子吃得健康又开心&#xff0c;选对猫粮真的太重要了。今天就来聊聊为啥福派斯牛肉高脂猫粮能成为众多猫舍的首选&#xff0c;以及它到底能帮咱们的小猫咪哪些忙吧&#xff01; 1️…

mybatis查询数据字段返回空值

1.描述 数据苦衷实际存储字段全不为空 查询后brand_name/company_name为空 2.原因分析 带下划线的字段&#xff0c;都会返回空值&#xff0c;应该是字段映射出了问题 3.解决方案 在配置文件中添加下划线自动映射为驼峰 <configuration><settings><sett…

鸿蒙开发——axios封装请求、拦截器

描述&#xff1a;接口用的是PHP&#xff0c;框架TP5 源码地址 链接&#xff1a;https://pan.quark.cn/s/a610610ca406 提取码&#xff1a;rbYX 请求登录 HttpUtil HttpApi 使用方法

LangChain结合LLM做RAG文档搜索

我们知道LLM&#xff08;大语言模型&#xff09;的底模是基于已经过期的公开数据训练出来的&#xff0c;对于新的知识或者私有化的数据LLM一般无法作答&#xff0c;此时LLM会出现“幻觉”。针对“幻觉”问题&#xff0c;一般的解决方案是采用RAG做检索增强。 但是我们不可能把…

十、Docker版Redis集群搭建

目录 一、3主3从Redis集群配置 1、新建6个docker容器实例 2、进入容器redis-node-1并为6台机器构建集群关系 3、以6381为切入点,查看集群状态 二、主从容错切换迁移案例 1、数据读写存储 2、假如6381宕机了,他的从库6386会不会切换 三、主从扩容案例 1、新建6387、63…

C语言 | Leetcode C语言题解之第292题Nim游戏

题目&#xff1a; 题解&#xff1a; bool canWinNim(int n) {return n % 4 ! 0; }

【Linux】文件系统|CHS寻址|LBA逻辑块|文件索引|inode|Date block|inodeBitmap|blockBitmap

前言 一个进程通过文件描述符标识一个打开的文件&#xff0c;进程拿着文件描述符可以在内核中找到目标文件进行读写等操作。这是打开的文件&#xff0c;而没有被打开的文件存储在磁盘中&#xff0c;是如何管理的&#xff1f;操作系统在偌大的磁盘中如何找到想要的文件并打开的…