python实现数字规整(转中文)

1.思路根据正则匹配数字类型比如手机号、年月日等进行相对的数字规整

话不多说直接上代码,有新的类型可以按照当前方案进行新增


import redef match_year_digit(match):m = str(match.group())relation = {'1': '一', '2': '二', '3': '三', '4': '四', '5': '五', '6': '六', '7': '七', '8': '八', '9': '九', '0': '零','年': '年'}return ''.join([relation[i] for i in m])def time_thin_filter(sequence):time_thin_reg = re.compile(r'(?P<hour_part>\d{1,2})[:|:](?P<minute_part>\d{1,2})([:|:])?(?P<second_part>(\d{1,2}))?')result = time_thin_reg.search(sequence)unit_list = ['时', '分', '']reg_list = []try:hour_part = result.group('hour_part')reg_list.append(match_common_number(hour_part))reg_list.append(unit_list[0])minute_part = result.group('minute_part')reg_list.append(match_common_number(minute_part))reg_list.append(unit_list[1])second_part = result.group('second_part')reg_list.append(match_common_number(second_part))reg_list.append(unit_list[2])except IndexError as e:print('')finally:return ''.join(reg_list)return ''def date_thin_filter(match):sequence = str(match.group())time_thin_reg = re.compile(r'(?P<year_part>[1|2]\d{3})[-|\/](?P<month_part>(1[0-2]|[1-9]))(-|\/)?(?P<day_part>(3[0-1]|2[0-9]|1[0-9]|0?[1-9]))?')result = time_thin_reg.search(sequence)unit_list = ['年', '月', '日']reg_list = []try:year_part = result.group('year_part')if re.findall('[21][0-9]{3}', year_part):year_part = re.sub(u'[21][0-9]{3}', match_year_digit, year_part)else:year_part = match_common_number(year_part)reg_list.append(year_part)reg_list.append(unit_list[0])month_part = result.group('month_part')reg_list.append(match_common_number(month_part))reg_list.append(unit_list[1])day_part = result.group('day_part')reg_list.append(match_common_number(day_part))reg_list.append(unit_list[2])except IndexError as e:print('')finally:print(sequence,''.join(reg_list))return ''.join(reg_list)def percent_than(match):m = str(match.group())percent_filter = re.compile(r'(?P<percent_part>\d[\.\d]+)(?P<percent_mark>%)')result = percent_filter.search(m)try:percent_part = result.group('percent_part')if percent_part:x = match_common_number(percent_part)s = re.sub(percent_filter, '百分之' + x, m)return sexcept Exception as e:pass
def iphone_replace(match):m = str(match.group())relation = {'1': '幺', '2': '二', '3': '三', '4': '四', '5': '五', '6': '六', '7': '七', '8': '八', '9': '九', '0': '零'}return ''.join([relation[i] for i in m])
def first_number_filter(sequence="", count=4):# 数字是“年份”的情况,返回转化成中文的结果# (1)过滤手机号\工号(有新增版式的可以按照当前方式新增)iphone_rule=r"(?<!\d)1\d{10,15}|10086|12345|(?<!\d)0\d+"if re.findall(iphone_rule, sequence):sequence = re.sub(iphone_rule, iphone_replace, sequence, count=count)# (1)过滤年份,上个世纪的,本世纪的可以不用if re.findall('[21][0-9]{3}年', sequence):sequence = re.sub(u'[21][0-9]{3}年', match_year_digit, sequence, count=count)# (2)过滤百分比if re.findall('\d[\.\d]+%', sequence):print(re.findall('\d[\.\d]+%', sequence))sequence = re.sub(u'\d[\.\d]+%', percent_than, sequence, count=count)# (3)过滤时间# time_filter:能匹配'12:09:00~12:31:30' '12:09:00'time_filter = re.compile(r'(?P<start_time_part>\d{1,2}([:|:]\d{1,2}){1,2})(?P<time_mark>(~|-)?)(?P<end_time_part>(\d{1,2}([:|:]\d{1,2}){1,2})?)')result = time_filter.search(sequence)time_substitude_part = ''try:start_time_part = result.group('start_time_part')time_substitude_part = time_substitude_part + time_thin_filter(start_time_part)time_mark_part = result.group('time_mark')time_substitude_part += '到'end_time_part = result.group('end_time_part')time_substitude_part += time_thin_filter(end_time_part)except Exception as e:print('')if time_substitude_part:sequence = re.sub(time_filter, time_substitude_part, sequence)# (4)过滤日期if re.findall('[1|2]\d{3}[-|\/](?:1[0-2]|[1-9])[-|\/](?:3[0-1]|2[0-9]|1[0-9]|0?[1-9])', sequence):print('aaa',re.findall('[1|2]\d{3}[-|\/](?:1[0-2]|[1-9])[-|\/](?:3[0-1]|2[0-9]|1[0-9]|0?[1-9])', sequence))sequence = re.sub(u'[1|2]\d{3}[-|\/](?:1[0-2]|[1-9])[-|\/](?:3[0-1]|2[0-9]|1[0-9]|0?[1-9])', date_thin_filter, sequence, count=count)print("ssss",sequence)# (last)过滤其他数字print(sequence,"s")return re.sub(u'[\d\.]+', match_common_number, sequence)recursive_depth = 0
def match_common_number(match):global recursive_depthrelation = {'1': '一', '2': '二', '3': '三', '4': '四', '5': '五', '6': '六', '7': '七', '8': '八', '9': '九', '0': '零','年': '年'}if type(match) == type("") and "." in match:match, match1 = match.split(".")mh1 = "".join([relation[i] for i in match1])# recursive_depth = 0number = match if (type(match) is type('')) else match.group()if "." in number:number, number1 = number.split(".")mh1 = "".join([relation[i] for i in number1])# 数字非年份的情况,返回转化成中文的结果str_number = str(number)if len(str_number) > 4:str_number = str_number[-4:]bits = "零 一 二 三 四 五 六 七 八 九".split(" ")units = " 十 百 千".split(" ")large_unit = ' 万 亿 兆'.split(" ")  # 可扩展,以万为单位number_len = len(str_number)result = ""for i in range(number_len):result += bits[int(str_number[i])]if str_number[i] != "0":result += units[number_len - i - 1]# 去除连续的零while "零零" in result:result = result.replace("零零", "零")# 去除尾部的零if result[-1] == "零":result = result[:-1]# 调整10~20之间的数if result[:2] == "一十":result = result[1:]try:result= result + "点" + mh1except Exception as e:pass# 字符串连接上大单位result += large_unit[recursive_depth]# print(result)# 判断是否递归if len(str(number)) > 4:recursive_depth += 1return first_number_filter(str(number)[:-4], recursive_depth) + resultelse:recursive_depth=0return resultif __name__ == '__main__':# print(first_number_filter("1989-12-12嘿1998-12-12"))# print(first_number_filter("1989年2024年55.5%h55.0%"))# print(first_number_filter("55.0%he2.0"))# print(first_number_filter("2024年02月01日"))# print(first_number_filter("1999-12-30he2024年02月01日,1922-12-30"))print(first_number_filter("1999-12-30,1922-12-8"))print(first_number_filter("10086和15221331963he1012"))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/711393.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WPF真入门教程31--WPF版房屋租售系统

1、教程回顾 到现在为止&#xff0c;“蒸”入门系列教程已完成了30刺由浅入深地讲解&#xff0c;当然不可能讲到了WPF的所有技能点&#xff0c;但读者看到了wpf的内部各种功能及之间的联系&#xff0c;在此基础上&#xff0c;再提供一个完整有效的综合项目&#xff0c;本项目采…

tcp的三次握手和四次挥手?

一&#xff1a;引出 客户端与服务器之间数据的发送和返回的过程当中需要创建一个叫TCP connection的东西&#xff1b;由于TCP不存在连接的概念&#xff0c;只存在请求和响应&#xff0c;请求和响应都是数据包&#xff0c;它们之间都是经过由TCP创建的一个从客户端发起&#xff…

身份验证错误。要求的函数不受支持。远程计算机:[IP地址]。这可能是由于CredSSP加密数据库修正

出现“身份验证错误。要求的函数不受支持。远程计算机&#xff1a;[IP地址]。这可能是由于CredSSP加密数据库修正”的问题&#xff0c;通常是因为Windows更新后&#xff0c;远程桌面连接&#xff08;RDP&#xff09;的安全性增强&#xff0c;特别是与CredSSP&#xff08;Creden…

[RoarCTF 2019]Easy Calc

这题考查的是: 字符串解析特性目录读取文件内容读取 字符串解析特性详解&#xff1a;PHP字符串解析特性 &#xff08;$GET/$POST参数绕过&#xff09;&#xff08;含例题 buuctf easycalc&#xff09;_参数解析 绕过-CSDN博客 ascii码查询表&#xff1a;ASCII 表 | 菜鸟工具 …

AI智能雷达名片小程序平台版源码系统 带完整的安装代码包以及安装部署教程

在当今数字化快速发展的时代&#xff0c;人工智能&#xff08;AI&#xff09;已渗透到各个领域&#xff0c;尤其是在商务沟通领域&#xff0c;传统的名片已经不能满足现代商业的需求。小编给大家分享一款名为“AI智能雷达名片小程序平台版”的源码系统&#xff0c;该系统不仅提…

【Linux】将程序的输出显示到屏幕,同时写入到log文件

1. 将程序的输出显示到屏幕&#xff0c;同时写入到log文件 nohup python -u main.py 2>&1 | tee -a log.txt &nohup 放在命令的开头&#xff0c;表示不挂起&#xff08;no hang up&#xff09;&#xff0c;也即&#xff0c;关闭终端或者退出某个账号&#xff0c;进…

知乎引流秘籍:玩转知乎,掘金百万流量!

知乎&#xff0c;拥有3亿注册用户、日新增用户8万的超级内容平台&#xff0c;已然成为流量洼地。如何玩转知乎&#xff0c;掘金百万流量&#xff1f;这份1500字的实操指南&#xff0c;为你揭秘&#xff01; 一、知乎的优势&#xff1a;流量大、长尾效应强 1. 流量大&#xff…

QA核心竞争力

核心竞争力的三个阶段 我们知道&#xff0c;不同的工作和任务所需要的核心能力不同&#xff0c;因而核心竞争力也就不相同。QA 的入门门槛比较低&#xff0c;这也是 QA 这个群体产生恐慌和焦虑的主要原因。这个群体所涉及的技术面和技能栈非常广&#xff0c;所以整个职业生涯的…

46-全排列(回溯算法)

题目 给定一个不含重复数字的数组 nums &#xff0c;返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 示例 1&#xff1a; 输入&#xff1a;nums [1,2,3] 输出&#xff1a;[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[3,1,2],[3,2,1]] 示例 2&#xff1a; 输入&#xff1a;nu…

商业银行移动支付发展探析

一、支付交换标准的迭代      银行卡支付交换标准基于ISO 8583-1987《产生报文的金融交易卡交换报文规范》为发展基础&#xff0c; 经过30年的产品及应用变革&#xff0c; 支撑交换标准整体框架的数据格式日益显现其弊端。新型与传统业务交织&#xff0c; 衍生出多个技术标…

提升智能客服机器人的语义理解能力:理解用户的语义和意图

智能客服机器人的发展已经成为现代服务业的一大亮点。它们不仅能够提供724小时不间断的服务&#xff0c;而且能够处理大量的用户请求&#xff0c;大大提高了服务效率。然而&#xff0c;尽管智能客服机器人的技术已经取得了显著的进步&#xff0c;但其语义理解能力仍有待提高。为…

List去除重复数据的五种方式

1、使用 LinkedHashSet 删除 arraylist 中的重复数据 LinkedHashSet 是在一个 ArrayList 删除重复数据的最佳方法。LinkedHashSet 在内部完成两件事&#xff1a; 删除重复数据 保持添加到其中的数据的顺序 Java 示例使用 LinkedHashSet 删除 arraylist 中的重复项。在给定的示例…

【Linux杂货铺】调试工具gdb的使用

目录 &#x1f308;前言&#x1f308; &#x1f4c1;背景介绍 &#x1f4c1; 使用 list [行号] / [函数名] run/r break/b [行号] / [函数名] info break disable break enable break delete break [断点编号] next/n step/s continue/c finish print/p [变量…

06 vim工具

目录 概念模式基本操作配置 1. 概念 vim是一个历史悠久的,多模式的编辑器&#xff0c;是vi的升级版。和ide不同&#xff0c;编辑器仅能编写文本&#xff0c;不能运行代码&#xff0c;现阶段的代码编译的各个过程会分开按步骤执行 2. 模式 vim有很多种模式&#xff0c;想要编…

方格分割644--2017蓝桥杯

1.用dfs解决&#xff0c;首先这题的方格图形就很像一个走迷宫的类型&#xff0c;迷宫想到dfs&#xff0c;最中心点视为起点&#xff0c;起点有两个小人在这个方格里面对称行动&#xff0c;直到走出迷宫&#xff08;一个人走出来了另一个人就也走出来了&#xff0c;而走过的点会…

Vmware Esxi 部署Mac OS虚拟机

Vmware Esxi在创建虚拟机的时候是有Mac OS选项的&#xff0c;但是实际创建时&#xff0c;选择ISO开机后一直反复引导&#xff0c;是有问题的&#xff0c;原因是需要先解锁&#xff0c;需要在ESXI主机上修改配置并重启。 首先找到管理-服务-TSM-ssh&#xff0c;点击启动&#x…

华纳云:linux中tftp命令使用无效怎么解决

如果在Linux中使用TFTP命令时遇到问题&#xff0c;可能是由于以下几种原因导致的&#xff0c;你可以尝试以下方法解决&#xff1a; 检查TFTP服务器是否正确配置&#xff1a;首先确保你正在连接的TFTP服务器已经正确配置并正在运行。你可以使用网络工具(如ping命令)检查与TFTP服…

★【二叉搜索树(中序遍历特性)】【 ★递归+双指针】Leetcode 98. 验证二叉搜索树

★【二叉搜索树&#xff08;中序遍历特性&#xff09;】【 ★递归双指针】Leetcode 98. 验证二叉搜索树 二叉搜索树 98. 验证二叉搜索树解法1 笨 中序递归遍历为一个数组 然后判断数组是不是升序排列就可以★解法2 不使用数组 递归法 ---------------&#x1f388;&#x1f38…

【力扣】无重复字符的最长子串,滑动窗口 + 哈希集合

无重复字符的最长子串原题地址 方法一&#xff1a;滑动窗口&#xff08;双指针&#xff09; 哈希集合 考虑找出字符串s的所有的无重复字符的子串&#xff0c;求出这些子串长度的最大值即可。 使用下标 [left,right] 来维护子串。我们只需要找到每一个 left 对应的所有 righ…

php PhpSpreadsheet 读取日期变数字问题解决

问题描述&#xff1a; 使用PhpSpreadsheet 读取表格数据&#xff0c;日期格式读取后变成数字&#xff0c;如下图&#xff1a; 解决方案&#xff1a; $cell $sheet->getCell(H . $row)->getValue(); $toTimestamp \PhpOffice\PhpSpreadsheet\Shared\Date::excelToTimes…