VB 数据质量诊断软件(分析数据的完整性,合理性,准确性)-139-(代码+程序说明)


转载地址http://www.3q2008.com/soft/search.asp?keyword=139

前言:

为何口出狂言,作任何VB和ASP的系统, 这个就是很好的一个证明 :) 又有些狂了...

 数据库操作谁都会,接触的多了也没什么难的,VB编程难在哪?算法上,这个是一个算法题的毕业设计

哈哈忙活了足足有一○小时,  大多数毕业设计都是 数据库编程... 你这个是个算法很累脑子哈哈,不过也摆平了.

样子有些像外挂, 跟句您的设定检查每个字段的 数据类型,或是EXCEL的每个列 下面有截图 请查看 条件设置写在程序里了,当然若写程序动态的 ,这个就真正成为了一个数据质量分析的工具了,没去研究他, 因为不知道写出来是否 会有人去用他, 这里只是一个毕业设计 下面有源码的截图

本系统不单单是个毕业设计,而且是一个产品,当然您若有兴趣将他继续新增功能, 可以跟我联系,我可以按您的要求去修改,或是专门给您定做,  您获得代码后也可以自己改, 没有什么版权 :) 
既然放上来了, 就当他是毕业设计出售了 :) 

联系方式在网页的最下方  

  

要求

数据质量诊断软件设计要求

目标:该软件主要是为了帮助企业对其拥有的数据库中的数据质量做一个诊断。可以很直观地告诉诊断出数据质量状态。

软件功能设定:

1.  数据读取: 读取不同的数据库中的数据:

数据格式:DELIMITED(包括TABLE,COMMA,SPACE。。。)

         EXCEL/ACCESS,DBF,MS SQL/SYBASE/ORACLE/IBM DB2

操作系统:Windows为主,如果能够兼容别的操作系统更好Unix,LINUX

2.  数据转换:读取的数据会存在数据的字段名称不统一的问题。如zip code,不同的公司有不同命名方法,可以是ZIP,zip_code,yzbm,yb,postal_code。需要把这些字段匹配到软件中的标准字段中

3.  数据字段:软件只关注比较重要的字段的诊断。这些关键的字段包括:

a)    直邮相关联的字段:

Zip:- 邮政编码(6位数字以文本存储)

State::省份(至少2个中文)

City: 城市(至少2个中文)

Address_1: 地址1(至少6个中文或10个单字节)

Address_2: 地址2(没有限制)

Address_3: 地址3 (没有限制)

b)    电子邮件相关联字段:

Email: 电子邮件(主要做格式的有效性检查,可以用正则表达式)

c)    手机相关联的字段:

Mobile: 手机号码或者小灵通

d)    电话相关联的字段:

Area_code: 电话区号 (3位数字以文本形式存在)

Phone:电话号码 (7位数字或8位数字以文本形式存在)

Phone_Extention: 分机号码 (没有限定)

e)    传真相关联的字段:

FAX:传真号码(7位数字或8位数字以文本形式存在)

FAX_Extention: 分机号码 (没有限定)

f)     其他字段:
反映其他重要意义的字段,比如:
性别,年龄,职业,收入,

行业,所有制,开业年限,员工人数,销售额,

4.  完整性诊断:软件主要要实现对以上字段的完整性检验,然后反馈回一个结果。

5.  完整性诊断规则:如何检验数据的完整性,规则如下

1. 如果字段的值为空,那结果是Missing,输出结果有个空和非空的比例

2. 如果字段的值为非空,那么检查完整性,结果可以是非空并且完整和非空不完整2个结果:

Zip:- 邮政编码(6位数字以文本形式存在)

State::省份(至少2个中文 – 可以有31个省的名称列表来判断,它们是:北京 上海 江苏 浙江 安徽 湖北

江西 黑龙江 吉林 辽宁 天津 内蒙古

河北 山东 山西 河南 广东 广西

海南 福建 湖南 新疆 西藏 青海

四川 重庆 云南 贵州 陕西 甘肃

宁夏)

City: 城市(至少2个中文 – 或者把中国的城市和省以及电话区号的对照表,这样可以做相关性检查)

Address_1: 地址1(至少6个中文或10个单字节)

Address_2: 地址2(没有限制)

Address_3: 地址3 (没有限制)

Email: 电子邮件(主要做格式的有效性检查,可以用正则表达式:

'/\w[-.\w]*\@[-\w]+(\.[-\w]+)*\.(com|edu|gov|int|mil|net|org|biz|info|name|museum|coop|aero|[a-z][a-z])/ '),如果正则表达式算法不容易实现,可以是:

必须有@, @的位置不能在前3个字节,前三个字节是字母或者下划线

Mobile: 手机号码或者小灵通(手机号码是11位,小灵通是7位或8位)

Area_code: 电话区号 (3位或4位数字以文本形式存在,但是有的公司的数据对电话的格式并没要求,并不一定是区号+电话号码+分机,这个在数据倒入需要考虑解决,或者在对这个字段的判定上需要有所改变,比如: 最少7位,最多17位(包括区号,电话和分机))

Phone:电话号码 (7位数字或8位数字以文本形式存在)

Phone_Extention: 分机号码 (没有限定)

FAX:传真号码(7位数字或8位数字以文本形式存在)

FAX_Extention: 分机号码 (没有限定)

******************************

 报告生成日期:2006-5-28 22:12:34


数据表名称为: Sheet$
数据表总记录数为:6062
统计信息如下************************

******************************
字段名: [ZIPCODE]
邮件检查
合法邮件记录数为:0
占总数:0%

电话小灵通传真号检查
合法记录数为:6057
占总数:99.92%

区号检查
合法记录数为:0
占总数:0%

性别检查
合法记录数为:591
占总数:9.75%

空字符检查
合法记录数为:591
占总数:9.75%

字符长度检查
合法记录数为:0
占总数:0%

******************************

**************************..


转载地址http://www.3q2008.com/soft/search.asp?keyword=139

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/742710.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决Git:Author identity unknown Please tell me who you are.

报错信息: 意思: 作者身份未知 ***请告诉我你是谁。 解决办法: git config --global user.name "你的名字"git config --global user.email "你的邮箱"

kangle一键安装脚本

Kangle一键脚本,是一款可以一键安装KangleEasypanelMySQLPHP集合的Linux脚本。 脚本本身集成:PHP5.38.2、MYSQL5.68.0,支持极速安装和编译安装2种模式,支持CDN专属安装模式。同时也对Easypanel面板进行了大量优化。 脚本特点 ◎…

python实现卡普均值最小回路算法

如果给定一个含有环的有向图,要在这个图中找出所有的环并计算这些环的路径长度,然后除以环的边数,所得到的结果也就是环的平均值,这里也就是如何计算这个环的最小均值问题。 首先可以确定的是,如果图中均值最小的环的…

会禁止直播带货吗?

关注卢松松,会经常给你分享一些我的经验和观点。 种种迹象表明:直播带货已经到了被抑制的阶段,提高线上购物成本,促进消费回归线下实体,好像是主流声音了。 (1)“稳定和扩大传统消费”早就写在了中央经济工作会议和政…

《汇编语言》- 读书笔记 - 第17章-外传之 DOSBox-X 调用 int 13 读写磁盘

《汇编语言》- 读书笔记 - 第17章-外传之 DOSBox-X 调用 int 13 读写磁盘 总结dosbox-x.conf 不完美读取成功写入成功参考资料 总结 DOSBox 中访问 int 13h 始终没反应。网上查了下有人说是没支持,建议使用 DOSBox-X 经过无数遍尝试后: 环境状态Win11…

网络计算机

TCP/IP四层模型 应用层:位于传输层之上,主要提供两个设备上的应用程序之间信息交换的服务,它定义了信息交换的格式,消息会交给下一层传输层来传递。我们把应用层交互的数据单元称为报文。应用层工作在操作系统的用户态&#xff0…

腾讯云轻量服务器地域选择方法整理,选择不能修改!

腾讯云轻量应用服务器地域如何选择?地域就近选择,北方选北京地域、南方选广州地域,华东地区选上海地域。广州上海北京地域有什么区别?哪个好?区别就是城市地理位置不同,其他的差不多,不区分好坏…

C++初阶:内存管理

目录 1. C/C中各种资源的内存分布1.1 C/C程序内存区域划分1.2 各资源的内存分布情况(练习) 2. C中的动态内存管理方式2.1 new/delete开辟内置类型空间2.2 new/delete开辟销毁自定义类型空间 3. operator new 与 operator delete函数4. new与delete的实现…

表结构 / 字段操作

一.增 alter table emp add wickname varchar(20); 二.改 1.仅仅改变数据类型(字段类型) alter table emp modify wickname varchar(30); 2.字段名 和 字段类型 都改变 alter table emp change wickname username varchar(20); 三.删 alter table emp …

ZigBee技术与实训教程(无线传感网技术第五天持续更新)

ZigBee具有广阔的应用前景。 家庭和楼宇网络。工业控制。公共场所。农业控制。医疗。商业。 1.ZigBee的协议框架 Zigbee栈是在IEEE 802.15.4标准基础上建立的,定义了MAC层和PHY(数据链路层)。ZigBee设备还包括IEEE 802.15.4(该标准定义了r…

多线程锁.

公平锁与非公平锁 公平锁是指多个线程按照申请锁的顺序来获取锁,这里类似排队买票,先来的人先买后来的人在队尾排着,这是公平的Lock lock new Reentrantlock(true);/true表示公平锁,先来先得非公平锁指多个线程获取锁的顺序并不是按照申请锁的顺序,有可能后申请的线程比先申请…

类和对象 (中)

文章目录 类的六个默认成员函数构造函数析构函数特性使用 总结构造函数和析构函数拷贝构造函数特性拷贝构造总结 赋值运算符的重载运算符重载赋值运算符重载总结拷贝构造函数和赋值运算符重载 关于operator<<重载日期类实现const 修饰的成员函数取地址重载以及const取地址…

css实现高度是宽度一半的效果

1、方法一&#xff1a;使用变量:root、var()、clac()实现&#xff1a; 1.1 效果如下&#xff1a; 2.2 代码如下&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title>&l…

伸手党必备之Python正则表达式常用函数

今天介绍一下Python中常用的正则表达式处理函数。Python的正则表达式主要有两种方法完成模式匹配&#xff1a;『搜索』和『匹配』 re.match re.match 尝试从字符串的开始全部或者部分匹配某个模式&#xff0c;如&#xff1a;下面的例子匹配第一个单词。 import re text &…

springboot269反欺诈平台的建设

反欺诈平台设计与实现 摘 要 传统办法管理信息首先需要花费的时间比较多&#xff0c;其次数据出错率比较高&#xff0c;而且对错误的数据进行更改也比较困难&#xff0c;最后&#xff0c;检索数据费事费力。因此&#xff0c;在计算机上安装反欺诈平台软件来发挥其高效地信息处…

Vue-Vben-Admin:中大型项目后台解决方案及如何实现页面反向传值

Vue-Vben-Admin&#xff1a;中大型项目后台解决方案及如何实现页面反向传值 摘要&#xff1a; Vue-Vben-Admin是一个基于Vue3.0、Vite、Ant-Design-Vue和TypeScript的开源项目&#xff0c;旨在为开发中大型项目提供一站式的解决方案。它涵盖了组件封装、实用工具、钩子函数、动…

学习c语言:单链表的应用

一、单链表经典算法 1.1 单链表相关经典算法OJ题1&#xff1a;移除链表元素 . - 力扣&#xff08;LeetCode&#xff09;. - 备战技术面试&#xff1f;力扣提供海量技术面试资源&#xff0c;帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer。https://leetcode.…

WPF监控平台(科技大屏)[一]

跟着B站的视频敲了一个略微复杂的WPF界面,链接如下.在这里我详细的写一份博客进行设计总结. 系统介绍和配置及主窗口设计_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1Wy421Y7QD?p1&vd_source4796b18a2e4c1ec8a310391a5644b6da 成果展示 实现过程 总体来说,我的…

OpenHarmony开源项目—工程管理

DevEco Studio的基本使用&#xff0c;请参考DevEco Studio使用指南。本章主要介绍如何使用DevEco Studio进行多设备应用开发。 说明&#xff1a; 本章的内容基于DevEco Studio 3.1.1 Release版本进行介绍&#xff0c;如您使用DevEco Studio其它版本&#xff0c;可能存在文档与产…

微信小程序(五十八)分步表单多页面传值

注释很详细&#xff0c;直接上代码 新增内容&#xff1a; 1.分步表单传值 2.伪数据生成 源码&#xff1a; app.json {"pages": ["pages/index/index","pages/building/building","pages/room/room","pages/logs/logs"],&qu…