SQL主要服务数据库
SQL服务的是MySQL、Oracle、SQL Sever、Hive等各大数据库,它们都需要SQL来管理、定义。题主理解的SQL只限于查询数据、清洗数据,这些当然Excel+VBA都能做到,任何编程语言都能做到,但事实是SQL是数据库的管理工具,查询只是它功能之一。
SQL功能 | 语句 |
---|---|
数据查询语言DQL | select |
数据操控语言DML | insert、update、delete |
数据定义语言DDL | create、drop、alter |
数据控制语言DCL | grant、revoke |
Excel+VBA是表格工具
我们可以把SQL理解成数据库世界的通用规则,Excel+VBA并不属于这个体系。也可以说SQL与Excel+VBA是不同的物种,没有对比的意义。
Excel是拖拉拽式的表格工具,将数据存储与数据处理集成到图形化界面里,极易入门使用。VBA是对Excel进行自动化处理的编程语言,也就是宏语言。这两者结合能更好的发挥Excel的功能。
但是Excel+VBA只是限于Excel生态使用,你可以做数据分析处理,但他们并不支持对数据库查询管理,无法替代SQL在数据库中的作用。
Excel+VBA偏个人使用,SQL偏企业生产
从业务场景看,Excel+VBA往往限制于小数据,多用于个人工作,一旦涉及到大数据、企业数仓、数据产品,Excel+VBA就无能为力了。
而SQL所在的数据库生态,是业界主要的数据生产、存储、应用依托工具,几乎是数字化的标配。
SQL和编程语言也有天壤之别
SQL和一般的编程语言也是完全不同的。编程语言是面向过程或面向对象的思维模式,用循环、判断、函数、类来解决问题,而SQL是面向表操作的思维模式,用连接、分组、筛选来处理问题。
比如同样拼接两个字段,SQL会用Join,而编程语言则会用if循环遍历。
有些人提到过Python可以替代SQL,因为其第三方库Pandas+Numpy+Sklearn几乎可以处理任何数据问题,能做很多SQL做不了的事,比如机器学习、特征工程、可视化、复杂的数据清洗等等
确实SQL做不了这些,因为它是基于表操作的标准语言,处理相同的问题能更快、更准确。
你可以用Pandas、SQL同时处理100万行数据,进行join操作,SQL的速度会碾压Pandas。
小结
SQL其实比Excel+VBA更容易学习,因为它的语法结构并不复杂,函数也相对有限。而且SQL是效率极高的,只要按照规范去编写代码,你能处理任何数据量的任务。
当然SQL和Excel+VBA都可以好好学习,它们是市场上使用率最高的数据工具,对个人能力很有帮助。