一、数据应用要区别对待
1.2 数据应用比数据收集重要
大数据热正在席卷全国,许多地方政府都成立大数据局,统管政府的数据资源并将数据收集摆在第一位,数据应用研究却迟迟跟不上,投资不断增长应用效益却无相应增长,大数据收集已经得不偿失。
应用效益不显著的原因是能用大数据解决的重要问题太少,先有问题再找技术易有效益,先有技术再找问题则难有效益,大数据能解决的问题价值偏低的主要原因是政府工作还处于常规数据阶段,重点工作“只跑一次”只涉及常规数据,过于强调大数据导致数据业务脱实就虚,反而看不清当前最该做的事情。
应用价值并不取决使用什么先进技术,而是取决项目本身对城市发展的贡献,为认清什么是最该做的事需要清楚:不同的IT应用方向产生的价值有何不同?高价值的应用项目聚集在什么地方?应当怎样抓住高价值的应用机会?
1.2 电脑与人脑的数据使用概念不同
数据应用归纳到最后只有两类,即电脑应用与人脑应用。两种应用的不同是因为电脑与人脑是两类完全不同的事物。
电脑是人设计出来的计算工具,电脑使用数据是在执行人设计的程序,电脑没有信息概念,电脑将数据视为待处理的符号按程序进行处理,电脑应用的特点是不折不扣地执行程序。
人脑是一个生物系统,人脑先要理解数据,对数据赋予含义,理解了的数据成为信息,信息被组织成知识,人脑利用知识进行决策。将数据抽象成信息,与头脑中已有的知识体系融合实现大脑知识的重组,由数据信息到人脑的知识概念的形成是大脑思维高层次的涌现,并非逻辑推理所能解释。
1.3 两种应用创造价值的理念不同,效益也不同
人们对数据应用有两大期望,一是提高决策质量,这是数据为领导服务的业务,决策是人脑的活动,人脑思维的不确定性使信息技术与信息服务在提高决策水平上遇到很多困难,在提高决策质量方面效果并不显著。
二是提高操作的效率,是电脑使用数据,通过提供良好的数据整合以及相应的软件,形成流畅的处理流程,提高服务效率让公众满意。这种业务是确定性的,是电脑应用有优势的领域,尤其是对政府重点公共服务项目操作效率意义更大,主业务的高价值拉高其效率改进的价值。
对两类应用模式的研究有助于发现更好的效益的机会。
二、人脑的信息价值观
2.1 人脑需要信息,数据是信息的载体
数据是信息的载体,信息是数据的内涵,人脑获取信息并非仅靠视觉和听觉就能完成,从数据获取信息更重要的是头脑的理解,理解是人脑的思维过程,要耗费时间与精力,从数据集抽取所包含的信息更困难,数据挖掘是帮助理解抽取大数据集信息的重要手段。被人脑理解的数据才是信息,信息被记录在头脑中成为构建知识的基本素材。
2.2 信息要形成知识,人脑靠知识决策
信息被组织成为知识才有用场,诸多信息在头脑中被组织成概念,概念是构成知识的基本模块,是信息相互连接深入理解而涌现的结果,是知识的重要支柱。人脑需要对外部环境进行判断与决策,但领导层不会仅靠数据来决策,他们要靠头脑中的知识经验支持决策,决策的水平不仅与数据有关更与决策者的经验有关。
2.3 应用思维搭建知识架构,理解是知识的重组
头脑中的知识结构很复杂,知识是多维的,包含数值更包含相互的联接,联接形成知识的架构。知识需要不断学习而成长,学习是对新内容的理解与吸纳,理解是新内容与原有知识的融合重组,丰富并修订原有知识的架构。新知识与已有知识体系形成联接才有自己的位置才能发挥作用。
人脑知识的灵活性取决存储与联接的结构,类似数据库与文件系统的差别,数据库存储数据还存储数据之间的关系,数据间的链接构建数据库的多维结构。头脑中的知识也会形成链接,神经元的频繁链接会形成热线,强度不等的链接在头脑中构建了复杂的知识库,应用与理解促进知识的重组,人脑不是靠信息决策而是靠组织完善的知识系统决策。
2.4 领导已进入数据疲劳时代
政府信息系统总是希望能为领导提供优良的信息服务,让领导喜欢用,这条路走起来是越来越困难了,领导关注的是信息而不是大规模的数据,外部数据的丰富降低了政府内部数据系统的价值。领导不缺数据只缺时间与精力,阅读疲劳的领导更需要节约时间的系统,靠增加数据服务提高决策质量的模式正步入死胡同。
2.5 数据的模糊使用与信息渠道的可替代性
由于人脑关注的是信息,同样的信息可以取自不同资料与不同的渠道,例如2001年美国的911 事件可以通过电视、广播、手机、报刊、汇报获得,本质上并无多大差别,因此人脑对数据载体并无严格的要求,这与政府公共服务业务对数据的精确使用大不一样,业务数据的使用具有不可替代性。
人脑对数据载体的模糊使用已将数据源的竞争带入决策者的头脑之中。政府信息服务系统的开发者往往以为自己开发的系统是领导唯一使用的,然而领导人有自己的信息渠道,互联网搜索、朋友电话、工作会议都是可替代的信息源,竞争使政府信息服务系统的价值下降了,这是政府信息服务系统开发难以成功的重要原因。
三、电脑的数据逻辑
3.1 电脑只认数据,没有信息概念
电脑没有信息概念只认数据,把数据当作符号处理,一切都按照预先存入的程序执行,没有程序之外的任何分析能力。
电脑靠程序处理数据,重复人类智慧,其优势是:
(1) 确定性,不折不扣执行程序规定的操作;
(2) 高效率,能够以极快速度完成人所规定的任务;
(3) 可复制,芯片与电脑的普及能够大量复用人类智慧。
电脑数据应用技术只是适应确定性问题的应用技术。
3.2 电脑对数据是精确处理,数据不可替代
电脑工作系统是精确处理的系统,使用数据是指定的,不可替代,政府公共服务的业务数据是以前服务产生的记录,政府服务的连续性必须使用当事人的数据,不能用其他人的数据替代,保证政府公共服务的可靠性,政府的具体业务数据是连续的工作记录,记录数据是继续服务处理的依据,电脑对业务数据的使用没有选择性,唯此才能确保政府服务的严谨性。
3.3 电脑只能处理确定性问题
电脑使用数据的方式是自动化数据处理,其处理方法由软件决定,软件是按形式逻辑编写的处理问题的方法,只能处理确定性任务,对不可预测的问题无法给出明确的处理办法,解决问题的办法只能形成于问题产生之后,软件是成功处理经验的逻辑升华,无法先于问题而出现,不确定性可由人脑处理,人脑处于IT之上的思维层次,能够应对不确定性。
3.4 人工智能只能处理确定性任务
自动化数据处理系统下一步会向人工智能的方向发展,人工智能系统借助云平台、物联网、大数据等先进技术而形成更强大的自动处理能力,但是并没有改变只能处理确定性问题的本质,虽然人工智能系统能够处理一些以前无法处理的多样性问题,但是这些多样性问题是设计者选定的,其应对办法是设计好的,真正的不确定性问题是不可预见的,需要人去摸索解决办法。一切智能化系统包括人工智能系统都是处理确定性问题的工具,任何高技术都无法解决尚未发生的不确定性问题。
3.5 电脑数据业务比为人脑服务容易产生效益
计算机的应用是围绕着政府企业个人的基本服务需求进行的,计算机应用的效益价值由其所依附的业务价值决定,与有重大价值业务捆绑的应用项目更容易形成效益。电脑数据处理服务项目通常都是与政府业务捆绑,政府业务的重要性决定了其附属电脑数据处理的价值,效益价值是由甲方决定的,乙方只须按甲方要求去做,效益就有保障。
以提高决策质量为中心的项目效益有更多的不确定性,有否效益要看用户感觉,决策起作用的是人脑而非电脑,领导使用的信息渠道可自由选择,信息源竞争使政府信息系统价值下降,效益不如以提高操作效率为中心的项目容易控制。
四、城市大脑定位思考
4.1 不要对城市大脑期望过高
城市大脑的是一项长期的知识工程,除了持续投入大量智力不存在捷径,高技术可以购买却购买不来效益,效益是对技术精心组织的结果,组织是产生效益的灵魂。城市的人才、资金、经验有限,城市能够承担的建设复杂性亦有限。城市大脑的高技术高智慧方案建立在管理知识与经验积累的基础知识上,IT技术是支持其发挥作用的工具,城市管理的精细化体现了城市大脑的智慧。
城市大脑有自己的生命,其生存离不开现实的生态环境,扎根在城市切实的需求上才能成长,盲目超前不可行,从常规业务改进开始才现实,要防止高期望的诱惑使城市大脑变成脱离实际的空中楼阁。
4.2 计划赶不上变化,城市大脑数据永远不足
缺乏经验的人觉得建设城市完整的感知网就能收集城市全部数据,城市大脑就能应对城市出现的所有问题,实现城市管理的智能化管理。在充满不确定性的世界中这种想法完全不实际。城市信息是无限的,不存在收集齐全的可能性,信息收集到什么程度是一个经济问题,收集数据的成本不能超过要解决问题的价值,在未来问题没搞清楚之前,无法确定全面感知的含义。
未来城市出现的问题是不可预测的,为应对各种不确定性问题而事先准备好全部数据其成本是无法接受的,临时收集数据永远赶不上应用的需要,城市大脑的数据永远是不足的。城市大脑应当做目标明确的小脑型业务,节约人脑的时间,让超出IT逻辑能力的人脑来应对不确定性问题的决策。
4.3 城市问题有自己的成熟期,不能拔苗助长
城市发展的不同时期会碰到不同问题,解决问题时机过早过迟都不合适,影响解决问题时机的因素不只是资金与人才,过早启动会增加解决问题的机会成本耽误更重要的工作。城市各项工作都有优先级,城市大脑不能一个劲地强调重要,合理的顺序是降低机会成本的基本措施。
城市问题有自己的成熟期,早期问题规模太小,人们对问题缺乏研究,关键技术也不到位,此时投入人力精力去做也难有成效(如同在互联网之前想实现信息共享)。城市问题的解决需要有生态环境,有知识与技术的基础,条件成熟才会被重视和解决,无视眼前亟待解决的常规性问题却热心条件尚未成熟的高水平项目必然事倍功半。
五、对大数据中心生存的建议
大数据在支持政府重大决策上并无优势,大数据中心应当定位于城市信息交流服务平台,成为公务员企业经营者与城市居民了解城市状况、监督政府工作及交流学习的好帮手,恰当的定位有利于大数据中心的长久生存与发展。
5.1 大数据中心做好小数据才能立足
大数据热是暂时的,大数据中心却需要长久生存,唯有靠效益才能实现长久生存,大数据技术不等于效益,效益来自政府公共服务的需要,只有需求导向才能发现目标机会,与目标适应的方法才有意义,目前政府工作尚处于小数据阶段,硬要从大数据上找方法显然偏离了方向。
政府工作改进的焦点是提高公共服务的效率,是常规数据处理问题,其效益目标都是清晰的,先把有效益的事做好再去研究大数据不迟,先做好“只跑一次”的数据整合,提高公众对政府工作的获得感才是目前数据中心最重要的工作。
5.2 大问题靠知识决策,小问题用数据决策
大数据对大决策的帮助不大,原因之一不是所有信息都能数据化,越是重要信息越难以数字化,能够收集的数据本身就带有突出自身的片面性,直接靠数据作重大决策很危险;原因之二是人们对同样数据的理解并不相同,这取决人们已有的知识文化与个性,在决策过程中数据不会单独发挥作用,数据会被融入人脑的知识体系之中,间接对知识产生影响,大问题用知识决策解决会更稳定。
对一些具体业务操作领域,例如对用户的商品推销,决策面向微观服务,靠大数据决策是有利的。目前企业大数据资源以自用为主,能够提供给其它企业使用的大数据资源甚少,无法建立大数据交易系统。
5.3 聚集可视化数据,创造开放的信息服务平台
推动数据的可视化是大数据中心的一项重要工作,汇集企业可视化数据产品是一个明智的方法,政府要求企业把数据和盘托出对企业不安全,采用可视化数据产品的形式收集可有效回避数据安全问题,企业会愿意通过提供可视化数据服务提高社会影响力,政府数据采购也会容易得多,大数据可视化产品开发有望发展为重要产业。
汇聚可视化数据产品另一个好处是提高信息交流的效率,人们欣赏可视化数据的直观性,希望从超负荷阅读压力下解放出来,可视化的数据交流平台正好迎合这一愿望,它将成为政府数据开放、企业信息交流、公众监督政府的重要渠道,成为政府与企业展示其大数据服务能力的窗口,成为大数据中心为智慧城市贡献的一大亮点。
胡小明 2019/6/13
胡小明 原国家信息中心副主任,原中国信息协会副会长,原深圳信息行业协会会长,原中经网数据有限公司副董事长,高级工程师
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”