java动态json入库_从JSon File动态生成模式

一些兴趣点:

1)您不需要数据帧来加载您的json架构 . 模式在驱动程序上加载和执行,因为不需要分发那些不必要的开销

2)我构造了一个JColumn对象的List,并将它传递给StructType以动态构造模式

3)inferSchema应该是false,因为我们明确定义了schema

4)我假设您的数据库表使用“null”表示空值

5)调整映射修改typeMapping

import org.json4s._

import org.json4s.native.JsonMethods

case class JColumn(trim: Boolean, name: String, nullable: Boolean, id: Option[String], position: BigInt, table: String, _type: String, primaryKey: Boolean)

val path = """your_path\schema.json"""

val input = scala.io.Source.fromFile(path)

val json = JsonMethods.parse(input.reader())

val typeMapping = Map(

"double" -> DoubleType,

"integer" -> IntegerType,

"string" -> StringType,

"date" -> DateType,

"bool" -> BooleanType)

var rddSchema = ListBuffer[StructField]()

implicit val formats = DefaultFormats

val schema = json.extract[Array[JColumn]]

//schema.foreach(c => println(s"name:${c.name} type:${c._type} isnullable:${c.nullable}"))

schema.foreach { c =>

rddSchema += StructField(c.name, typeMapping(c._type), c.nullable, Metadata.empty)

}

val in_emp = spark.read

.format("com.databricks.spark.csv")

.schema(StructType(rddSchema.toList))

.option("inferSchema", "false")

.option("dateFormat", "yyyy.MM.dd")

.option("header", "false")

.option("delimiter", ",")

.option("nullValue", "null")

.option("treatEmptyValuesAsNulls", "true")

.csv("""your_path\employee.csv""")

in_emp.printSchema()

in_emp.collect()

in_emp.show()

我使用以下模式进行测试:

[

{

"trim": true,

"name": "id",

"nullable": true,

"id": null,

"position": 0,

"table": "employee",

"_type": "integer",

"primaryKey": true

},

{

"trim": true,

"name": "salary",

"nullable": true,

"id": null,

"position": 1,

"table": "employee",

"_type": "double",

"primaryKey": false

},

{

"trim": true,

"name": "dob",

"nullable": true,

"id": null,

"position": 2,

"table": "employee",

"_type": "date",

"primaryKey": false

},

{

"trim": true,

"name": "department",

"nullable": true,

"id": null,

"position": 3,

"table": "employee",

"_type": "string",

"primaryKey": false

}

]

以及下一个数据(employee.csv):

1211,3500.0,null,marketing

1212,3000.0,2016.12.08,IT

1213,4000.0,2017.10.20,HR

1214,3000.0,2017.10.20,finance

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/459761.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【分布式计算】MapReduce的替代者-Parameter Server

原文:http://blog.csdn.net/buptgshengod/article/details/46819051 首先还是要声明一下,这个文章是我在入职阿里云1个月以来,对于分布式计算的一点肤浅的认识,可能有些地方不够妥善,还请看官可以指出不足的地方&#…

java迭代器逆序_迭代器

提供一种方法顺序访问一个聚合对象中的各个元素,而又不需要暴露该对象的内部表示。迭代器模式(Iterator)实际上在Java的集合类中已经广泛使用了。我们以List为例,要遍历ArrayList,即使我们知道它的内部存储了一个Object[]数组,也不…

iOS开发多线程篇—线程安全

iOS开发多线程篇—线程安全 一、多线程的安全隐患 资源共享 1块资源可能会被多个线程共享,也就是多个线程可能会访问同一块资源 比如多个线程访问同一个对象、同一个变量、同一个文件 当多个线程访问同一块资源时,很容易引发数据错乱和数据安全问题 示例…

java程序可分为两个基本文件_1 Java语言概述答案

第1章 Java语言概述一、判断题1.Java语言是一种解释执行的语言,这个特点是Java语言的一个缺点。(F)2.Java源程序的文件名一定要与文件中某个类的名称一致。(T)3.Java语言采用面向对象的思想编程,具有跨平台、分布式、多…

JQuery中的siblings()是什么意思

siblings()函数用于选取每个匹配元素的所有同辈元素(不包括自己),并以jQuery对象的形式返回。转载于:https://www.cnblogs.com/DTWolf/p/4807277.html

sql server 日期类型

下面是结果集: 数据类型 输出 time 12:35:29. 1234567 date 2007-05-08 smalldatetime 2007-05-08 12:35:00 datetime 2007-05-08 12:35:29.123 datetime2 2007-05-08 12:35:29. 1234567 datetimeoffset 2007-05-08 12:35:29.1234567 12:15 转载于:htt…

以太坊java接口_java以太坊库web3j文档

通过java打包以太坊智能合约Web3j可以自动打包智能合同代码,以便在不脱离JVM的情况下进行以太坊智能合同部署和交互。要打包代码,需要先编译智能合同:$ solc .sol --bin --abi --optimize -o /web3j solidity generate /path/to/.bin /path/t…

【Android车载系统 News | Tech 1】News 谷歌开发车载Android系统 2014-12-19

据外国媒体报道,Android和iOS两大操作系统在垄断手机和平板之后,开始向智能家居、智能汽车、客厅娱乐、物联网等领域扩张。谷歌和苹果此 前均推出了连接智能手机和车载信息系统的平台产品。2014年12月18日,谷歌正计划开发一种汽车信息系统使用…

Android Ion 框架 文件下载

为什么80%的码农都做不了架构师?>>> ion是的一个安卓异步网络和图片加载库。 特性 异步下载:下载图片 (用ImageViews 或者 Bitmaps显示);下载JSON文件 (通过Gson解析);下载字符串;下载文件;Flu…

php 加密保存mysql_PHP及MYSQL中字符串加密函数

【IT168 服务器学院】我们在写PHP程序时经常要对用户的口令加密以确保安全,这时就要用到一些加密的函数。我总结了以下几种方法写出来供大家参考。1、用MYSQL中的加密函数来加密:PASSWORD()我想,这是一种很常用的方法了,具体的实现…

二叉树三种遍历(递归以及非递归实现)

package com.shiyeqiang.tree;import java.util.Stack;public class BiTree {public static void main(String[] args) {// 首先构造叶子节点BiTree leafA1 new BiTree(4);BiTree leafA2 new BiTree(5);BiTree leafB1 new BiTree(6);BiTree leafB2 new BiTree(7);// 构建二…

华为社招 c语言转java_【转】C语言面试题之华为篇

1、局部变量能否和全局变量重名?答:能,局部会屏蔽全局。要用全局变量,需要使用”::”局部变量可以与全局变量同名,在函数内引用这个变量时,会用到同名的局部变量,而不会用到全局变量。对于有些编…

CSS基础----元素分类

2019独角兽企业重金招聘Python工程师标准>>> 块级元素特点: 1、每个块级元素都从新的一行开始,并且其后的元素也另起一行。 2、元素的高度、宽度、行高以及顶和底边距都可设置。 3、元素宽度在不设置的情况下,是它本身父容器的100…

oledb 操作 excel

oledb excel http://wenku.baidu.com/search?wordoledb%20excel&ieutf-8&lm0&od0[Asp.net]常见数据导入Excel,Excel数据导入数据库解决方案,总有一款适合你! http://www.cnblogs.com/wolf-sun/p/3589605.htmlasp.net操作Excel&a…

Linux 高可用(HA)集群之keepalived

一、keepalived介绍1、Keepalived 定义Keepalived 是一个基于VRRP协议来实现的LVS服务高可用方案,可以利用其来避免单点故障。一个LVS服务会有2台服务器运行Keepalived,一台为主服务器(MASTER),一台为备份服务器&#…

java 将要死亡_人在即将死亡的时候,能意识到自己将要死亡了吗?科学家给出答案...

引言:自然界内大多数生物都敬畏生命,也害怕死亡。毕竟,死亡意味着结束与告别,将死之人多会留恋世间的人或事。那么,在临死之前,人会意识到自己将走向死亡吗?人类对长生不老的追求古已有之&#…

C#开发微信门户及应用(24)-微信小店货架信息管理

C#开发微信门户及应用(24)-微信小店货架信息管理 原文:C#开发微信门户及应用(24)-微信小店货架信息管理在前面微信小店系列篇《C#开发微信门户及应用(22)-微信小店的开发和使用》里面介绍了一些微信小店的基础知识,以及《C#开发微信门户及应用(23)-微信小店商品管理…

【百度地图API】——如何用label制作简易的房产标签

【百度地图API】——如何用label制作简易的房产标签 原文:【百度地图API】——如何用label制作简易的房产标签摘要: 最近,API爱好者们纷纷说,自定义marker太复杂了!不仅定义复杂,连所有的dom事件都要自己重新定义。有没…

【svn】设置过滤文件

2019独角兽企业重金招聘Python工程师标准>>> .classpath target .project .settings *.o *.lo *.la *.al .libs *.so *.so.[0-9]* *.a *.pyc *.pyo *.rej *~ #*# .#* .*.swp .DS_Store 转载于:https://my.oschina.net/sourcecoding/blog/509169

php开启错误日志,PHP开启error_log 错误日志

对于一些访问没有明显错误提示的PHP页面,我们可以通过error_log来做进一步的判定。但出于种种原因,有些服务器并没有开启PHP的error_log功能。可以暂时开启一下错误日志:编辑php.ini,将log_errors设置为on:log_errors …