Spark从HDFS上读取JSON数据

Spark从HDFS上读取JSON数据

news/2025/4/15 18:53:42/文章来源:https://blog.csdn.net/weixin_30445169/article/details/95600334

代码如下：

import org.apache.spark.sql.Row;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.VoidFunction;
import org.apache.spark.sql.DataFrame;
import org.apache.spark.sql.SQLContext;public class QueryHDFSData {static SparkConf sparkConf = new SparkConf().setAppName("HDFSQuery").setMaster("local[2]");static JavaSparkContext sc = new JavaSparkContext(sparkConf);static SQLContext sqlContext = new SQLContext(sc);public static void main(String[] args){
//        JavaRDD<String> poi = sc.textFile("hdfs://node2:9000/user/flume/events/2015-11-27-21/events-.1448629506841");DataFrame df = sqlContext.read().json("hdfs://node2:9000/user/flume/events/2015-11-26-21/events-.1448543965316");// 打印模式
        df.printSchema();// 将数据框架注册成一个表df.registerTempTable("poi");// 使用sql语句从表中读取数据DataFrame poi = sqlContext.sql("SELECT * FROM poi WHERE cid=57425749418");JavaRDD<Row> row = poi.javaRDD();row.foreach(new VoidFunction<Row>(){@Overridepublic void call(Row r) throws Exception {System.out.println(r.mkString());        }});}
}

转载于:https://www.cnblogs.com/gaopeng527/p/5003259.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/404641.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

emqx使用webhook数据持久化到mysql

emqx使用webhook数据持久化到mysql

官方文档：WebHook | EMQ Docs 一、启用webhook和触发规则编辑webhook规则配置文件：/etc/emqx/plugins/emqx_web_hook.conf 指定webhook的url位置：web.hook.url http://127.0.0.1:5000/mqtt/webhook 增加消息推送事件规则：指…

阅读更多...

为什么你应该使用OpenGL而不是DirectX?

为什么你应该使用OpenGL而不是DirectX?

From: http://www.cnblogs.com/Baesky/archive/2011/04/08/2009128.html 这是一篇很意思的博文，原文链接为：http://blog.wolfire.com/2010/01/Why-you-should-use-OpenGL-and-not-DirectX 大家可以思考一下：why we choose a closed source AP…

阅读更多...

[react] Mern和Yeoman脚手架有什么区别？

[react] Mern和Yeoman脚手架有什么区别？

[react] Mern和Yeoman脚手架有什么区别？ MERN是一种脚手架工具，可使用Mongo，Express，React和Nodejs轻松构建同构应用Yeoman也是脚手架工具，它是基于Node.js运行的，生成的技术栈与开发语言无法，…

阅读更多...

ReadDirectoryChangesW 函数

ReadDirectoryChangesW 函数

ReadDirectoryChangesW 函数 ReadDirectoryChangesW 函数对指定的目录进行监控，返回详细的文件变化信息。函数形式01 BOOL WINAPI ReadDirectoryChangesW(02 __in HANDLE hDirectory, // 对目录进行监视的句柄03 __out LPVOID lpBuffer, // …

阅读更多...

flask web开发的相关博文学习

flask web开发的相关博文学习

一、基础教程 flask-tutorial/SUMMARY.md at master greyli/flask-tutorial GitHubThe Flask Mega-Tutorial Part I: Hello, World! - miguelgrinberg.com全面的Flask教程 - 简书Flask入门教程 - HelloFlask 主推miguelgrinberg，课程如下二、高级应用 flask-sq…

阅读更多...

[react] 请说说什么是useRef？

[react] 请说说什么是useRef？

[react] 请说说什么是useRef？ 本质上 createRef 和 useRef（mountRef） 就是创建一个 {current: initialState} 对象然后返回 useRef 本身经历两个阶段：mountRef 和 updateRef，updateRef 就是把 memoziedState&#xff…

阅读更多...

【Visual C++】游戏开发笔记十九 DirectX与OpenGL的博弈

【Visual C++】游戏开发笔记十九 DirectX与OpenGL的博弈

From: http://blog.csdn.net/zhmxy555/article/details/7522960 本系列文章由zhmxy555（毛星云）编写，转载请注明出处。 http://blog.csdn.net/zhmxy555/article/details/7522960 作者：毛星云邮箱： happylifemxyqq.…

阅读更多...

写在前面-2015.11.30

写在前面-2015.11.30

本人90后，工作不是很久，大学期间主修软件工程，也在课外班学习java开发，后机缘巧合学习测试。截止2015年末，功测1年经验，（纯手工）自动化没有实战经验仅限于了解。目前性能测试一年。主…

阅读更多...

linux c 获取时间戳打印时间戳

linux c 获取时间戳打印时间戳

以下是项目开发中常用到的时间戳接口，可以直接用。一、相关接口二、代码实现 char* lgw_get_now_time(void) {time_t timep;time(&timep);return asctime(localtime(&timep)); } int lgw_get_now_tick(void) {time_t timep;time(&timep);return ti…

阅读更多...

[react] react的性能优化在哪个生命周期？它优化的原理是什么？

[react] react的性能优化在哪个生命周期？它优化的原理是什么？

[react] react的性能优化在哪个生命周期？它优化的原理是什么？ shouldComponentUpdate 减少不必要的重新渲染个人简介我是歌谣，欢迎和大家一起交流前后端知识。放弃很容易， 但坚持一定很酷。欢迎大家一起讨论主目录与歌谣…

阅读更多...

An HTML5 presentation builder — Read more

An HTML5 presentation builder — Read more

https://github.com/infews/keydown

阅读更多...

让source insight更好的支持中文

让source insight更好的支持中文

From: http://blog.csdn.net/aylixuan/article/details/6066126 1.记事本录入以下文字： /* * 代替SourceInsight原有的Backspace功能（希望如此） * 增加了对双字节汉字的支持，在删除汉字的时候也能同时删除汉字的高字节而缓解…

阅读更多...

阿里云linux主机安装qt报错：缺少libxkbcommon-x11.so.0

阿里云linux主机安装qt报错：缺少libxkbcommon-x11.so.0

ubuntu云主机安装xfce桌面后，下载qt5.12.10，开发桌面应用，安装qt时报错缺少libxkbcommon-x11.so.0。由于xfce是轻量级桌面不带libxkbcommon-x11.so.0，而qt5.12.10默认系统已经自带，所以，报错。此时更新一下…

阅读更多...

[react] 你知道的react性能优化有哪些方法？

[react] 你知道的react性能优化有哪些方法？

[react] 你知道的react性能优化有哪些方法？ shouldComponentUpdate PureComponent ：Class ComponentReact.Memo ：Function ComponentuseCallback ：Memoized FunctionuseMemo ：Memozied Value个人简介我是歌谣&#…

阅读更多...

【转】XP/2000无法使用“缩略图查看”、右键无“设置桌面背景”选项问题详解...

【转】XP/2000无法使用“缩略图查看”、右键无“设置桌面背景”选项问题详解...

许多朋友在XP或2000系统下查看图片时，经常碰到以下几个问题： 1. 当我查看文件夹里面的图片，以缩略图方式查看时，却发现系统不能显示图片内容了，只是出来一个简单的图片图标（就和我们以图标或平铺显示的…

阅读更多...

PHP的curl实现get，post 和 cookie（几个实例）

PHP的curl实现get，post 和 cookie（几个实例）

类似于dreamhost这类主机服务商，是显示fopen 的使用的。使用php的curl可以实现支持FTP、FTPS、HTTP HTPPS SCP SFTP TFTP TELNET DICT FILE和LDAP。curl 支持SSL证书、HTTP POST、HTTP PUT 、FTP 上传，kerberos、基于HTT格式的上传、代理、cookie、用户…

阅读更多...

Qt treeWidget 查找指定字段内容的条目并跳转到该条目

Qt treeWidget 查找指定字段内容的条目并跳转到该条目

遍历Qt treeWidget，查找指定字段内容的条目，并跳转到该条目。 void MainWindow::on_pushButton_sidFind_clicked() {QString sid ui->lineEdit_sidFind->text();QTreeWidgetItemIterator it(ui->treeWidget_sqItem);while (*it) {if ((*it)-&…

阅读更多...

[react] 什么是浅层渲染？

[react] 什么是浅层渲染？

[react] 什么是浅层渲染？ 当为 React 写单元测试时，浅层渲染(Shallow Renderer) 会变得十分有用。浅层渲染使你可以渲染 “单层深度” 的组件，并且对组件的 render 方法的返回值进行断言，不用担心子组件的行为，组件并…

阅读更多...

document.all和document.layers

document.all和document.layers

document.all是IE 4.0及以上版本的专有属性，是一个表示当前文档的所有对象的娄组，不仅包括页面上可见的实体对象，还包括一些不可见的对象，比如html注释等等。在document.all数组里面，元素不分层次，是按照其…

阅读更多...

strip and linux lib compile

strip and linux lib compile

From: http://www.360doc.com/content/11/0808/17/7472348_138951246.shtml strip经常用来去除目标文件中的一些符号表、调试符号表信息，以减小程序的大小，在rpmbuild包的最后就用到。其支持的选项如下： >strip -h 用法：str…

阅读更多...

最新文章