Spark从HDFS上读取JSON数据

代码如下:

import org.apache.spark.sql.Row;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.VoidFunction;
import org.apache.spark.sql.DataFrame;
import org.apache.spark.sql.SQLContext;public class QueryHDFSData {static SparkConf sparkConf = new SparkConf().setAppName("HDFSQuery").setMaster("local[2]");static JavaSparkContext sc = new JavaSparkContext(sparkConf);static SQLContext sqlContext = new SQLContext(sc);public static void main(String[] args){
//        JavaRDD<String> poi = sc.textFile("hdfs://node2:9000/user/flume/events/2015-11-27-21/events-.1448629506841");DataFrame df = sqlContext.read().json("hdfs://node2:9000/user/flume/events/2015-11-26-21/events-.1448543965316");// 打印模式
        df.printSchema();// 将数据框架注册成一个表df.registerTempTable("poi");// 使用sql语句从表中读取数据DataFrame poi = sqlContext.sql("SELECT * FROM poi WHERE cid=57425749418");JavaRDD<Row> row = poi.javaRDD();row.foreach(new VoidFunction<Row>(){@Overridepublic void call(Row r) throws Exception {System.out.println(r.mkString());        }});}
}

 

转载于:https://www.cnblogs.com/gaopeng527/p/5003259.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/404641.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

emqx使用webhook数据持久化到mysql

官方文档&#xff1a;WebHook | EMQ Docs 一、启用webhook和触发规则 编辑webhook规则配置文件&#xff1a;/etc/emqx/plugins/emqx_web_hook.conf 指定webhook的url位置&#xff1a;web.hook.url http://127.0.0.1:5000/mqtt/webhook 增加消息推送事件规则&#xff1a;指…

为什么你应该使用OpenGL而不是DirectX?

From: http://www.cnblogs.com/Baesky/archive/2011/04/08/2009128.html 这是一篇很意思的博文&#xff0c;原文链接为&#xff1a;http://blog.wolfire.com/2010/01/Why-you-should-use-OpenGL-and-not-DirectX 大家可以思考一下&#xff1a;why we choose a closed source AP…

[react] Mern和Yeoman脚手架有什么区别?

[react] Mern和Yeoman脚手架有什么区别&#xff1f; MERN是一种脚手架工具&#xff0c;可使用Mongo&#xff0c;Express&#xff0c;React和Nodejs轻松构建同构应用Yeoman也是脚手架工具&#xff0c;它是基于Node.js运行的&#xff0c;生成的技术栈与开发语言无法&#xff0c;…

ReadDirectoryChangesW 函数

ReadDirectoryChangesW 函数 ReadDirectoryChangesW 函数 对指定的目录进行监控&#xff0c;返回详细的文件变化信息。 函数形式01 BOOL WINAPI ReadDirectoryChangesW(02 __in HANDLE hDirectory, // 对目录进行监视的句柄03 __out LPVOID lpBuffer, // …

flask web开发的相关博文学习

一、基础教程 flask-tutorial/SUMMARY.md at master greyli/flask-tutorial GitHubThe Flask Mega-Tutorial Part I: Hello, World! - miguelgrinberg.com全面的Flask教程 - 简书Flask入门教程 - HelloFlask 主推miguelgrinberg&#xff0c;课程如下 二、高级应用 flask-sq…

[react] 请说说什么是useRef?

[react] 请说说什么是useRef&#xff1f; 本质上 createRef 和 useRef&#xff08;mountRef&#xff09; 就是创建一个 {current: initialState} 对象然后返回 useRef 本身经历两个阶段&#xff1a;mountRef 和 updateRef&#xff0c;updateRef 就是把 memoziedState&#xff…

【Visual C++】游戏开发笔记十九 DirectX与OpenGL的博弈

From: http://blog.csdn.net/zhmxy555/article/details/7522960 本系列文章由zhmxy555&#xff08;毛星云&#xff09;编写&#xff0c;转载请注明出处。 http://blog.csdn.net/zhmxy555/article/details/7522960 作者&#xff1a;毛星云 邮箱&#xff1a; happylifemxyqq.…

写在前面-2015.11.30

本人90后&#xff0c;工作不是很久&#xff0c;大学期间主修软件工程&#xff0c;也在课外班学习java开发&#xff0c;后机缘巧合学习测试。截止2015年末&#xff0c;功测1年经验&#xff0c;&#xff08;纯手工&#xff09;自动化没有实战经验仅限于了解。目前性能测试一年。主…

linux c 获取时间戳 打印时间戳

以下是项目开发中常用到的时间戳接口&#xff0c;可以直接用。 一、相关接口 二、代码实现 char* lgw_get_now_time(void) {time_t timep;time(&timep);return asctime(localtime(&timep)); } int lgw_get_now_tick(void) {time_t timep;time(&timep);return ti…

[react] react的性能优化在哪个生命周期?它优化的原理是什么?

[react] react的性能优化在哪个生命周期&#xff1f;它优化的原理是什么&#xff1f; shouldComponentUpdate 减少不必要的重新渲染 个人简介 我是歌谣&#xff0c;欢迎和大家一起交流前后端知识。放弃很容易&#xff0c; 但坚持一定很酷。欢迎大家一起讨论 主目录 与歌谣…

让source insight更好的支持中文

From: http://blog.csdn.net/aylixuan/article/details/6066126 1.记事本录入以下文字&#xff1a; /* * 代替SourceInsight原有的Backspace功能&#xff08;希望如此&#xff09; * 增加了对双字节汉字的支持&#xff0c;在删除汉字的时候也能同时删除汉字的高字节而缓解…

阿里云linux主机安装qt报错:缺少libxkbcommon-x11.so.0

ubuntu云主机安装xfce桌面后&#xff0c;下载qt5.12.10&#xff0c;开发桌面应用&#xff0c;安装qt时报错缺少libxkbcommon-x11.so.0。 由于xfce是轻量级桌面不带libxkbcommon-x11.so.0&#xff0c;而qt5.12.10默认系统已经自带&#xff0c;所以&#xff0c;报错。此时更新一下…

[react] 你知道的react性能优化有哪些方法?

[react] 你知道的react性能优化有哪些方法&#xff1f; shouldComponentUpdate PureComponent &#xff1a;Class ComponentReact.Memo &#xff1a;Function ComponentuseCallback &#xff1a;Memoized FunctionuseMemo &#xff1a;Memozied Value个人简介 我是歌谣&#…

【转】XP/2000无法使用“缩略图查看”、右键无“设置桌面背景”选项问题详解...

许多朋友在XP或2000系统下查看图片时&#xff0c;经常碰到以下几个问题&#xff1a; 1. 当我查看文件夹里面的图片&#xff0c;以缩略图方式查看时&#xff0c;却发现系统不能显示图片内容了&#xff0c;只是出来一个简单的图片图标&#xff08;就和我们以图标或平铺显示的…

PHP的curl实现get,post 和 cookie(几个实例)

类似于dreamhost这类主机服务商&#xff0c;是显示fopen 的使用 的。使用php的curl可以实现支持FTP、FTPS、HTTP HTPPS SCP SFTP TFTP TELNET DICT FILE和LDAP。curl 支持SSL证书、HTTP POST、HTTP PUT 、FTP 上传&#xff0c;kerberos、基于HTT格式的上传、代理、cookie、用户…

Qt treeWidget 查找指定字段内容的条目并跳转到该条目

遍历Qt treeWidget&#xff0c;查找指定字段内容的条目&#xff0c;并跳转到该条目。 void MainWindow::on_pushButton_sidFind_clicked() {QString sid ui->lineEdit_sidFind->text();QTreeWidgetItemIterator it(ui->treeWidget_sqItem);while (*it) {if ((*it)-&…

[react] 什么是浅层渲染?

[react] 什么是浅层渲染&#xff1f; 当为 React 写单元测试时&#xff0c;浅层渲染(Shallow Renderer) 会变得十分有用。浅层渲染使你可以渲染 “单层深度” 的组件&#xff0c;并且对组件的 render 方法的返回值进行断言&#xff0c;不用担心子组件的行为&#xff0c;组件并…

document.all和document.layers

document.all是IE 4.0及以上版本的专有属性&#xff0c;是一个表示当前文档的所有对象的娄组&#xff0c;不仅包括页面上可见的实体对象&#xff0c;还包括一些不可见的对象&#xff0c;比如html注释等等。在document.all数组里面&#xff0c;元素不分层次&#xff0c;是按照其…

strip and linux lib compile

From: http://www.360doc.com/content/11/0808/17/7472348_138951246.shtml strip经常用来去除目标文件中的一些符号表、调试符号表信息&#xff0c;以减小程序的大小&#xff0c;在rpmbuild包的最后就用到。 其支持的选项如下&#xff1a; >strip -h 用法&#xff1a;str…