博客
关于我
SparkSql的元数据
阅读量:796 次
发布时间:2023-02-26

本文共 371 字,大约阅读时间需要 1 分钟。

一、概述
SparkSQL的元数据存储状态有两种主要模式:in-memory和Hive。in-memory状态下,元数据在SparkSQL运行结束后会被丢弃;而Hive状态下,元数据通过Hive存储系统持久化保存,存储位置取决于Hive的实际存储路径。
二、SparkSQL脚本的配置
默认情况下,当在SPARK-HOME/conf目录下未找到hive-site.xml文件时,SparkSQL会以in-memory状态运行。此时,元数据将存储在内存中,运行结束后会被清除。

若要将元数据存储至Hive,则需要在SPARK-HOME/conf目录中添加hive-site.xml配置文件。这样,SparkSQL会默认以Hive模式运行,元数据将与Hive存储系统同步,具体存储路径取决于Hive的配置。

此文中相关技术细节参考自相关官方文档。

转载地址:http://jxvfk.baihongyu.com/

你可能感兴趣的文章
OSPF不能发现其他区域路由时,该怎么办?
查看>>
OSPF两个版本:OSPFv3与OSPFv2到底有啥区别?
查看>>
SQL Server 存储过程
查看>>
OSPF在大型网络中的应用:高效路由与可扩展性
查看>>
OSPF太难了,这份OSPF综合实验请每位网络工程师查收,周末弯道超车!
查看>>
OSPF技术入门(第三十四课)
查看>>
OSPF技术连载10:OSPF 缺省路由
查看>>
OSPF技术连载11:OSPF 8种 LSA 类型,6000字总结!
查看>>
OSPF技术连载13:OSPF Hello 间隔和 Dead 间隔
查看>>
OSPF技术连载14:OSPF路由器唯一标识符——Router ID
查看>>
OSPF技术连载15:OSPF 数据包的类型、格式和邻居发现的过程
查看>>
OSPF技术连载16:DR和BDR选举机制,一篇文章搞定!
查看>>
OSPF技术连载17:优化OSPF网络性能利器——被动接口!
查看>>
OSPF技术连载18:OSPF网络类型:非广播、广播、点对多点、点对多点非广播、点对点
查看>>
OSPF技术连载19:深入解析OSPF特殊区域
查看>>
SQL Server 复制 订阅与发布
查看>>
OSPF技术连载20:OSPF 十大LSA类型,太详细了!
查看>>
OSPF技术连载21:OSPF虚链路,现代网络逻辑连接的利器!
查看>>
OSPF技术连载22:OSPF 路径选择 O > O IA > N1 > E1 > N2 > E2
查看>>
OSPF技术连载2:OSPF工作原理、建立邻接关系、路由计算
查看>>