博客
关于我
基于Namespace内部partition来解决HDFS的扩展性问题方案
阅读量:394 次
发布时间:2019-03-05

本文共 733 字,大约阅读时间需要 2 分钟。

前言

HDFS NameNode(NN)在处理大量数据时面临着扩展性问题。其内部设计使用全局单一锁进行控制,在处理大量节点时导致性能瓶颈。针对这一问题,社区提出了基于Namespace的内部partition方案,以实现细粒度锁的拆分,进而优化扩展性。

HDFS NN的现有请求处理模式

HDFS NN的工作原理是使用一个大型的命名空间和全局锁进行元数据控制。任何写操作都需要获取全局锁,导致并发处理能力有限。尽管如此,当操作的数据文件无关时,仍可允许并发处理,避免不必要的锁控制。

基于Namespace的内部partition细粒度锁

为了解决全局锁的效率问题,提出了将Namespace划分为多个partition的方案。每个partition独立管理元数据,内部使用细粒度锁进行控制,进而支持并发操作。 - **partition标准**:可选择文件路径或INodeId作为划分依据。 - **INodeId划分**:使用ppId、pId和selfId作为键,确保相关文件目录分布在同一partition内。这种划分方式具有可扩展性和稳定性,且避免了路径重命名带来的问题。

NN新锁结构的调整

为支持细粒度锁,NN内部存储结构进行了优化: - 引入RangeMap存储结构,映射PartitionId到GSet。 - 每个GSet配备独立锁,确保线程安全。 - RangeMap本身也需线程安全锁,控制其操作流程。这种设计在不改变原有元数据结构的前提下,显著提升了锁粒度和扩展性。
总结
通过基于Namespace的内部partition和细粒度锁控制,HDFS NN的扩展性得到了显著提升。这种方案不仅保持了原有结构的简单性,还在锁粒度和性能上实现了优化。

转载地址:http://cqng.baihongyu.com/

你可能感兴趣的文章
localhost:5000在MacOS V12(蒙特利)中不可用
查看>>
Manjaro 24.1 “Xahea” 发布!具有 KDE Plasma 6.1.5、GNOME 46 和最新的内核增强功能
查看>>
mariadb multi-source replication(mariadb多主复制)
查看>>
MSCRM调用外部JS文件
查看>>
MSTP是什么?有哪些专有名词?
查看>>
Mstsc 远程桌面链接 And 网络映射
查看>>
Myeclipse常用快捷键
查看>>
MyEclipse用(JDBC)连接SQL出现的问题~
查看>>
myeclipse的新建severlet不见解决方法
查看>>
MyEclipse设置当前行背景颜色、选中单词前景色、背景色
查看>>
MyEclipse配置SVN
查看>>
MTCNN 人脸检测
查看>>
MyEcplise中SpringBoot怎样定制启动banner?
查看>>
MyPython
查看>>
MTD技术介绍
查看>>
mysql
查看>>
MTK Android 如何获取系统权限
查看>>
MySQL - 4种基本索引、聚簇索引和非聚索引、索引失效情况、SQL 优化
查看>>
MySQL - ERROR 1406
查看>>
mysql - 视图
查看>>