博客
关于我
基于Namespace内部partition来解决HDFS的扩展性问题方案
阅读量:394 次
发布时间:2019-03-05

本文共 733 字,大约阅读时间需要 2 分钟。

前言

HDFS NameNode(NN)在处理大量数据时面临着扩展性问题。其内部设计使用全局单一锁进行控制,在处理大量节点时导致性能瓶颈。针对这一问题,社区提出了基于Namespace的内部partition方案,以实现细粒度锁的拆分,进而优化扩展性。

HDFS NN的现有请求处理模式

HDFS NN的工作原理是使用一个大型的命名空间和全局锁进行元数据控制。任何写操作都需要获取全局锁,导致并发处理能力有限。尽管如此,当操作的数据文件无关时,仍可允许并发处理,避免不必要的锁控制。

基于Namespace的内部partition细粒度锁

为了解决全局锁的效率问题,提出了将Namespace划分为多个partition的方案。每个partition独立管理元数据,内部使用细粒度锁进行控制,进而支持并发操作。 - **partition标准**:可选择文件路径或INodeId作为划分依据。 - **INodeId划分**:使用ppId、pId和selfId作为键,确保相关文件目录分布在同一partition内。这种划分方式具有可扩展性和稳定性,且避免了路径重命名带来的问题。

NN新锁结构的调整

为支持细粒度锁,NN内部存储结构进行了优化: - 引入RangeMap存储结构,映射PartitionId到GSet。 - 每个GSet配备独立锁,确保线程安全。 - RangeMap本身也需线程安全锁,控制其操作流程。这种设计在不改变原有元数据结构的前提下,显著提升了锁粒度和扩展性。
总结
通过基于Namespace的内部partition和细粒度锁控制,HDFS NN的扩展性得到了显著提升。这种方案不仅保持了原有结构的简单性,还在锁粒度和性能上实现了优化。

转载地址:http://cqng.baihongyu.com/

你可能感兴趣的文章
mysql中having的用法
查看>>
MySQL中interactive_timeout和wait_timeout的区别
查看>>
mysql中int、bigint、smallint 和 tinyint的区别、char和varchar的区别详细介绍
查看>>
mysql中json_extract的使用方法
查看>>
mysql中json_extract的使用方法
查看>>
mysql中null和空字符串的区别与问题!
查看>>
MySQL中ON DUPLICATE KEY UPDATE的介绍与使用、批量更新、存在即更新不存在则插入
查看>>
MYSQL中TINYINT的取值范围
查看>>
Mysql中varchar类型数字排序不对踩坑记录
查看>>
mysql中出现update-alternatives: 错误: 候选项路径 /etc/mysql/mysql.cnf 不存在 dpkg: 处理软件包 mysql-server-8.0的解决方法(全)
查看>>
MySQL中地理位置数据扩展geometry的使用心得
查看>>
Mysql中存储引擎简介、修改、查询、选择
查看>>
mysql中实现rownum,对结果进行排序
查看>>
mysql中对于数据库的基本操作
查看>>
mysql中的 +号 和 CONCAT(str1,str2,...)
查看>>
MySql中的concat()相关函数
查看>>
mysql中的concat函数,concat_ws函数,concat_group函数之间的区别
查看>>
MySQL中的count函数
查看>>
MySQL中的DB、DBMS、SQL
查看>>
MySQL中的DECIMAL类型:MYSQL_TYPE_DECIMAL与MYSQL_TYPE_NEWDECIMAL详解
查看>>