博客
关于我
基于Namespace内部partition来解决HDFS的扩展性问题方案
阅读量:394 次
发布时间:2019-03-05

本文共 733 字,大约阅读时间需要 2 分钟。

前言

HDFS NameNode(NN)在处理大量数据时面临着扩展性问题。其内部设计使用全局单一锁进行控制,在处理大量节点时导致性能瓶颈。针对这一问题,社区提出了基于Namespace的内部partition方案,以实现细粒度锁的拆分,进而优化扩展性。

HDFS NN的现有请求处理模式

HDFS NN的工作原理是使用一个大型的命名空间和全局锁进行元数据控制。任何写操作都需要获取全局锁,导致并发处理能力有限。尽管如此,当操作的数据文件无关时,仍可允许并发处理,避免不必要的锁控制。

基于Namespace的内部partition细粒度锁

为了解决全局锁的效率问题,提出了将Namespace划分为多个partition的方案。每个partition独立管理元数据,内部使用细粒度锁进行控制,进而支持并发操作。 - **partition标准**:可选择文件路径或INodeId作为划分依据。 - **INodeId划分**:使用ppId、pId和selfId作为键,确保相关文件目录分布在同一partition内。这种划分方式具有可扩展性和稳定性,且避免了路径重命名带来的问题。

NN新锁结构的调整

为支持细粒度锁,NN内部存储结构进行了优化: - 引入RangeMap存储结构,映射PartitionId到GSet。 - 每个GSet配备独立锁,确保线程安全。 - RangeMap本身也需线程安全锁,控制其操作流程。这种设计在不改变原有元数据结构的前提下,显著提升了锁粒度和扩展性。
总结
通过基于Namespace的内部partition和细粒度锁控制,HDFS NN的扩展性得到了显著提升。这种方案不仅保持了原有结构的简单性,还在锁粒度和性能上实现了优化。

转载地址:http://cqng.baihongyu.com/

你可能感兴趣的文章
MySQL 中随机抽样:order by rand limit 的替代方案
查看>>
MySQL 为什么需要两阶段提交?
查看>>
mysql 为某个字段的值加前缀、去掉前缀
查看>>
mysql 主从 lock_mysql 主从同步权限mysql 行锁的实现
查看>>
mysql 主从互备份_mysql互为主从实战设置详解及自动化备份(Centos7.2)
查看>>
mysql 主键重复则覆盖_数据库主键不能重复
查看>>
Mysql 优化 or
查看>>
mysql 优化器 key_mysql – 选择*和查询优化器
查看>>
MySQL 优化:Explain 执行计划详解
查看>>
Mysql 会导致锁表的语法
查看>>
mysql 使用sql文件恢复数据库
查看>>
mysql 修改默认字符集为utf8
查看>>
Mysql 共享锁
查看>>
MySQL 内核深度优化
查看>>
mysql 内连接、自然连接、外连接的区别
查看>>
mysql 写入慢优化
查看>>
mysql 分组统计SQL语句
查看>>
Mysql 分页
查看>>
Mysql 分页语句 Limit原理
查看>>
MySQL 创建新用户及授予权限的完整流程
查看>>