Hadoop文件系统API定义

这是Hadoop文件系统API的规范,它将文件系统的内容建模为一组路径,这些路径可以是目录、符号链接或文件。

在这一领域,现有的相关研究出人意料地稀少。虽然存在多个将Unix文件系统描述为inode树的规范,但公开资料中没有任何内容将"Unix文件系统作为数据存储访问的概念模型"这一理念进行明确定义。

本规范旨在实现这一目标:定义Hadoop文件系统模型和API,使多个文件系统能够实现这些API,并向应用程序提供一致的数据模型。它不试图正式规定文件系统的任何并发行为,仅记录HDFS所展示的行为,因为这些行为是Hadoop客户端应用程序通常所预期的。

  1. 简介
  2. Notation
  3. 模型
  4. FileSystem 类
  5. OutputStream、Syncable 和 StreamCapabilities
  6. Abortable
  7. FSDataInputStream 类
  8. PathCapabilities 接口
  9. FSDataOutputStreamBuilder 类
  10. 使用文件系统规范进行测试
  11. 扩展规范及其测试
  12. 使用多部分上传文件
  13. IOStatistics
  14. openFile()
  15. SafeMode
  16. LeaseRecoverable
  17. BulkDelete