.NET Core的文件系统[5]:扩展文件系统构建一个简易版“云盘”


FileProvider构建了一个抽象文件系统,作为它的两个具体实现,PhysicalFileProvider和EmbeddedFileProvider则分别为我们构建了一个物理文件系统和程序集内嵌文件系统。总的来说,它们针对的都是“本地”文件,接下来我们通过自定义FileProvider构建一个“远程”文件系统,我们可以将它视为一个只读的“云盘”。由于文件系统的目录结构和文件内容都是通过HTTP请求的方式读取的,所以我们将这个自定义的FileProvider命名为HttpFileProvider。[ 本文已经同步到《ASP.NET Core框架揭秘》之中]

上图基本上体现了以HttpFileProvider的远程文件系统的设计和实现原理。真实的文件保存在文件服务器上,客户端可以通过公布出来的Web API得到指定路径所在的目录结构,以及目录和文件描述信息,甚至可以读取指定文件的内容。文件服务器中的每一个目录都对应着一个URL,客户端可以指定相应的URL将某一个目录作为本地文件系统的根。如图7所示,服务器上的文件系统实际是直接通过指向“c:\test”目录的PhysicalFileProvider来表示的,这个根目录通过“http://server/files/”表示。对于两个客户端的“本地文件系统来说”,它们的根分别指向文件服务器上的目录“c:\dir1”和“c:\dir1\foobar”(对应的URL分别是“http://server/files/dir1”和“ http://server/files/dir1/foobar”)。

目录
一、HttpFileInfo与HttpDirectoryContents
二、HttpFileProvider
三、FileProviderMiddleware
四、远程文件系统的应用

一、HttpFileInfo与HttpDirectoryContents

在以HttpFileProvider为核心的文件系统中,我们通过HttpFileInfo来表示目录和文件,包含子目录和文件的目录内容则通过另一个HttpDirectoryContents类型来表示。不过在这之前,我们需要介绍两个对应的描述类型,它们分别是描述文件和目录的HttpFileDescriptor和描述目录内容的HttpDirectoryContentsDescriptor。

如下面的代码片段所示,HttpFileDescriptor的属性成员基本上是根据IFileInfo这个接口来定义的,并且这些属性的值本身就来源于在构造时指定的FileInfo对象。由于真实的目录或文件存在于文件服务器上,所以HttpFileDescriptor的PhysicalPath属性表示的实际上是对应的URL,这个URL是通过构造时指定的委托对象计算出来的。

   1: public class HttpFileDescriptor
   2: {
   3:     public bool               Exists { get;  set; }
   4:     public bool               IsDirectory { get;  set; }
   5:     public DateTimeOffset     LastModified { get;  set; }
   6:     public long               Length { get;  set; }
   7:     public string             Name { get;  set; }
   8:     public string             PhysicalPath { get;  set; }
   9:  
  10:     public HttpFileDescriptor()
  11:     { }
  12:  
  13:     public HttpFileDescriptor(IFileInfo fileInfo, Func<string, string> physicalPathResolver)
  14:     {
  15:         this.Exists           = fileInfo.Exists;
  16:         this.IsDirectory      = fileInfo.IsDirectory;
  17:         this.LastModified     = fileInfo.LastModified;
  18:         this.Length           = fileInfo.Length;
  19:         this.Name             = fileInfo.Name;
  20:         this.PhysicalPath     = physicalPathResolver(fileInfo.Name);
  21:     }
  22:  
  23:     public IFileInfo ToFileInfo(HttpClient httpClient)
  24:     {
  25:         return this.Exists 
  26:             ? new HttpFileInfo(this, httpClient)
  27:             : (IFileInfo)new NotFoundFileInfo(this.Name);
  28:     }
  29: }

用于描述文件或者目录HttpFileDescriptor对象实际上可以视为是对一个FileInfo对象的封装,而用来描述目录内容的HttpDirectoryContentsDescriptor则是对一个DirectoryContents对象的封装。如下面的代码片段所示,HttpDirectoryContentsDescriptor具有一个名为FileDescriptors的属性返回一组HttpFileDescriptor对象的集合,集合中的每个HttpFileDescriptor对象对应着当前目录下的某个子目录或者文件。

   1: public class HttpDirectoryContentsDescriptor
   2: {
   3:     public bool                                 Exists { get;  set; }
   4:     public IEnumerable      FileDescriptors { get;  set; }
   5:  
   6:     public HttpDirectoryContentsDescriptor()
   7:     {
   8:         this.FileDescriptors = new HttpFileDescriptor[0];
   9:     }
  10:  
  11:     public HttpDirectoryContentsDescriptor(IDirectoryContents directoryContents, Func<string, string> physicalPathResolver)
  12:     {
  13:         this.Exists = directoryContents.Exists;
  14:         this.FileDescriptors = directoryContents.Select(_ => new HttpFileDescriptor(_, physicalPathResolver));
  15:     }
  16: }

从前面的代码片段可以看到HttpFileDescriptor具有一个ToFileInfo方法将自己转换成一个FileInfo对象,这个对象的类型就是我们上面提到过的HttpFileInfo。由于HttpFileInfo是通过一个HttpFileDescriptor对象创建出来的,所以它的所有属性最初都来源于这个对象。由于FileInfo除了提供目录或者文件的描述信息之外,它还通过自身的CreateReadStream方法承载着读取文件内容的职责。由于真正的文件保存在服务器上,所以我们需要利用构建时提供的HttpClient对象向目标文件所在的URL发送HTTP请求的方式来读取文件内容,

   1: public class HttpFileInfo: IFileInfo
   2: {
   3:     private HttpClient _httpClient;
   4:  
   5:     public bool               Exists { get; private set; }
   6:     public bool               IsDirectory { get; private set; }
   7:     public DateTimeOffset     LastModified { get; private set; }
   8:     public long               Length { get; private set; }
   9:     public string             Name { get; private set; }
  10:     public string             PhysicalPath { get; private set; }
  11:  
  12:     public HttpFileInfo(HttpFileDescriptor descriptor, HttpClient httpClient)
  13:     {
  14:         this.Exists           = descriptor.Exists;
  15:         this.IsDirectory      = descriptor.IsDirectory;
  16:         this.LastModified     = descriptor.LastModified;
  17:         this.Length           = descriptor.Length;
  18:         this.Name             = descriptor.Name;
  19:         this.PhysicalPath     = descriptor.PhysicalPath;
  20:         _httpClient           = httpClient;
  21:     }
  22:  
  23:     public Stream CreateReadStream()
  24:     {
  25:         HttpResponseMessage message =  _httpClient.GetAsync(this.PhysicalPath).Result;
  26:         return message.Content.ReadAsStreamAsync().Result;
  27:     }
  28: }

表示目录内容的HttpDirectoryContents具有如下的定义。与HttpFileInfo类似,HttpDirectoryContents对象依然是根据对应的描述对象(一个HttpDirectoryContentsDescriptor对象)创建的。HttpDirectoryContents本质上就是一个FileInfo对象的集合,集合中的每个元素都是一个根据HttpFileDescriptor对象创建的HttpFileInfo对象。

   1: public class HttpDirectoryContents : IDirectoryContents
   2: {
   3:     private IEnumerable _fileInfos;
   4:     public bool Exists { get; private set; }
   5:  
   6:     public HttpDirectoryContents(HttpDirectoryContentsDescriptor descriptor, HttpClient httpClient)
   7:     {
   8:         this.Exists     = descriptor.Exists;
   9:         _fileInfos     = descriptor.FileDescriptors.Select(file => file.ToFileInfo(httpClient));
  10:     }
  11:  
  12:     public IEnumerator GetEnumerator() => _fileInfos.GetEnumerator();
  13:     IEnumerator IEnumerable.GetEnumerator() => _fileInfos.GetEnumerator();
  14: }

二、HttpFileProvider

接下来我们来介绍作为核心的HttpFileProvider类型的实现。我们知道FileProvider承载着三项职责,即通过GetDirectoryContents方法得到指定目录的内容,通过GetFileInfo得到指定目录或者文件的描述,以及通过Watch方法监控目录或者文件的变化。虽然我们可以采用某种技术手段实现从服务端向客户端发送通知,但是针对远程文件的监控意义不大,所以HttpFileProvider只提供前面两种基本的功能。

   1: public class HttpFileProvider : IFileProvider
   2: {
   3:     private readonly string _baseAddress;
   4:     private HttpClient      _httpClient;
   5:  
   6:     public HttpFileProvider(string baseAddress)
   7:     {
   8:         _baseAddress = baseAddress.TrimEnd('/');
   9:         _httpClient     = new HttpClient();
  10:     }
  11:  
  12:     public IDirectoryContents GetDirectoryContents(string subpath)
  13:     {
  14:         string url = $"{_baseAddress}/{subpath.TrimStart('/')}?dir-meta";
  15:         string content = _httpClient.GetStringAsync(url).Result;
  16:         HttpDirectoryContentsDescriptor descriptor = JsonConvert.DeserializeObject(content);
  17:         return new HttpDirectoryContents(descriptor, _httpClient);
  18:     }
  19:  
  20:     public IFileInfo GetFileInfo(string subpath)
  21:     {
  22:         string url = $"{_baseAddress}/{subpath.TrimStart('/')}?file-meta";
  23:         string content = _httpClient.GetStringAsync(url).Result;
  24:         HttpFileDescriptor descriptor = JsonConvert.DeserializeObject(content);
  25:         return descriptor.ToFileInfo(_httpClient);
  26:     }
  27:  
  28:     public IChangeToken Watch(string filter)
  29:     {
  30:         return NullChangeToken.Singleton;
  31:     }
  32: }

由于文件系统由服务器托管,目录内容和目录与文件的描述信息都只能通过发送HTTP请求的形式来获取,HttpFileProvider利用一个HttpClient对象来获取这些远程资源。HttpFileProvider建立的本地文件系统的根目录可以指向文件服务器上任意一个目录,我们将指向这个目录的URL成为“基地址”,对应着它的字段_baseAddress。对于任何一个目录或者文件来说,它对应的URL通过这个基地址和相对地址合并而成。

不论是GetFileInfo方法还是GetDirectoryContents,HttpFileProvider发送HTTP请求的地址都是所在目录或者文件对应的URL,但是它们返回的内容是不同的。前者返回的是目录或者文件的描述信息,后者返回的目录内容的描述信息。为此我们采用相应的查询字符串来区分这两种具有相同路径的HTTP请求,它们采用的查询字符串名称分别是“ ?file-meta”和“?dir-meta”。

对于HttpFileProvider实现的GetDirectoryContents和GetFileInfo方法,它根据指定的相对路径解析出对应的URL,然后利用HttpClient针对这个地址发送HTTP请求,响应的内容利用JsonConvert反序列成一个HttpDirectoryContentsDescriptor或者HttpFileDescriptor对象,然后在据此创建并返回一个HttpDirectoryContents或者HttpFileInfo对象。

三、FileProviderMiddleware

作为文件服务器的其实就是一个简单的ASP.NET Core应用,HttpFileProvider调用的Web API则是通过一个类型为FileProviderMiddleware的中间件实现的。具体来说,这个FileProviderMiddleware需要处理如下三种类型的HTTP请求:

  • 读取文件内容: 地址指向目标文件,不含任何查询字符串,比如“/files/dir1/foobar/foo.txt”。
  • 读取文件或目录的描述:地址指向目标目录或文件,采用“?file-meta”作为查询字符串,比如“/files/dir1/foobar?file-meta”或者“ /files/dir1/foobar/foo.txt?file-meta”。
  • 读取目录内容:地址指向目标目录,采用“?dir-meta”作为查询字符串,比如“/files/dir1/foobar?dir-meta”。

如下所示的代码片段体现了FileProviderMiddleware这个中间件的完整定义。我们可以看出它直接使用一个PhysicalFileProvider来作为自身的文件系统,对应的根目录直接在构造函数中指定。针对上述这三种HTTP请求的处理实现在Invoke方法中,具体的实现逻辑其实很简单:如果请求地址携带查询字符串“dir-meta”,则根据请求目标目录创建一个HttpDirectoryContentsDescriptor对象,将利用JsonConvert将其序列化后写入响应;如果请求地址携带查询字符串“file-meta”,则根据请求的目录或者文件创建一个HttpFileDescriptor对象,并采用相同的方式序列化后写入响应;如果请求地址不具有如上两个查询字符串,则直接读取目标文件的内容并写入响应。

   1: public class FileProviderMiddleware
   2: {
   3:     private readonly RequestDelegate     _next;
   4:     private readonly IFileProvider       _fileProvider;
   5:  
   6:     public FileProviderMiddleware(RequestDelegate next, string root)
   7:     {
   8:         _next             = next;
   9:         _fileProvider     = new PhysicalFileProvider(root);
  10:     }
  11:  
  12:     public async Task Invoke(HttpContext context)
  13:     {
  14:         if (context.Request.Query.ContainsKey("dir-meta"))
  15:         {
  16:             var dirContents = _fileProvider.GetDirectoryContents(context.Request.Path);
  17:             var dirDecriptor = new HttpDirectoryContentsDescriptor(dirContents, CreatePhysicalPathResolver(context, true));
  18:             await context.Response.WriteAsync(JsonConvert.SerializeObject(dirDecriptor));
  19:         }
  20:         else if (context.Request.Query.ContainsKey("file-meta"))
  21:         {
  22:             var fileInfo = _fileProvider.GetFileInfo(context.Request.Path);
  23:             var fileDescriptor = new HttpFileDescriptor(fileInfo, CreatePhysicalPathResolver(context, false));
  24:             await context.Response.WriteAsync(JsonConvert.SerializeObject(fileDescriptor));
  25:         }
  26:         else
  27:         {
  28:             await context.Response.SendFileAsync(_fileProvider.GetFileInfo(context.Request.Path));
  29:         }
  30:     }
  31:  
  32:     private Func<string, string> CreatePhysicalPathResolver(HttpContext context, bool isDirRequest)        
  33:     {
  34:         string schema       = context.Request.IsHttps ? "https" : "http";
  35:         string host         = context.Request.Host.Host;
  36:         int port            = context.Request.Host.Port ?? 8080;
  37:         string pathBase     = context.Request.PathBase.ToString().Trim('/');
  38:         string path         = context.Request.Path.ToString().Trim('/');
  39:  
  40:         pathBase     = string.IsNullOrEmpty(pathBase) ? string.Empty : $"/{pathBase}";
  41:         path         = string.IsNullOrEmpty(path) ? string.Empty : $"/{path}";
  42:  
  43:         return isDirRequest
  44:             ? (Func<string, string>)(name => $"{schema}://{host}:{port}{pathBase}{path}/{name}")
  45:             : name => $"{schema}://{host}:{port}{pathBase}{path}";
  46:     }
  47: }

四、远程文件系统的应用

整个文件系统由FileProviderMiddleware和HttpFileProvider这两个核心对象组成,我们可以利用前者创建一个ASP.NET Core应用来作为文件服务器,客户端则利用后者在本地建立一个虚拟的文件系统。接下来我们就来演示如何在一个具体的实例使用它们。我们首先创建一个控制台应用来承载作为文件服务器的ASP.NET Core应用。在添加必要NuGet包依赖之后,我们只需要编写如下几行简单程序即可。

   1: public class Program
   2: {
   3:     public static void Main()
   4:     {
   5:         new WebHostBuilder()
   6:             .UseKestrel()
   7:             .UseUrls("http://localhost:3721/files")
   8:             .Configure(app => app.UseMiddleware<FileProviderMiddleware>(@"c:\test"))
   9:             .Build()
  10:             .Run();
  11:     }
  12: }

FileProviderMiddleware这个中间件类型直接通过调用WebHostBuilder的扩展方法Configure进行注册,我们在注册的同时指定了根目录的路径。接下来我们直接利用在《读取并监控文件的变化》创建的实例来演示如何利用HttpFileProvider来展示指定的目录结构和远程读取文件内容,为此我们对之前的程序进行了如下的改写。

   1: public class Program
   2: {
   3:     public static void Main()
   4:     {
   5:         IFileManager fileManager = new ServiceCollection()
   6:             .AddSingleton(new HttpFileProvider("http://localhost:3721/files/dir1"))
   7:             .AddSingleton()
   8:             .BuildServiceProvider()
   9:             .GetService();
  10:  
  11:         fileManager.ShowStructure((layer, name) => Console.WriteLine($"{new string('\t', layer)}{name}"));
  12:     }
  13: }

如上面的代码片段所示,我们创建了并注册了一个HttpFileProvider,而指定的作为根目录的URL为“http://localhost:3721/files/dir1”。由于文件服务器和客户端所处同一台主机,所以通过HttpFileProvider建立的本地文件系统的根目录实际上指向“C:\test\dir1”这个目录。当我们调用FileManager的ShowStructure方法之后,控制台上会以如下图所示的形式呈现出本地文件系统的虚拟结构。

我们依然可以直接调用FileManager的ReadAllTextAsync方法读取远程地读取某个文件的内容。如下面的代码片段所示,我们调用这个方法读取的文件路径为“foobar/foo.txt”,由于HttpFileProvider采用的基地址为“/files/dir1”,所以读取的这个文件在本地的路径为“c:\test\dir1\foobar\foo.txt”。如下所示的调试断言表明利用HttpFileProvider读取的文件就是这个物理文件。

   1: public static void Main()
   2: {
   3:     IFileManager fileManager = new ServiceCollection()
   4:         .AddSingleton(new HttpFileProvider("http://localhost:3721/files/dir1"))
   5:         .AddSingleton()
   6:         .BuildServiceProvider()
   7:         .GetService();
   8:  
   9:     string content1 = fileManager.ReadAllTextAsync("foobar/foo.txt").Result;
  10:     string content2 = File.ReadAllText(@"c:\test\dir1\foobar\foo.txt");
  11:     Debug.Assert(content1 == content2);
  12: }

[1] 取并监控文件的变化
[2] FileProvider是个什么东西?
[3] 由PhysicalFileProvider构建的物理文件系统
[4] 由EmbeddedFileProvider构建的内嵌(资源)文件系统
[5] 扩展文件系统构建一个简易版“云盘”