HTTP Caching
1. Introduction
HTTP(超文本传输协议)是一种无状态的应用层协议,常用于分布式信息系统。它通过请求/响应机制实现网络上的超文本信息交互。HTTP 缓存用于存储响应消息,以减少响应时间和网络带宽消耗。缓存可以是共享缓存(供多个用户使用)或私有缓存(仅供单个用户使用)。
2. Overview of Cache Operation
HTTP 缓存的主要目标是通过重用先前的响应消息来提高性能。缓存会将存储的响应视为“新鲜的”,如果可以在不验证的情况下重用它。否则,缓存需要验证响应是否仍然有效。
3. Storing Responses in Caches
缓存存储响应的条件包括请求方法被缓存理解、响应状态码是最终的、响应不包含 no-store
指令等。缓存必须包括所有接收到的响应头字段,并在某些情况下更新存储的响应头字段。
3.1. Storing Header and Trailer Fields
缓存必须包含所有接收到的响应头字段,但某些字段如 Connection
字段和特定代理使用的字段除外。
3.2. Updating Stored Header Fields
缓存需要在某些情况下更新存储的响应头字段,例如在接收到新的部分内容或验证响应时。
3.3. Storing Incomplete Responses
缓存可以存储不完整的响应,但必须记录其不完整状态,并且不得使用不完整的响应来回答请求,除非该请求是部分的并且指定的范围完全在不完整响应内。
3.4. Combining Partial Content
缓存可以将多个部分内容组合成单个存储的响应,但必须更新存储的响应头字段。
3.5. Storing Responses to Authenticated Requests
共享缓存不得使用带有 Authorization
头字段的请求的缓存响应,除非响应包含允许共享缓存存储的指令。
4. Constructing Responses from Caches
缓存在使用存储的响应满足请求时,必须确保请求的 URI 与存储的响应匹配,请求方法允许使用存储的响应,并且存储的响应是新鲜的、允许过期或已成功验证的。
4.1. Calculating Cache Keys with the Vary Header Field
当缓存接收到一个可以由存储的响应满足的请求时,如果该存储的响应包含 Vary
头字段,缓存必须确保所有列出的请求头字段匹配。
4.2. Freshness
响应的新鲜度由其生成时间与过期时间之间的时间长度决定。缓存可以使用显式或启发式方法来确定响应的过期时间。
4.3. Validation
当缓存无法使用存储的响应满足请求时,可以使用条件请求机制进行验证,以更新存储的元数据或替换存储的响应。
4.4. Invalidating Stored Responses
由于不安全的请求方法可能会改变服务器上的状态,中间缓存需要使存储的响应无效,以保持内容的最新。
5. Field Definitions
5.1. Age
Age
响应头字段表示响应生成或成功验证的时间估计值。
5.2. Cache-Control
Cache-Control
头字段用于列出沿请求/响应链的缓存指令。
5.2.1. Request Directives
max-age
: 客户端希望响应的年龄不超过指定的秒数。max-stale
: 客户端愿意接受超过新鲜度生命周期的响应。min-fresh
: 客户端希望响应在指定时间内仍然是新鲜的。no-cache
: 客户端希望在没有成功验证的情况下不使用存储的响应。no-store
: 缓存不得存储请求或响应的任何部分。no-transform
: 客户端请求中间人不对内容进行转换。only-if-cached
: 客户端只希望获得存储的响应。
5.2.2. Response Directives
max-age
: 响应在其年龄超过指定秒数后被视为陈旧。must-revalidate
: 一旦响应变得陈旧,缓存必须成功验证后才能重用。must-understand
: 限制响应的缓存到理解并符合该响应状态码要求的缓存。no-cache
: 响应必须在没有成功验证的情况下不被使用。no-store
: 缓存不得存储请求或响应的任何部分。no-transform
: 中间人不得转换内容。private
: 共享缓存不得存储响应。proxy-revalidate
: 共享缓存必须在成功验证后才能重用陈旧的响应。public
: 缓存可以存储响应,即使通常禁止。s-maxage
: 共享缓存的最大年龄。
5.3. Expires
Expires
响应头字段表示响应被视为陈旧的日期/时间。
5.4. Pragma
Pragma
请求头字段用于 HTTP/1.0 缓存,指定 no-cache
请求。
5.5. Warning
Warning
头字段用于传递关于消息状态或转换的附加信息。
6. Relationship to Applications and Other Caches
应用程序使用 HTTP 时,可能会指定额外的缓存形式,例如浏览器的历史机制。HTTP 缓存要求不一定适用于应用程序如何使用从 HTTP 缓存中检索到的数据。
7. Security Considerations
7.1. Cache Poisoning
缓存中存储恶意内容可能会影响多个用户。缓存中毒攻击利用实现漏洞、提升权限或其他技术将响应插入缓存。
7.2. Timing Attacks
缓存的使用可能泄露关于哪些资源已被请求的信息。例如,攻击者可以通过加载已知存在于第一个站点上的响应来推测用户是否访问过该站点。
7.3. Caching of Sensitive Information
实现和部署中的缺陷可能导致缓存敏感信息,暴露给未经授权的方。
8. IANA Considerations
IANA 更新了 HTTP 字段名称注册表和 HTTP 缓存指令注册表。
ABNF
Age = delta-seconds
Cache-Control = [ cache-directive *( OWS "," OWS cache-directive ) ]
Expires = HTTP-date
HTTP-date = <HTTP-date, see [HTTP], Section 5.6.7>
OWS = <OWS, see [HTTP], Section 5.6.3>
cache-directive = token [ "=" ( token / quoted-string ) ]
delta-seconds = 1*DIGIT
field-name = <field-name, see [HTTP], Section 5.1>
quoted-string = <quoted-string, see [HTTP], Section 5.6.4>
token = <token, see [HTTP], Section 5.6.2>