背景

社交网络的基本要求

概览

memcached -> 一个开源的存放在内存的哈希表实现

提供 set, get, delete 操作

查询操作描述

为什么要删除而不是更新: 因为删除操作是幂等的, 并且 memcache 不是数据的权威来源, 在分布式系统中可能出现错误

为什么选择 memcache 来解决读取数据库的热点问题: 隔离缓存层和持久化层, 这样在工作负载变更的的时候可以分别进行适配

一个集群中有数以百计的 memcache 服务器, kv 键值对通过一致性哈希从而均匀地分布在这些服务器中

因此每个 web server 都会访问很多 memcache server, 这就形成了一种多对多的结构

每个 web server 上会有 memcache client, 包含一系列功能

每个 memcache client 维护当前可用的 memcache server 集合 (配置通过辅助配置系统更新(如 zookeeper))

并行请求和批处理

写 web app 的时候, 试图最小化网络来回的次数

通过建造一个数据依赖的有向无环图, 可以并行获取深度相同的节点

c-s 交互

客户端有一个库, 这个库可以被嵌入到应用程序或者作为一个名为 mcrouter 的独立代理

这个代理提供对 server 的接口并负责将请求/回复从其他 server 路由

对于 get 操作

对于 delete 和 set 操作

拥塞

client 使用在请求队列上使用滑动窗口机制

请求被回复时, 适当增加窗口大小, 否则适当减少窗口大小

租约机制

对于第一种: 租约协调并发的写入可以解决

对于第二种: 限制写入速率(10秒发放一个租约), 通知客户端延迟写入

旧数据

应用可以自主决定等待新数据还是继续使用旧数据

Memcache 池

小规模失效

一小组机器成为 glutter, 用于故障处理

client 未收到 server 的回复时, 把 glutter 当作 server

大规模失效

将 client 的请求重定向到其他集群

需求增加的时候, 简单地增加服务器数量可能会造成拥塞

server 被分为多个前端集群和一个包含数据库的存储集群

所有的前端集群都使用相同的 memcache server, 形成区域性池

2023-11-21 15:00:00 # Papers #Distributed System #Memcache