Bootstrap

【架构实战营】模块四作业

千万级学生管理系统的考试试卷存储方案

1. 估算性能要求

1.1 用户量估算

用户量定为1000万

1.2 用户行为建模

  • 假设每门学科每年2次考试,每个学生平均一学期20门课,考试采取机考的方式,每门考试的答案20判断题、20选择题、4道大题(答案200字以内)

  • 考试结果永久保存

  • 在校学生能够看到自己曾经的考试结果。

  • 假设学校的考试都安排在某一个月内,考试的时候请求试卷,提交答案,中间答题过程浏览器本地完成

  • 考试集中在上午4小时和下午4小时

  • 请求试卷集中在考试开始的前1分钟

  • 提交答案集中在考试结束前的30分钟

1.3 性能需求计算

  • 在校学生:1000万 * 20(课)* 2(考试次数) * 1000(答案)* 2(学期) * 3(只有前三年考试)= 2.4T。

  • 离校学生:每年250万,存储量为 0.6T。

  • 请求试卷:1000万 * 20(课)/ 20(周末不考试) / 4(每天4堂考试)/ 1分钟 = 250万请求/分钟 ≈ 5万/每秒。

  • 提交试卷: 1000万 * 20(课)/ 20(周末不考试) / 4(每天4堂考试)/ 30分钟 = 1700/每秒。

2. 选择存储系统

2.1 考试试卷存储

选用 Redis sentinel作为考试试卷存储

2.2 考试结果存储

选用MySQL分库分表存储

2.3 考试答题内容存储

选用HBase集群存储

3. Redis存储方案设计

3.1 数据结构设计

Key:学校ID + 学科

Value:选择List,List可将题目有序且条理列出

3.2 读写分析

考试开始后,直接根据学校和考试科目获取到试卷内容即可。

采用List,无需针对题目格式作过多解析,降低复杂度。

3.3 读写流程

4. Redis sentinel 服务器估算

截至2019年中国大学共有13个学科,61个大学专业类,506个大学专业,向上估算为510。但是由于每个学校的相同专业共用一套题,则只需存储相应的一份试题即可,不可以学生数来算试卷大小。学生数估为1000万,假设每个学校在校生2万人,估算出院校数量约为 1000 / 2 = 500。试卷数量约为 500 x 510 = 255000份。20判断题、20选择题、4道大题,假设判断题字数每条约50字,判断题每题约30字,大题每题约150字,存储采用UTF-8编码格式,则每份试卷占空间 (20 x 50 + 20 x 30 + 4 x 150) x 3 = 6600字节,向上取整估算为10kb。则总试卷占用空间 255000 x 10 = 2550000kb 约为2.5GB。

单机足够完成试卷的存储。

由之前预估考试请求QPS约为5万QPS,Redis官方给出的在 Intel(R) Xeon(R) CPU E5520 @2.27GHz(with pipelining) 环境下的读写为SET : 552027.75 request per second / GET : 707463.75 request per second。单机版同样可以满足高并发请求。

为了保证系统的高可用,采用3台机器的Redis Sentinel来搭建系统存储。