【架构实战营】模块四作业
千万级学生管理系统的考试试卷存储方案
1. 估算性能要求
1.1 用户量估算
用户量定为1000万
1.2 用户行为建模
假设每门学科每年2次考试,每个学生平均一学期20门课,考试采取机考的方式,每门考试的答案20判断题、20选择题、4道大题(答案200字以内)
考试结果永久保存
在校学生能够看到自己曾经的考试结果。
假设学校的考试都安排在某一个月内,考试的时候请求试卷,提交答案,中间答题过程浏览器本地完成
考试集中在上午4小时和下午4小时
请求试卷集中在考试开始的前1分钟
提交答案集中在考试结束前的30分钟
1.3 性能需求计算
在校学生:1000万 * 20(课)* 2(考试次数) * 1000(答案)* 2(学期) * 3(只有前三年考试)= 2.4T。
离校学生:每年250万,存储量为 0.6T。
请求试卷:1000万 * 20(课)/ 20(周末不考试) / 4(每天4堂考试)/ 1分钟 = 250万请求/分钟 ≈ 5万/每秒。
提交试卷: 1000万 * 20(课)/ 20(周末不考试) / 4(每天4堂考试)/ 30分钟 = 1700/每秒。
2. 选择存储系统
2.1 考试试卷存储
选用 Redis sentinel作为考试试卷存储
2.2 考试结果存储
选用MySQL分库分表存储
2.3 考试答题内容存储
选用HBase集群存储
3. Redis存储方案设计
3.1 数据结构设计
Key:学校ID + 学科
Value:选择List,List可将题目有序且条理列出
3.2 读写分析
考试开始后,直接根据学校和考试科目获取到试卷内容即可。
采用List,无需针对题目格式作过多解析,降低复杂度。
3.3 读写流程
4. Redis sentinel 服务器估算
截至2019年中国大学共有13个学科,61个大学专业类,506个大学专业,向上估算为510。但是由于每个学校的相同专业共用一套题,则只需存储相应的一份试题即可,不可以学生数来算试卷大小。学生数估为1000万,假设每个学校在校生2万人,估算出院校数量约为 1000 / 2 = 500。试卷数量约为 500 x 510 = 255000份。20判断题、20选择题、4道大题,假设判断题字数每条约50字,判断题每题约30字,大题每题约150字,存储采用UTF-8编码格式,则每份试卷占空间 (20 x 50 + 20 x 30 + 4 x 150) x 3 = 6600字节,向上取整估算为10kb。则总试卷占用空间 255000 x 10 = 2550000kb 约为2.5GB。
单机足够完成试卷的存储。
由之前预估考试请求QPS约为5万QPS,Redis官方给出的在
为了保证系统的高可用,采用3台机器的Redis Sentinel来搭建系统存储。