10.6 大型网站系统架构演化实例
大型网站的技术挑战主要来自于庞大的用户,高并发的访问和海量的数据,主要解决这类问题。
1. 单体架构
- 特点: 所有资源(应用程序、数据库、文件)集中在一台服务器上。
- 适用场景: 小型网站,用户和数据量较少。
- 限制: 随用户增长,性能和存储空间成为瓶颈。
2. 垂直架构
- 优化: 应用程序与数据分离,分为应用服务器、文件服务器、数据库服务器。
- 优势:
- 根据不同需求优化硬件配置(CPU、内存、硬盘)。
- 数据存储和业务处理能力提升。
- 挑战: 数据库压力依然会随着用户增长增加。
3. 引入缓存
- 原因: 数据访问遵循“二八定律”,80%的访问集中在20%的数据。
- 方法:
- 本地缓存:快速但受服务器内存限制。
- 远程分布式缓存:支持大规模缓存,性能更稳定。
- 效果: 缓解数据库访问压力,但应用服务器连接数有限,成为瓶颈。
4. 应用服务器集群
- 解决方案: 使用负载均衡器,将用户请求分配到多个应用服务器。
- 优势:
- 通过横向扩展增加服务器,提升系统可伸缩性。
- 不依赖更强大的单台服务器。
5. 数据库读写分离
- 问题: 写操作和部分读操作仍集中在主数据库,负载高。
- 优化:
- 主数据库负责写操作。
- 从数据库通过主从复制承担读操作。
- 数据访问模块实现透明的读写分离。
- 效果: 数据库性能进一步提升。
6. 反向代理与 CDN
- 目标: 缓解因区域网络差异导致的访问延迟问题。
- 方法:
- CDN: 部署在网络提供商机房,用户从最近位置获取内容。
- 反向代理: 缓存服务器,用户请求优先访问代理缓存内容。
- 效果: 提升响应速度,降低后端服务器负载。
7. 分布式文件与数据库
- 问题: 单一数据库或文件服务器无法满足持续增长需求。
- 解决方案:
- 分布式文件系统: 将文件分布在多个服务器上。
- 分布式数据库: 拆分业务数据库,减少单表数据规模。
- 效果: 支持海量数据存储与高并发访问。
8. 引入 NoSQL 与搜索引擎
- 原因: 数据结构复杂,传统关系型数据库难以满足需求。
- 优化:
- NoSQL: 提供分布式、弹性的数据存储。
- 搜索引擎: 加速复杂数据检索。
- 效果: 更灵活的数据存储与查询能力。
9. 业务拆分
- 目标: 按产品线拆分网站(如首页、订单、用户等)。
- 方法:
- 每个产品线独立部署为单独应用。
- 应用间通过消息队列或共享数据存储系统通信。
- 效果: 降低单一应用复杂度,提高团队开发效率。
10. 分布式服务化
- 挑战: 应用复杂度增高,维护成本增加。
- 解决方案:
- 提取共用业务逻辑为分布式服务(如用户管理、订单管理)。
- 应用通过服务调用完成具体操作。
- 效果: 简化应用间依赖关系,提升开发与运维效率。
10.7 软件架构维护
-
架构知识管理:
- 定义:包含架构设计和设计决策,用于解释架构方案的选择原因。
- 目标:确保关键设计知识不会因人员流失或变更而丢失,支持架构的演化和长期可维护性。
- 现状:架构知识文档化实践较少,主要由于动机不足、文档维护成本高等问题。
-
架构修改管理:
- 建立隔离区域以最小化修改影响,明确修改规则和类型。
- 追踪修改的副作用和影响范围,提升修改过程的可靠性。
-
架构版本管理:
- 提供演化控制和度量基础,支持静态与动态演化分析。
- 利用矩阵方法分析架构演化的波及效应,量化组件的贡献和影响。
-
架构可维护性度量:
- 圈复杂度(CCN):衡量架构复杂程度,用于早期风险评估,推荐值≤10。
- 扇入扇出度(FFC):表示模块与其他模块的交互频率,高值表明模块关联密集。
- 模块间耦合度(CBO):评估模块依赖关系的程度,高耦合模块维护风险高。
- 模块响应度(RFC):衡量模块提供的功能数量及其复杂性。
- 紧内聚度(TCC) 和松内聚度(LCC):表示模块内部组件的协作程度,评估模块内聚性。
评估方法与结果
- 将系统组件图导出为数据文件(如XML),利用架构评估工具计算各项指标。
- 示例系统的计算结果显示:
- 高度关联的模块(如RSApplication)FFC和CBO较高,维护风险较大。
- 独立模块(如User和DB)度量值较低,复杂性和耦合程度较小。
- 组件内聚性仅适用于包含子模块的组件,如ClientApplication。
建议与实践
-
文档化和知识管理:
- 推动团队建立有效的架构知识管理机制,使用工具化手段记录设计决策。
- 定期复盘设计决策的长期影响,提升架构演化的可预测性。
-
自动化与工具支持:
- 应用架构评估工具(如MSAES)自动化度量指标计算,减少人工误差。
- 在设计初期及演化关键点评估CCN、CBO等指标,指导后续优化。
-
培训与意识提升:
- 强化团队成员对架构知识记录和分享重要性的理解。
- 鼓励在开发过程中注重长远可维护性而非短期利益。