金句级表达 · PITHY EXPRESSION

Schema 是活的、数据是死的——你永远无法修改已经写入磁盘的数据格式

数据一旦以某种编码格式写入磁盘或日志,它的格式就永远固定了。但 Schema 必须随业务演进。因此,编码格式的核心价值不是「当下多高效」而是「多年后还能正确读取旧数据」。这是很多数据平台在 3–5 年后出现大规模兼容性问题的根本原因——早期选型时没有考虑 Schema 演进。
来源

第 4 章(数据编码与演进)

可迁移到

任何需要长期存储数据的系统设计——日志存储、数据湖、归档系统、区块链数据。

来自这本书的解读报告

《Designing Data-Intensive Applications》

Martin Kleppmann · 分布式系统 / 数据工程

这本书回答了如何在不可靠基础设施上构建可靠数据系统的问题,答案是理解每种技术的权衡本质并在不同层级做出理性选择。

分布式系统·数据架构·权衡思维·CAP·流批一体
阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →