黄东旭:在中国打造数据库初创公司
· 阅读需 5 分钟
公司
- 总共成立四年,前两年都在写代码,最近一年半有一两百家企业在用
- Infra 在中国做很有优势,因为中国市场大,公司快糙猛拿来主义,infra 的好东西能够很快地被用上
- cofounders 里面没有 db 的经验
- open source 模式是未来,如果是闭源只能一家一家谈
- 最重要的商业决策:不在于算法有多nb 团队有多厉害,护城河的关键在于 1)社区 2)mysql 接口 (借用了 mysql 的社区开始,SQL 的支持很重要,比如连Kafka, Spark都支持 SQL)
TiDB 数据库原理
- 越nb的工程师越喜欢高性能,认为越快越好。但是 TiDB 的首要目标不是做到最快,而是做到 Availability reliability 稳定性 IO和 无限扩展。高性能的成本太高,要根据用户的硬件优化。但是这里是通用的数据库,不可能去优化各种场景。简单留给用户,复杂留给自己(跟AWS意见相反)。
- 认为 eventual consistency 是个伪概念,实际上就是没一致性或者弱一致性。比如 cassandra WRN 设置好了,但到底过多久 能够resolve?不确定。太复杂,用户最好不需要知道操心这些复杂的设置。
- 跑分不是唯一的指标,TPCC/TPCH 分数高对实际没有太多指导意义。数据库是磨出来的。 比如第一家客户,游戏公司,居然创建了3万张表,json 的 meta 信息连起来非常慢。
- 构架上不是 P2P,而是不同角色分得很清楚。
- KV 用的是 RocksDB 但是典型的 LSM tree 的写放大是15倍,这里优化到 value 拆出来,解决写放大的问题。
- 支持 MySQL 的client,也支持 SparkSQL 的读。
- SQL layer 没有用 MySQL 的模块。一开始有试过,但是1)下面很难分布式 2)代码太烂很难改。魔改的话,半年能做;但是长期的维护成本更高。重做不麻烦,都重构了三次了。这里用 Go 比用 C/C++/Rust 重构更方便。
- 一开始只想做 F1只做sql,和 CockroachDB 合作,后来他们往sql这边做,这边就只能往storage 做
- 挖了 Rust core team 的两个人。rust 很难招人,一般是招 C++的人然后转rust,他们会觉得很多脑袋里的约定编译器帮你搞定了。
- 不要低估造工业级轮子的难度。用 grpc,raft,rocksdb的好处是,如果业界有新的进展,会直接让使用者收益。
- Chunk (region) split 做了两个月,merge 做了三年。merge 做了形式化证明。
Tech 趋势
- 为什么是现在?
- hardware
- Hot / cold data -> warm data
- Log is the new database
- Everything is pluggable, 顶层 api 不变,下面即插即用可替换
- Distributed Transaction
- 2PC is the only option
- challenges: reduce round-trips
- Multi-tenancy achieved by kubernetes