数据库主键的选择--雪花ID


在设计表结构时,我们首先遇到的问题就是主键设置为什么类型的。之前我用过int 也用过GUID,都不太理想:

使用int主键缺点

    1、如果经常有合并表操作,就可能会出现主键重复情况。

    2、使用int 数据范围有限制。如果存在大量数据,可能会超出int 取值范围。

    3、很难处理分布式存储数据表。

使用GUID做主键缺点:

    1、存储空间大(16 byte),因此它将会占用更多磁盘大小。

    2、很难记忆。join操作性能比int要低。

    3、没有内置函数获取最新产生guid主键

    4、GUID做主键将会添加到表上所以其他索引中,因此会降低性能。

    5、不宜排序。

这次我选择了使用雪花ID。雪花ID是用一个64位的整形数字来做ID,对应.net中的long,数据库中的bigint。

算法描述:

    • 最高位是符号位,始终为0,不可用。
    • 41位的时间序列,精确到毫秒级,41位的长度可以使用69年。时间位还有一个很重要的作用是可以根据时间进行排序。
    • 10位的机器标识,10位的长度最多支持部署1024个节点。
    • 12位的计数序列号,序列号即一系列的自增id,可以支持同一节点同一毫秒生成多个ID序号,12位的计数序列号支持每个节点每毫秒产生4096个ID序号。

源码如下:

 1 public class SnowflakeIdWorker//雪花ID
 2     {
 3         //机器ID
 4         private static long workerId;
 5         private static long twepoch = 687888001020L; //唯一时间,这是一个避免重复的随机量,自行设定不要大于当前时间戳
 6         private static long sequence = 0L;
 7         private static int workerIdBits = 4; //机器码字节数。4个字节用来保存机器码(定义为Long类型会出现,最大偏移64位,所以左移64位没有意义)
 8         public static long maxWorkerId = -1L ^ -1L << workerIdBits; //最大机器ID
 9         private static int sequenceBits = 10; //计数器字节数,10个字节用来保存计数码
10         private static int workerIdShift = sequenceBits; //机器码数据左移位数,就是后面计数器占用的位数
11         private static int timestampLeftShift = sequenceBits + workerIdBits; //时间戳左移动位数就是机器码和计数器总字节数
12         public static long sequenceMask = -1L ^ -1L << sequenceBits; //一微秒内可以产生计数,如果达到该值则等到下一微妙在进行生成
13         private long lastTimestamp = -1L;
14 
15         /// 
16         /// 机器码
17         /// 
18         /// 
19         public SnowflakeIdWorker()
20         {
21             long workerId = 1;
22             if (workerId > maxWorkerId || workerId < 0)
23                 throw new Exception(string.Format("worker Id can't be greater than {0} or less than 0 ", workerId));
24             SnowflakeIdWorker.workerId = workerId;
25         }
26 
27         public long NextId()
28         {
29             lock (this)
30             {
31                 long timestamp = timeGen();
32                 if (this.lastTimestamp == timestamp)
33                 { //同一微妙中生成ID
34                     SnowflakeIdWorker.sequence = (SnowflakeIdWorker.sequence + 1) & SnowflakeIdWorker.sequenceMask; //用&运算计算该微秒内产生的计数是否已经到达上限
35                     if (SnowflakeIdWorker.sequence == 0)
36                     {
37                         //一微妙内产生的ID计数已达上限,等待下一微妙
38                         timestamp = tillNextMillis(this.lastTimestamp);
39                     }
40                 }
41                 else
42                 { //不同微秒生成ID
43                     SnowflakeIdWorker.sequence = 0; //计数清0
44                 }
45                 if (timestamp < lastTimestamp)
46                 { //如果当前时间戳比上一次生成ID时时间戳还小,抛出异常,因为不能保证现在生成的ID之前没有生成过
47                     throw new Exception(string.Format("Clock moved backwards.  Refusing to generate id for {0} milliseconds",
48                         this.lastTimestamp - timestamp));
49                 }
50                 this.lastTimestamp = timestamp; //把当前时间戳保存为最后生成ID的时间戳
51                 long nextId = (timestamp - twepoch << timestampLeftShift) | SnowflakeIdWorker.workerId << SnowflakeIdWorker.workerIdShift | SnowflakeIdWorker.sequence;
52                 return nextId;
53             }
54         }
55 
56         /// 
57         /// 获取下一微秒时间戳
58         /// 
59         /// 
60         /// 
61         private long tillNextMillis(long lastTimestamp)
62         {
63             long timestamp = timeGen();
64             while (timestamp <= lastTimestamp)
65             {
66                 timestamp = timeGen();
67             }
68             return timestamp;
69         }
70 
71         /// 
72         /// 生成当前时间戳
73         /// 
74         /// 
75         private long timeGen()
76         {
77             return (long)(DateTime.UtcNow - new DateTime(1970, 1, 1, 0, 0, 0, DateTimeKind.Utc)).TotalMilliseconds;
78         }
79     }

调用时:

SnowflakeIdWorker snowflakeIdWorker = new SnowflakeIdWorker();

ID= snowflakeIdWorker.NextId().ToString();

id