手机短信里的短链接是如何设计与实现的
手机短信里的短链接是如何设计与实现的
在日常生活中,我们经常会收到包含短链接的短信,这些短链接虽然简短,但却能准确地跳转到对应的页面。那么,这些短链接究竟是如何设计与实现的呢?本文将为你详细解析短链接的技术原理。
短链接的优势
短链接具有以下优势:
- 简洁性:短信和许多平台(如微博)都有字数限制,使用短链接可以节省空间,避免正文内容被挤占。
- 美观性:相比冗长的URL参数,短链接更加简洁友好。
- 统计分析:通过短链接可以方便地进行点击统计和分析。
- 安全性:不暴露具体的访问参数,提高安全性。
这也是为什么现在收到的垃圾短信大多数都使用短URL的原因。
短链接的工作原理
短URL从生成到使用主要分为以下几个步骤:
- 有一个服务,将要发送给你的长URL对应到一个短URL上。例如:
www.baidu.com
->www.t.cn/1
- 将短URL拼接到短信等的内容上发送。
- 用户点击短URL,浏览器用301/302进行重定向,访问到对应的长URL。
- 展示对应的内容。
服务设计详解
对应关系存储
这个对应数据肯定是要落盘的,不能每次系统重启就重新排号,所以可以采用MySQL等数据库来存储。而且如果数据量小且QPS低,直接使用数据库的自增主键就可以实现。
如何保证长短链接一一对应
按照上面的发号器策略,是不能保证长短链接一一对应的,你连续用同一个URL请求两次,结果值都是不一样的。为了实现长短链接一一对应,我们需要付出很大的空间代价,尤其是为了快速响应,我们可以需要在内存中做一层缓存,这样子太浪费了。但是可以实现一些变种的,来实现部分的一一对应,比如将最近/最热门的对应关系存储在K-V数据库中,这样子可以节省空间的同时,加快响应速度。
短URL的存储
我们返回的短URL一般是将数字转换成32进制,这样子可以更加有效的缩短URL长度,那么32进制的数字对计算机来说只是字符串,怎么存储呢?直接存储字符串对等值查找好找,对范围查找等太不友好了。其实可以直接存储10进制的数字,这样不仅占用空间少,对查找的支持较好,同时还可以更加方便的转换到更多/更少的进制来进一步缩短URL。
高并发处理
如果直接存储在MySQL中,当并发请求增大,对数据库的压力太大,可能会造成瓶颈,这时候是可以有一些优化的。
- 缓存:可以将热门的长链接(需要对长链接进来的次数进行计数),最近的长链接(可以使用Redis保存最近一个小时的)等等进行一个缓存,保存在内存中或者类似Redis的内存数据库中,如果请求的长URL命中了缓存,那么直接获取对应的短URL进行返回,不需要再进行生成操作。
- 批量发号:每一次发号都需要访问一次MySQL来获取当前的最大号码, 并且在获取之后更新最大号码,这个压力是比较大的。我们可以每次从数据库获取10000个号码,然后在内存中进行发放,当剩余的号码不足1000时,重新向MySQL请求下10000个号码。在上一批号码发放完了之后,批量进行写入。这样可以将对数据库持续的操作移到代码中进行,并且异步进行获取和写入操作,保证服务的持续高并发。
分布式设计
上述设计的系统具有单点,即发射机为单点,易于挂断。可以采用分布式服务。如果是分布式的,如果每个发送方在发送信号后需要与其他发送方同步,可能不会太麻烦。另一种思考方式是,可以有两个信号发生器,一个是单数,另一个是双数。数字发布后,不再增加1,而是增加2。通过类比,我们可以使用1000个服务分别发布0-999个尾数的数字,每次发布后增加1000个。这非常简单。服务之间基本上没有通信。做你自己的。