?一讲到IM,我们就会想到微信、QQ这样的即时聊天系统,那么一个聊天系统都有哪些构成要素,一个完整的IM系统又是什么样的?
一、IM系统架构
我们可以从使用者和开发者的两个角度来看一下
1、使用者眼中的聊天系统
?一个简单的聊天系统大概由一下元素组成:用户账号、账号关系、联系人列表、消息、聊天会话,如下图所示:
需要一个用户账号给用户提供唯一标识;
账号与账号之间通过某种方式(好友、互粉、同一个群组成员)构成关系链;
可以主动选择一个联系人进行聊天互动的联系人列表;
在聊天互动环节产生了消息;
聊天互动消息组成了聊天会话。
2、开发者眼中的聊天系统
聊天系统大概由这几大部分组成:客户端、接入服务、业务处理服务、存储服务和外部接口服务。
客户端。用户用于收发消息的终端设备,用来承载用户的互动请求和消息接收功能
接入服务。 接入服务主要包括四块功能:连接保持、协议解析、Session维护和消息推送.
业务处理服务。比如存储处理、消息同步、离线消息、历史消息、未读消息、撤回、翻译、群组、好友等逻辑,业务处理服务是整个IM系统的中枢大脑。
存储服务。账号信息、聊天消息记录、关系链进行持久化。
外部接口服务。如为提升用户体验,希望APP未打开时,也能在手机系统通知栏收到新消息展示或提醒。苹果需要接入APNs (Apple Push Notification service)服务,安卓的 GCM(Google Cloud Messaging )服务,GCM服务在国内无法使用,所以安卓都是接入各手机厂商相应系统推送服务。
二、IM 系统有哪些特性?
? 根据IM系统所适用的业务场景需求,IM系统有别于其他业务系统的四大特性:
? ? ? ? 实时性、可靠性、一致性、安全性。
1、实时性
? ? ? 对于一个即时消息系统,“实时性”是这个系统的基本要求。聊天如果对方半天才收到,基本上就聊不下去了。直播场景下,如果主播互动消息房间里的粉丝要等很久时间才能收到,那很难让粉丝有积极参与的欲望。
? ? ? 如何解决消息实时到达的问题?
?(1)基于Http 的短轮询
主要问题:为了提升实时性,短轮询的频率一般比较高,大量无用请求,费电又费流量
(2)基于Http的长轮询,服务器会悬挂等待一段时间,如果在等待的这段时间内有新消息产生,就能马上响应返回。
如果超时时间内没有获取到消息时,会结束返回,任然没有解决客户端无效请求问题,做不到”边缘触发“。
因为基于Http,Http 是无状态协议,不会记录客户端连接信息,是基早起Http1.0版本或现有普遍使用的Http1.1协议版本,所以做不到服务端推送。?
(3) 基于TCP长连接IM协议
?? ? ? 长连接,全双工彻底解决无效请求、服务器推送的问题。
?? ? ? WebSocket协议,XMPP协议, MQTT协议, 各种基于TCP的私有协议。
2、可靠性
?? ? 如果说” 实时性“是即时消息被广泛应用于社交、互动领域的基本前置条件,那么消息可靠性则是实时消息服务可以“被信赖”的另一个重要特性.
? ? ? 可靠性主要包括两个方面:不丢消息、消息不重复。
?? ? ? 那么如果保证消息的可靠投递?
? ? ? 假设一个场景:
用户A发送消息到IM服务器,服务器暂存消息,然后返回成功的结果给发送方A(步骤1、2、3)
IM服务器将暂存的消息推送给接收方A(步骤4)
? ? 一方面消息可能因为网络原因送达失败,如消息在中间网络层途中被某些中间设备丢掉了,TCP层还一直重传不成功,软件逻辑偶现异常,收到消息后不能正常处理,硬件设备突然掉电等。
以下消息可能出现失败的情况:
? ? A发出消息到IM服务器,消息送达失败;
? ? IM服务器响应消息送达失败;
? ? IM服务器推送给B的消息送达失败;
? ? B成功接收到IM服务器消息,响应消息送达失败。
以上问题通过:ACK+超时重传+去重,即可解决大部分用户在线消息丢失问题。
举一种极端情况,多种情况同时出现如:IM服务器推送消息出去后,由于硬件原因宕机了,而消息又丢失了,此时无法出发点重传,导致接收方B收不到这条消息。
解决方法:消息完整性检查。
IM服务器推送消息时带上时间戳,B更新本地时间戳。 重新上线时携带本地时间戳,IM服务器对比时间戳判断是否补发消息。?
3、一致性
消息的一致性一般是指:同一条消息,在多人、多终端需要保证展现顺序的一致性。?
对于单聊场景,一致性是指希望发送方的消息发送顺序和接收方的收发顺序保持一致。
对于群聊,我们希望群里每一个人接受到的消息顺序都是一致的;对于同一个用户的多台终端设备,我们希望发送给这个用户的消息在多台设备上也能保持一致性。
?? ? 缺乏一致性会导致双方沟通过程中出现“奇妙的误会”,一致性也是考验IM系统的重要指标。
? ? 那么如何保证消息不会乱序?
? ? ? ? 保证消息的时序一致性的关键问题是找到一个”时间基准”,如服务端通过“全局序号生成器”分配时间。
?? ? ? IM服务器通常是集群化部署,每台服务器的机器性能存在差异,先收到的消息不一定先推送到接收方,所以还需要整流。?
4、安全性
?? ? ? IM被广泛应用各种私密社交,因此用户对于系统的隐私保护要求也相对较高。从系统使用安全性的角度来看,首先要求数据传输安全,其次要求数据存储安全,最后是消息内容安全。
? ? ? 那么如何保证系统的安全性?
? ? ? 数据传输安全:传输过程被截获、篡改、伪造,消息采用私有协议, TLS 技术。TLS巧妙地把“对称加密”“非对称加密”“秘钥交换算法”“数字签名证书”“CA 认证”进行结合,有效地解决了消息传输过程中的截获、篡改、伪造问题。微信自行实现了“基于 TLS1.3 的 MMTLS 协议”来?;は⒋渲械陌踩?。
? ? ? 数据存储安全:为防止隐私泄漏,最安全的方式就是,服务端除了暂存漫游和离线消息,不做其它存储。然后采用“端对端加密”,通信双方各自生成密钥对并交换公钥,使用接收方的公钥进行加密传输。据说WhatsApp、Telegram 就采用了端到端加密,国内的大部分即时消息软件如 QQ、微信等由于网络安全要求,暂时未采用。
?? ? 消息内容安全性: 建立敏感词库,针对文字内容进行安全识别,图片识别技术识别色情图片、广告图片、涉政图片,通过爬虫对外链内容进行分析识别风险外链。
除了以上四大特性,作为一个高频使用的系统,还需要考虑节能省电、省流量这些性能指标。