今天这篇文章来介绍一下Nacos配置中心的原理之一:长轮询机制的应用,为方便理解与表达,这里把 Nacos 控制台和 Nacos 注册中心称为 Nacos 服务器(就是 web 界面那个),我们编写的业务服务称为 Nacso 客户端;,Nacos 动态监听的长轮询机制原理图,本篇将围绕这张图剖析长轮询定时机制的原理:,
,ConfigService 是 Nacos 客户端提供的用于访问实现配置中心基本操作的类,我们将从 ConfigService 的实例化开始长轮询定时机制的源码之旅;,我们从NacosPropertySourceLocator.locate()开始【断点步入】:,
,客户端的长轮询定时任务是在 NacosFactory.createConfigService() 方法中,构建 ConfigService 对象实例时启动的,我们接着 1.1 处的源码;,进入 NacosFactory.createConfigService():,进入 ConfigFactory.createConfigService(),发现其使用反射机制实例化 NacosConfigService 对象;,
,进入 NacosConfigService.NacosConfigService() 构造方法,里面设置了一些更远程任务相关的属性;,
,1.2.1 初始化 HttpAgent,MetricsHttpAgent 类的设计如下:,
,ServerHttpAgent 类的设计如下:,
,1.2.2 初始化 ClientWorker,进入 ClientWorker.ClientWorker() 构造方法,主要是创建了两个定时调度的线程池,并启动一个定时任务;,
,进入 ClientWorker.checkConfigInfo(),每隔 10s 检查一次配置是否发生变化;,
,因为我们没有这么多配置项,debug 不进去,所以直接找到 LongPollingRunnable.run() 方法,该方法的主要逻辑是:,根据 taskld 对 cacheMap 进行数据分割;,再通过checkLocalConfig() 方法比较本地配置文件(在${user}\nacos\config\ 里)的数据是否存在变更,如果有变更则直接触发通知;,注意:这里的断点需要在 Nacos 服务器上修改配置(间隔大于 30s),进入后才好理解;,1.3.1 检查配置变更 ClientWorker.checkUpdateDataIds(),我们点进 ClientWorker.checkUpdateDataIds() 方法,发现其最终调用的是 ClientWorker.checkUpdateConfigStr() 方法,其实现逻辑与源码如下:,1.3.2 读取变更配置 ClientWorker.getServerConfig(),进入 ClientWorker.getServerConfig() 方法;读取服务器上的变更配置;最终调用的是 MetricsHttpAgent.httpGet() 方法(上面 1.2.1 有提到),调用 /v1/cs/configs 接口获取配置;然后通过调用 LocalConfigInfoProcessor.saveSnapshot() 将变更的配置保存到本地;,
,
,Nacos客户端 通过 HTTP 协议与服务器通信,那么在服务器源码里必然有对应接口的实现;,在 nacos-config 模块下的 controller 包,提供了个 ConfigController 类来处理请求,其中有个 /listener 接口,是客户端发起数据监听的接口,其主要逻辑和源码如下:,
,vletInner.doPollingConfig(),进入 ConfigServletInner.doPollingConfig() 方法,该方法封装了长轮询的实现逻辑,同时兼容短轮询逻辑;,
,进入 LongPollingService.addLongPollingClient() 方法,里面是长轮询的核心处理逻辑,主要作用是把客户端的长轮询请求封装成 ClientPolling 交给 scheduler 执行;,
,我们找到 ClientLongPolling.run() 方法,这里可以体现长轮询定时机制的核心原理,通俗来说,就是:,服务端收到请求之后,不立即返回,没有变更则在延后 (30-0.5)s 把请求结果返回给客户端;,这就使得客户端和服务端之间在 30s 之内数据没有发生变化的情况下一直处于连接状态;,
,2.4.1 监听 LocalDataChangeEvent 事件的实现,当我们在 Nacos 服务器或通过 API 方式变更配置后,会发布一个 LocalDataChangeEvent 事件,该事件会被 LongPollingService 监听;,这里 LongPollingService 为什么具有监听功能在 1.3.1 版本后有些变化:,在 Nacos 1.3.1 版本之前,通过 LongPollingService 继承 AbstractEventListener 实现监听,覆盖 onEvent() 方法;,
,而在 1.3.2 版本之后,通过构造订阅者实现,
,效果是一样的,实现了对 LocalDataChangeEvent 事件的监听,并通过通过线程池执行 DataChangeTask 任务;,2.4.2 监听事件后的处理逻辑 DataChangeTask.run(),我们找到 DataChangeTask.run() 方法,这个线程任务实现了,
,Nacos 服务器上的配置发生变更后,发布一个 LocalDataChangeEvent 事件;,Subscriber.onEvent() :监听 LocalDataChangeEvent 事件(1.3.2 版本后);
© 版权声明
文章版权归作者所有,未经允许请勿转载。