prometheus 服务发现原理_每日热议
服务发现
概述
如上图,Prometheus核心功能包括服务发现、数据采集和数据存储。服务发现模块专门负责发现需要监控的目标采集点(target
)信息,数据采集模块从服务发现模块订阅该信息,获取到target
信息后,其中就包含协议(scheme
)、主机地址:端口(instance
)、请求路径(metrics_path
)、请求参数(params
)等;然后数据采集模块就可以基于这些信息构建出一个完整的Http Request
请求,定时通过pull http
协议不断的去目标采集点(target
)拉取监控样本数据(sample
);最后,将采集到监控样本数据交由TSDB
模块进行数据存储。
为什么需要服务发现模块?
类似于微服务通过引入注册中心组件解决众多微服务间错综复杂的依赖调用。无论是服务主动停止,意外挂掉,还是因为流量增加对服务实现进行扩容,这些服务数据或状态上的动态变化,通过注册中心屏蔽服务状态变更造成的影响,简化了调用方处理逻辑。
同理,Prometheus
最开始设计是一个面向云原生应用程序的,云原生、容器场景下按需的资源使用方式对于监控系统而言就意味着没有了一个固定的监控目标,所有的监控对象(基础设施、应用、服务)都在动态的变化。Prometheus
解决方案就是引入一个中间的代理人,这个代理人掌握着当前所有监控目标的访问信息,Prometheus
只需要向这个代理人询问有哪些监控目标即可,这种模式被称为服务发现(service discovery
)。
【资料图】
目前,Prometheus
支持的服务发现协议是非常丰富的,最新版本(2.41
)已支持接近三十种服务发现协议:
服务发现配置解析
1、Prometheus
服务启动加载prometheus.yml
配置文件会被解析Config
结构体:
❝
Config
结构体是配置类的最顶层结构,内部包含6个字段分别对应prometheus
配置的6大组成部分。
❞
2、其中数据采集配置部分ScrapeConfigs
对应的是一个*ScrapeConfig类型
切片,一个ScrapeConfig
对应的是scrape_configs
配置下的一个job
抓取任务,服务发现协议配置对应其中ServiceDiscoveryConfigs
字段:
3、discovery.Configs
对应的是Config
切片:
type Configs []Config
所以,一个job
抓取任务下可以配置多个服务发现协议,如:
- job_name: "prometheus" metrics_path: /metrics static_configs: - targets: ["124.222.45.207:9090"] file_sd_configs: - files: - targets/t1.json - targets/t2.json refresh_interval: 5m
4、Config
是一个接口:
Config
是一个接口的定义,每种服务发现协议都会存在一个对应Config
接口的实现(见下图)。该接口主要定义两个方法:
1、Name() string:定义服务发现协议类型,如eureka、kubernetes等等;2、NewDiscoverer(DiscovererOptions) (Discoverer, error):返回一个Discoverer类型变量,该类型也是一个接口,其只定义了一个方法Run方法,即Discoverer是对应的服务发现协议具体运行逻辑封装,通过Run方法提供统一的运行入口。
服务发现核心原理
说明:
Prometheus
服务发现核心逻辑的入口主要关注Manager
结构体的ApplyConfig
方法:基于服务发现的配置使其生效;
ApplyConfig
方法包括四个主要步骤:
type provider struct { name string d Discoverer subs []string config interface{}}
❝一个job下一个服务发现协议对应一个Discoverer。❞
provider
还有额外三个字段:
1、name
:provider
名称,格式:fmt.Sprintf("%s/%d", typ, len(m.providers))
;
2、subs
:string
切片,存放job
名称,因为可能不同job
下存在一致的服务发现配置,就只会生成一个provider
,然后subs
存放job
列表;
3、config
:服务发现配置
Discoverer
接口Run
方法,让服务发现逻辑运行;协程中运行updater
方法;Discoverer
接口Run
方法主要基于具体服务发现协议发现target
,然后通过通道传递给updater
处理逻辑,将其解析处理放入到Manager
结构体中targets
字段中,并向triggerSend
通道发送信号,表示当前targets
发生变更;Manager
结构体sender
方法每5秒监听triggerSend
通道信号,并将Manager
结构体中targets
字段处理后放入到syncCh
通道中;数据采集模块(scrape
)监听syncCh
通道,就可以获取到服务发现生成的targets
信息,然后reload
将target
纳入监控开始抓取监控指标。启动provider
:遍历Manager
结构体中providers
切片,启动每个provider
,该步骤主要是启动两个协程:❝Manager
结构体sender
方法是在Prometheus
启动时discoveryManagerScrape.Run()
方法中启动。❞取消服务发现:配置变更也会调用ApplyConfig
方法,这时就要把基于之前配置运行的服务发现服务取消,然后基于当前配置重新生成;清空:主要清空discoverCancel
、targets
和providers
几个容器元素,因为要基于当前配置重新生成;注册provider
:provider
是对Discoverer
的封装,不同服务发现协议都会实现Config
接口,其中NewDiscoverer
方法就是创建Discoverer
「Prometheus服务发现核心就是三个协程之间协作:」
「协程1:」负责运行Discoverer
接口Run
方法,基于协议发现采集点;「协程2:」负责将协程1发现的采集点信息更新到Manager
结构体中targets
字段的map
中;「协程3:」负责将Manager
结构体中targets
字段的数据通过通道发送给scrape
模块;scrape模块获取到采集点如何进行数据采集后续scrape模块分析。
监控指标
Prometheus
服务发现通用指标主要有如下5个,都定义在discovery/manager.go
中:
prometheus_sd_discovered_targetsprometheus_sd_failed_configsprometheus_sd_received_updates_totalprometheus_sd_updates_delayed_totalprometheus_sd_updates_total
「1、采集点数量指标」
服务发现主要基于协议发现采集目标,prometheus_sd_discovered_targets
指标反馈各个job
发现的采集目标数:
prometheus_sd_discovered_targets:gauge类型,当前发现的目标数config:job名称name:取值scrape和notify,区分指标抓取服务发现还是告警通知服务发现示例:prometheus_sd_discovered_targets{config="auth_es1", name="scrape"} 12
❝这里基于协议发现的目标数,还未进入采集模块,并不能区分是在线还是离线。❞
「2、服务发现协议异常错误指标」
服务发现会给每个发现配置项生成一个provider
,并为每个provider
使用协程运行,如果基于配置项生成provider
错误就可以通过prometheus_sd_failed_configs
指标反馈:
prometheus_sd_failed_configs:gauge类型,当前无法加载的服务发现配置数配置数:一个job可能存在多个服务发现协议配置,对应配置项则是多个示例:prometheus_sd_failed_configs{name="scrape"} 10prometheus_sd_failed_configs{name="notify"} 5
一个job
可能对应多个服务发现配置项,如下:这个job
下配置了static_configs
和file_sd_configs
两个服务发现协议配置,则对应两个服务发现配置项,注册两个provider
,每个provider
在独立协程中运行:
scrape_configs: # The job name is added as a label `job=` to any timeseries scraped from this config. - job_name: "test" static_configs: - targets: ["localhost:9090"] file_sd_configs: - refresh_interval: 5m files: - targets/manual.*.json
「3、协程交互指标」
服务发现主要涉及3类协程:
Discoverer协程
(多个):封装provider
,基于协议发现采集点,这里可能会存在多个,一个provider
对应一个Discoverer协程
;updater协程
(1个):Discoverer协程
发现采集点,通过channel通道
通知到updater协程
,updater协程
将采集点更新到Manager结构体
中targets字段
中,然后向Manager结构体
中triggerSend通道
写入数据,告诉sender
协程targets
有更新;sender协程
(1个):sender协程
每5秒检测triggerSend
通道数据,检测到更新则将Manager
结构体targets
数据处理封装写入到Manager
结构体syncCh
通道中,scrape
模块监测该通道,即完成将服务发现模块
和scrape模块
交互。这其中涉及三个指标:
prometheus_sd_received_updates_totalprometheus_sd_updates_delayed_totalprometheus_sd_updates_total
关键词:
-
prometheus 服务发现原理_每日热议
2023-03-23 -
以数字化赋能欠薪治理 重庆上线运行“渝薪码” 环球速看
2023-03-23 -
【全球时快讯】沥青是什么原材料做的_沥青是什么
2023-03-23 -
什么叫辐照电缆_辐照电缆是怎么回事 工作原理是 当前焦点
2023-03-23 -
Apollo实现cron语句的热配置 世界视讯
2023-03-22 -
什么是美瞳 全球快看
2023-03-22 -
因为有了期盼800字作文_因为有了期盼作文600字
2023-03-22 -
世界即时看!快捷指令怎么关闭弹窗(快捷键关闭窗口)
2023-03-22 -
邓超演过的电视剧 环球通讯
2023-03-22 -
定增补流案例日渐增多 大股东及关联方包销成亮点
2023-03-22 -
沃尔特李普曼(李普曼)
2023-03-22 -
“五一”假期出境游旺销 部分热门线路跟团游名额所剩无几
2023-03-22 -
新野县先进制造业开发区管委会:以学促干转作风|每日速读
2023-03-22 -
被飞蚁咬了后有毒吗_被飞蚁咬了后会怎么样 全球实时
2023-03-22 -
4月19日美国北卡罗来纳州疫情最新数据统计公布-天天视讯
2023-03-22 -
全球球精选!百纳千成(300291):股票交易异常波动,不存在应披露而未披露的重大信息说明
2023-03-22 -
全球焦点!*ST海伦: 2022年度独立董事述职报告(吕民远)
2023-03-21 -
全球报道:舒波-莫廷因背部有伤,将缺席本月喀麦隆国家队的两场比赛
2023-03-21 -
焦点快报!低至白菜价!一线1TB M.2固态硬盘跌破300元大关
2023-03-21 -
安宁区完善“一房两站”融合发展医养服务模式 环球报资讯
2023-03-21 -
自闭症儿童为何越来越多?怎么让孩子远离“它”|焦点报道
2023-03-21 -
比喻句和拟人句的区别_比喻句拟人句练习题
2023-03-21 -
电动重卡市场有望迎井喷 每日看点
2023-03-21 -
山口千枝
2023-03-21 -
全球热推荐:滨海港站_关于滨海港站介绍
2023-03-21 -
预缴增值税计算公式表格_预缴增值税计算公式 天天观焦点
2023-03-20 -
绘好“春耕图”,播种“新希望”!定南县2023年粮食生产奖补政策来啦!|世界播资讯
2023-03-20 -
没有副作用的睡眠药有哪些_睡眠药有哪些 焦点日报
2023-03-20 -
安全生产企业“行”|开展应急演练 保障转油站管线安全
2023-03-20 -
2023清明期间中山市殡仪馆咨询电话
2023-03-20
-
守住网络直播的伦理底线
2021-12-16 -
石窟寺文化需要基于保护的“新开发”
2021-12-16 -
电影工作者不能远离生活
2021-12-16 -
提升隧道安全管控能力 智慧高速让司乘安心
2021-12-16 -
人民财评:提升消费体验,服务同样重要
2021-12-16 -
卫冕?突破?旗手?——武大靖留给北京冬奥会三大悬念
2021-12-16 -
新能源车险专属条款出台“三电”系统、起火燃烧等都可保
2021-12-16 -
美术作品中的党史 | 第97集《窗外》
2021-12-16 -
基金销售业务违规!浦发银行厦门分行等被厦门证监局责令改正
2021-12-16 -
保持稳定发展有支撑——从11月“成绩单”看中国经济走势
2021-12-16