Flink4:运行架构(运行时的组件和基本原理)

Flink运行架构主要涉及一下三个方面:
1.Flink运行时的组件
2.任务提交流程
3.任务调度流程

1. Flink运行时的组件

整体上分为四大组件:作业管理器、任务管理器、资源管理器、分发器,最重要的是前两个。而ResourceManger主要是负责整个系统的资源调度管理和分配的。另一个Dispacher,意思就是分发器。下面具体介绍这四大组件在运行时的功能

作业管理器(JobManager)

  1. 控制一个应用程序执行的主进程,也就是说,每个应用程序都会被一个不同的JobManager所控制执行。
  2. JobManager会先接收到要执行的应用程序,这个应用程序会包括:作业图(JobGraph)、逻辑数据流图(JobGraph)和打包了所有的类、库和其他资源的JAR包。
  3. JobManager会把JobGraph转换成一个物理层面的数据流图,这个图被叫做“执行图”(ExecutionGraph),包含了所有可以并发执行的任务。
  4. JobManager会向资源管理器(ResourceManager)请求执行任务必要的资源,也就是任务管理器(TaskManager)上的插槽(slot)。一旦它获取到了足够的资源,就会将执行图分发到真正运行它们的TaskManager上。而运行过程中,JobManager会负责所有需要中央协调的操作,比如说检查点(checkpoints)的协调

资源管理器(ResourceManager)

  1. 主要负责管理任务管理器(TaskManager)的插槽(slot),TaskManager插槽是Flink中定义的处理资源单元。
  2. Flink为不同的环境和资源管理工具提供了不同资源管理器,比如YARN、Mesos、K8s,以及standalone部署。
  3. 当JobManager申请插槽资源时,ResourceManager会将有空闲插槽的TaskManager分配给JobManager。如果ResourceManager没有足够的资源满足JobManager的请求,它还可以向资源提供平台发起会话,以提供启动TaskManager进程的容器。

分发器(Dispacher)

  1. 可以跨作业运行,它为应用提交提供了REST接口。
  2. 当一个应用被提交执行时,分发器就会启动并且将应用移交给一个JobManager。
  3. Dispacher也会启动一个Web UI,用来方便地展示和监控作业执行的信息。
  4. Dispacher在架构中可能并不是必需的,这取决于应用提交运行的方式。
2.任务提交流程和调度原理

standalone模式下的提交流程
具体来说,就是下面这张图:

  1. 首先 我们从客户端将整个应用的job通过rest接口提交给了Dispacher
  2. 然后Dispacher就会把这个应用交给了JobManager管理,并将JobManager进程启动起来。接下来的事情就和Dispacher没有关系了。Dispacher只是接受客户端用户请求,起到一个中间媒介的作用,通过这样一个借口实现跨平台提交任务。
  3. 接下来,JobManager拿到了这个应用之后,接下来做什么呢,它的操作是向ResourceManager申请资源
  4. ResourceManager拿到请求后,就会把TaskManager进程启动起来,然后TaskManager就会把空闲的slot在ResourceManager这里进行注册。知道有了这些空闲的slot之后,它就根据JobManager请求的数量,向TaskManager发出哪些slot需要提供的信息,让它提供出来,提供出来时,TaskManager这时就直接和JobManager进行通信了。
  5. TaskManager向TaskManager提供slots,JobManager就会给TaskManager分配要在slots里面执行的任务了。
  6. 最后,在执行任务的过程当中,不同的TaskManager之间还会有数据交换,所有的任务都在TaskManager中执行了。

Yarn模式下的提交流程
以上就是我们整个任务提交的一个流程。这是从比较高层次的角度来看的Flink提交流程,具体到我们一些应用的场合,例如Standalone模式,就基本和这个是差不多的。如果要是部署的集群环境不一样,例如yarn或kys,那么提交流程还会有所不同。下面是Yarn提交流程图:

  1. Yarn模式下,要提交一个任务,首先是客户端会将Flink的jar包和配置上传到HDFS上,上传完后,JobManager和TaskManager就可以共享了。
  2. 接下来做的事,还是客户端,会向ResourceManager提交Job,然后ResourceManager,就会去分配container资源和通知NodeManager启动一个ApplicationMaster
  3. ApplicationMaster被启动后,它就要启动JobManager了,启动过程:从HDFS上加载我们之前上传的jar包和配置,对应地把JobManager启动起来。
  4. JobManager被启动之后,它就会执行我们的作业图,它就知道我们当前所需要的资源,这时再返回来向ResourceManager申请资源。
  5. Yarn的ResourceManager得到请求之后,继续分配container资源,资源分配好了之后,就通知ApplicationMaster,由它去启动更多的TaskManager。
  6. TaskManager启起来之后,就会向JobManager发起心跳,接下来就等待JobManager给它分配任务了。

这就是Yarn模式下的任务提交流程。
任务提交后的Flink任务调度原理
下面是Flink任务调度原理


首先,我们可以从上图看到,有一个JobManager和两个TaskManager,我们知道,一般情况下JobManager做管理调度只有一个,而TaskManager干活的人有很多个。所以在任务调度过程中,主要是TaskManager,像Dispacher,ResourceManager这些在任务执行过程当中,就没有什么用了。在上图中,左边还有一处,就是我们写好的代码,红色部分就是要做的编译打包,首先就生成一个初始的流DataFlow Graph,有了这个以后,就通过我们的客户端client,提交给客户端也好、ResourceManager也好,最终都要给JobManager,给JobManager之后,左边部分就没有工作了。除了要取消任务、收到JobManager返回的统计信息等这些还是可以做交互的,任务执行部分就不作参与了。JobManager拿到传来的DataFlow Graph之后,就会把逻辑的数据流图,转换成最后能够执行的Execution Graph执行图。转换之后,就把转换后的它发送给所有的TaskManager,每一个TaskManager里的slot里Task并发执行。这就是执行的过程。执行过程中,JobManager也可以和TaskManager通信,比如JobManager向TaskManager发送执行、停止、取消一个任务、保存当前执行的快照等指令。

以上就是整个任务调度的一个过程,在这里面,还涉及到很多具体的过程,比如TaskManager里的slot到底是怎么处理的、不同的Task是怎么拆分、合并的、前面的逻辑的数据流图转换成最后能够执行的Execution Graph执行图的这个执行图又是怎么样的呢,这里也有一些具体的细节有待我们探讨。

最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事?!?“怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352

推荐阅读更多精彩内容