当前位置：首页 > 机器学习 > 正文

flink 分流操作

编辑小哥S
机器学习
2024-06-20 06:39:23
21

文章阐述了关于flink分布式机器学习，以及flink 分流操作的信息，欢迎批评指正。

简述信息一览：

1、Flink:特性、概念、组件栈、架构及原理分析
2、flink流处理特点
3、Flink架构、原理
4、大运算时计算处理

Flink:特性、概念、组件栈、架构及原理分析

组件栈 Flink是一个分层架构的系统，每一层所包含的组件都提供了特定的抽象，用来服务于上层组件。

Flink从另一个视角看待流处理和批处理，将二者统一起来：Flink是完全支持流处理，也就是说作为流处理看待时输入数据流是***的；批处理被作为一种特殊的流处理，只是它的输入数据流被定义为有界的。

（图片来源网络，侵删）

对于分析类任务，Flink提供了类似SQL的查询，图形化处理，以及机器学习库，此外还支持内存计算。Flink能很好地与其他组件配合使用。如果配合Hadoop 堆栈使用，该技术可以很好地融入整个环境，在任何时候都只占用必要的资源。该技术可轻松地与YARN、HDFS和Kafka 集成。

flink流处理特点

1、Flink框架的主要特点包括：流处理：Flink是一个流处理引擎，专门为处理连续、动态的数据流而设计。这意味着它可以实时分析大量的数据流，而无需等待数据的完整批次。这使得Flink在各种实时应用中非常有用，如实时分析、预测分析和异常检测。

2、Flink流处理特性：Flink以层级式系统形式组件其软件栈，不同层的栈建立在其下层基础上，并且各层接受程序不同层的抽象形式。

（图片来源网络，侵删）

3、Flink在实现流处理和批处理时，与传统的一些方案完全不同，它从另一个视角看待流处理和批处理，将二者统一起来：Flink是完全支持流处理，也就是说作为流处理看待时输入数据流是***的；批处理被作为一种特殊的流处理，只是它的输入数据流被定义为有界的。

4、Flink流处理特性： Flink以层级式系统形式组件其软件栈，不同层的栈建立在其下层基础上，并且各层接受程序不同层的抽象形式。

Flink架构、原理

在Flink整个软件架构体系中，统一遵循了分层的架构设计理念，在降低系统耦合度的同时，为上层用户构建Flink应用提供了丰富且友好的接口。整个Flink的架构体系可以分为三层：Deployment层：该层主要涉及了Flink的部署模式，Flink支持多种部署模式：本地、集群（Standalone/YARN），云（GCE/EC2），Kubernetes等。

当用户提交一个Flink程序时，会首先创建一个Client，该Client首先会对用户提交的Flink程序进行预处理，并提交到Flink集群中处理，所以Client需要从用户提交的Flink程序配置中获取JobManager的地址，并建立到JobManager的连接，将Flink Job提交给JobManager。

Flink***用Master-Slave架构，其中JobManager作为集群Master节点，主要负责任务协调和资源分配，TaskWorker作为Salve节点，用于执行流task。除了JobManager和TaskManager，还有一个重要的角色就是Client。Client虽然不是Flink Cluster 运行态的一部分，但也是Flink重要组件之一，用来提交流任务。