flink

今年的双11，实时计算处理的流量洪峰创纪录地达到了每秒40亿条的记录，数据体量也达到了惊人的每秒7TB，基于Flink的流批一体数据应用开始在阿里巴巴最核心的数据业务场景崭露头角，并在稳定性、性能和...

3年前

630

数据仓库是公司数据发展到一定规模后必然需要提供的一种基础服务，也是“数据智能”建设的基础环节。迅速获取数据反馈不仅有利于改善产品及用户体验，更有利于公司的科学决策，因此获取数据的实时性尤为重要。目前企...

3年前

370

对于流查询，Regular Join 的语法是最灵活的，它允许任何类型的更新(插入、更新、删除)输入表。,Regular Join 包含以下几种（以 L 作为左流中的数据标识，R 作为右流中的数据标识...

3年前

140

“ From 开发者：“ flink关于java和scala开发，总是搞不清maven依赖什么情况，能不能讲下？知道flink是在java上面包裹了一层scala，但是添加maven依赖的时候，总是很...

4年前

220

对大部分用户来说，为 Flink 算子配置合适的并行度并不是一件容易的事。对于批作业，小的并行度会导致作业运行时间长，故障恢复慢，而不必要的大并行度会导致资源浪费，任务部署和数据 shuffle 开销...

4年前

320

【Flink 1.10】- 有一种情况是所有的系统或应用之间的桥梁都是Kafka，而这个时候恰恰是上游需要做Unbound的聚合统计。From @PyFlink 企业用户。,示例代码：,执行这个SQL...

4年前

160

Flink和Strom都是时下较为流行的数据流平台，考虑以下一种应用场景：已经使用Strom完成了对于某一逻辑功能的开发，如果现在期望使用Flink实现相同的逻辑，那么就需要考虑如何使用Flink来对...

5年前

290

Apache Flink 在进行Streaming计算时为什么需要时间？回答这个问题我们先看看Streaming和Batch的一个明显区别，即从数据集的角度看，Streaming是一个Unbound...

5年前

1490

添加应用