大数据

【喜讯】Apache DolphinScheduler 荣获 “2020 年度十大开源新锐项目”

经 10000+ 开发者公开票选，20+专家评审、 10+ 主编团打分，历经数月打磨，11 月 19 日，由InfoQ 发起并组织的【2020中国技术力量年度榜单评选】结果正式揭晓。

Java 面向对象知识整理

本篇主要对 Java 面向对象会用到的知识进行整理，从类到对象再到面向对象的三要素，最后介绍接口和 Package 知识。

分分钟玩转SpringBoot自定义注解

在工作中，我们有时候需要将一些公共的功能封装，比如操作日志的存储，防重复提交等等。这些功能有些接口会用到，为了便于其他接口和方法的使用，做成自定义注解，侵入性更低一点。别人用的话直接注解就好。下面就来讲讲自定义注解这些事情。

Python 到底是强类型语言，还是弱类型语言？

我在上一篇文章中分析了为什么 Python 没有 void 类型的话题，在文章发布后，有读者跟我讨论起了另一个关于类型的问题，但是，我们很快就出现了重大分歧。

GrowingIO 大数据多维分析自动化测试实践

通过使用 parewise 对事件分析用例进行优化

GrowingIO 大数据多维分析自动化测试实践

通过使用 parewise 对事件分析用例进行优化

我们一起，盘点 2021 十大技术领域的全部精彩

2021 ，你所在的技术领域有哪些变化，又有哪些动态值得关注？

FusionInsight MRS：你的大数据“管家”

摘要：4月24日-26日，HDC.Cloud2021在深圳大学城成功举办，华为云FusionInsight MRS云原生数据湖带来最懂行的大数据解决方案，为政企客户提供湖仓一体、云原生的大数据解决方案，一个架构可构建3种数据湖：离线数据湖、实时数据湖、逻辑数据湖，更有

面试官竟然一直和我聊线程的启动和终止

在运行线程之前首先要构造一个线程对象，java.Lang.Thread中为我们提供了一个用于创建线程时的初始化方法。主要对线程中的属性进行初始化

面试官竟然一直和我聊线程的启动和终止

在运行线程之前首先要构造一个线程对象，java.Lang.Thread中为我们提供了一个用于创建线程时的初始化方法。主要对线程中的属性进行初始化

详解百度富媒体检索比对系统的关键技术

目前百度富媒体检索比对系统除了承接了百度FEED所有视频、图像的反作弊、下发去重以及关联推荐和黄反等业务，另外还支持了包括视频搜索、贴吧、文库在内的数十个业务方，支撑了千亿级数据规模。在数据规模、系统性能、召回率和准确度上都处于领先地位。

百度搜索稳定性问题分析的故事（下）

本文立足于大家所熟悉的百度搜索系统本身，为大家介绍其可用性治理中关于“稳定性问题分析”方面使用的精细技术，以历史为线索，介绍稳定性问题分析过程中的困厄之境、破局之道、创新之法。希望给读者带来一些启发，更希望能引起志同道合者的共鸣和探讨。

Zookeeper选举机制

通过源码的分析，了解zookeeper作为分布式协调服务，在集群部署下的选举流程

实时数据仓库的发展、架构和趋势

随着实时计算引擎的不断发展以及业务对于实时报表的产出需求不断膨胀，业界最近几年就一直聚焦并探索于两个相关的热点问题：实时数仓建设和大数据架构的批流一体建设。

Kafka系列9：面试题是否有必要深入了解其背后的原理？我觉得应该刨根究底（上）

面试题不应该只是简单背背答案而已

扎心！天天写代码，方向真的对吗？

“每个人的时间都是有限的，在有限的时间里选择一项值得投入的技术会变得尤为重要。”

扎心！天天写代码，方向真的对吗？

“每个人的时间都是有限的，在有限的时间里选择一项值得投入的技术会变得尤为重要。”

Kafka系列10：面试题是否有必要深入了解其背后的原理？我觉得应该刨根究底（下）

面试题不应该只是简单背背答案而已

Kafka系列第7篇：你必须要知道集群内部工作原理的一些事！

Partition如何分布到不同的Broker上，Broker宕机Partition依然可用背后的原理介绍。

Kafka系列8：一网打尽常用脚本及配置，宜收藏落灰！

一文总结常用脚本命令及常用配置

TensorFlow On Flink 原理解析

简介：本文将分享如何使用一套引擎搞定机器学习全流程的解决方案。先介绍一下典型的机器学习工作流程。如图所示，整个流程包含特征工程、模型训练、离线或者是在线预测等环节。

TensorFlow On Flink 原理解析

Kafka系列第6篇：消息是如何在服务端存储与读取的，你真的知道吗？

消息存储也就那点事儿，你确定不需要了解一下吗？

Flink 完美搭档：数据存储层上的 Pravega

本文将从大数据架构变迁历史，Pravega 简介，Pravega 进阶特性以及车联网使用场景这四个方面介绍 Pravega，重点介绍 DellEMC 为何要研发 Pravega，Pravega 解决了大数据处理平台的哪些痛点以及与 Flink 结合会碰撞出怎样的火花。

Flink 完美搭档：数据存储层上的 Pravega

数仓系列 | Flink 窗口的应用与实现

简介：本文根据 Apache Flink 系列直播整理而成，由 Apache Flink Contributor、OPPO 大数据平台研发负责人张俊老师分享。主要内容如下： 1. 整体思路与学习路径 2. 应用场景与编程模型 3. 工作流程与实现机制

数仓系列 | Flink 窗口的应用与实现

Kafka系列第5篇：一文读懂消费者背后的那点"猫腻"

图文并茂的方式来扒开Kafka消费端背后发生的那点猫腻。

Kafka系列第1篇：Kafka是什么？它能干什么？

kafka是什么？它能干什么？本篇文章我们来帮你解答这些疑问。

实时计算的业务劣势、思维误区和改进之道

实时计算的技术优势，反倒成为其业务劣势？为什么？如何破？本文不讨论技术细节，对数据业务感兴趣同学都建议一读。

实时计算的业务劣势、思维误区和改进之道

实时计算的技术优势，反倒成为其业务劣势？为什么？如何破？本文不讨论技术细节，对数据业务感兴趣同学都建议一读。

Apache Flink在 bilibili 的多元化探索与实践

本文由 bilibili 大数据实时平台负责人郑志升分享，本次分享核心讲解万亿级传输分发架构的落地，以及 AI 领域如何基于 Flink 打造一套完善的预处理实时 Pipeline。

Flink 与 Hive 的磨合期

有不少读者反馈，参考上篇文章《Hive 终于等来了 Flink》部署 Flink 并集成 Hive 时，出现一些 bug 以及兼容性等问题。虽已等来，却未可用。所以笔者增加了这一篇文章，作为姊妹篇。

Flink 与 Hive 的磨合期

Flink 1.10 Container 环境实战

简介：本文第一部分将简明扼要地介绍容器管理系统的演变；第二部分是 Flink on K8S 简介，包括集群的部署模式调度原理等等；第三部分是我们这一年以来关于 Flink on K8S 的实战经验分享，

其他标签

Elsewhere

返回顶部