Bootstrap
大数据集群节点磁盘负载不均衡怎么办?

“大数据集群节点磁盘负载不均衡”的问题,相信大数据集群管理员并不陌生,本片文章,我们就简单分享下,如何应对上述问题。

跟我学丨如何用鲲鹏服务器搭建Hadoop全分布式集群

摘要:今天教大家如何利用鲲鹏服务器搭建Hadoop全分布式集群,动起来···

HDFS杂谈:ACL访问控制列表

HDFS ACL功能灵感来源于Linux ACL,可以在原有的权限控制模式额外对特定的用户或用户组添加权限

Flink,Spark,Storm,Hadoop框架比较

大数据分析作为一种用于分析大量按需数据的工具,越来越受到人们的欢迎。四个最常见的大数据处理框架包括Apache Hadoop,Apache Spark,Apache Storm和Apache Flink。

极客大学架构师训练营 大数据 GFS、MapReduce、BigTable,Hadoop HDFS Yarn Hive 第12次作业

笔者在一家成立于1885年的全球性跨国银行,用大数据处理的业务包括:分析出洗黑钱的用户,根据用户的存款和消费数据给用户信用评分,贷款的时候给出相应额度。

大数据培训:hadoop中shuffle过程面试题

​Shuffle阶段是指从Map的输出开始,包括系统执行排序以及传送Map输出到Reduce作为输入的过程。Sort阶段是指对Map端输出的Key进行排序的过程。大数据培训不同的Map可能输出相同的Key,相同的Key必须发送到同一个Reduce端处理。Shuffle阶段可以分为Map端的Shuf

面向对象的Python编程,你需要知道这些!

​​​​摘要:Python没有像 java 中的“private”这样的访问说明符。除了强封装外,它支持大多数与“面向对象”编程语言相关的术语。因此它不是完全面向对象的。

OOP面向对象编程(Object-Oriented Programming)概述

Java的编程语言是面向对象的,采用这种语言进行编程称为面向对象编程(Object-Oriented Programming, OOP)。

Python OOP-1

Python OOP-1

Python OOP-4

类的成员描述是为了在类中对类的成员属性进行相关操作而创建的一种方式

Python OOP-2

Python OOP-2

3.7亿条保单数据怎么分析?这个大数据平台有绝招

受到新冠疫情影响,全球经济面临冲击,国内经济已进入复工复产有序发展的新常态阶段,企业想要实现持续增长需另寻突破点,越来越多的企业把视线转向了企业内部,希望通过推进精细化管理来实现降本增效。

跟我学丨如何用鲲鹏服务器搭建Hadoop全分布式集群

摘要:今天教大家如何利用鲲鹏服务器搭建Hadoop全分布式集群,动起来···

大数据集群节点磁盘负载不均衡怎么办?

“大数据集群节点磁盘负载不均衡”的问题,相信大数据集群管理员并不陌生,本片文章,我们就简单分享下,如何应对上述问题。

UCloud一站式智能大数据平台USDP免费版正式发布!

近日UCloud全新发布了针对私有化部署场景下的一站式智能大数据平台USDP免费版。免费版USDP支持HDFS、Kudu、ES全生态,助力企业提升大数据开发、运维效率,快速构建大数据业务的分析处理能力。

大数据培训:Hadoop和MPP有什么区别

​Hadoop存储技术基于完全不同的方法。它不是根据某种密钥来分片数据,大数据培训而是将数据分块为固定大小(可配置)的块,然后在节点之间进行拆分。这些块很大,它们以及整个文件系统(HDFS)都是只读的。

HDFS/HBase技术报告·分布式数据库设计架构的深度解析

从广义的理解,分库分表的传统关系型数据库,传统关系型数据库集群,关系型数据库的主从架构,分布式KV数据库(例如:HBase),分布式文档数据库(例如:MongoDB),分布式关系数据库(例如:TiDB)等,统称为分布式数据库。

100万级车辆数据监控的hadoop大数据架构探索与实践

作者有幸在前些年主导并尝试使用hadoop大数据生态技术对传统车联网项目进行改造,取得了一些成果。本文对该项目进行复盘,聊聊大数据架构在车联网行业中的实践。

三大 OSS 缓存加速系统巅峰对决

在上篇文章 《OSS太慢?看我们怎么提速10倍!》中提到,JuiceFS 可以提高 OSS 在大数据场景下的性能 10 倍,当时有朋友在朋友圈建议我们用 JuiceFS 和类似的对象存储加速方案做一下比较。在花了一个月时间准备之后,有一些阶段性成果跟大家分享一下。

三大 OSS 缓存加速系统巅峰对决

在上篇文章 《OSS太慢?看我们怎么提速10倍!》中提到,JuiceFS 可以提高 OSS 在大数据场景下的性能 10 倍,当时有朋友在朋友圈建议我们用 JuiceFS 和类似的对象存储加速方案做一下比较。在花了一个月时间准备之后,有一些阶段性成果跟大家分享一下。

三大 OSS 缓存加速系统巅峰对决

在上篇文章 《OSS太慢?看我们怎么提速10倍!》中提到,JuiceFS 可以提高 OSS 在大数据场景下的性能 10 倍,当时有朋友在朋友圈建议我们用 JuiceFS 和类似的对象存储加速方案做一下比较。在花了一个月时间准备之后,有一些阶段性成果跟大家分享一下。

Hadoop集群搭建-03编译安装hadoop

Hadoop集群搭建-05安装配置YARN

Hadoop集群搭建-02安装配置Zookeeper

 这一篇接着记录集群搭建,开始安装配置zookeeper,它的作用是做集群的信息同步,zookeeper配置时本身就是一个独立的小集群,集群机器一般为奇数个,只要机器过半正常工作那么这个zookeeper集群就能正常工作,

重拾依赖倒置原则(训练营第二课)

High level modules should not depend upon low level modules, Both should depend upon abstractions.Abstractions should not depend upon details.Details should depend upon abstracts.

重拾依赖倒置原则(训练营第二课)

High level modules should not depend upon low level modules, Both should depend upon abstractions.Abstractions should not depend upon details.Details should depend upon abstracts.

HDFS/HBase技术报告·分布式数据库设计架构的深度解析

从广义的理解,分库分表的传统关系型数据库,传统关系型数据库集群,关系型数据库的主从架构,分布式KV数据库(例如:HBase),分布式文档数据库(例如:MongoDB),分布式关系数据库(例如:TiDB)等,统称为分布式数据库。

三大 OSS 缓存加速系统巅峰对决

在上篇文章 《OSS太慢?看我们怎么提速10倍!》中提到,JuiceFS 可以提高 OSS 在大数据场景下的性能 10 倍,当时有朋友在朋友圈建议我们用 JuiceFS 和类似的对象存储加速方案做一下比较。在花了一个月时间准备之后,有一些阶段性成果跟大家分享一下。

Hadoop-离线批处理技术

Apache Hadoop软件库是一个框架,该框架允许使用简单的编程模型跨计算机集群对大型数据集进行分布式处理。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。

Hadoop集群搭建-01前期准备

整个搭建hadoop集群的流程,包括 前期准备 安装zookeeper并配置环境 编译安装hadoop并启动 安装HDFS管理namenode和dataname管理集群硬盘资源 安装启动yarn建立MapReduce管理cpu和内存资源

技术干货!HDFS读写原理和代码简单实现

摘要:本文主要研究了HDFS文件系统的读写流程以及基于MRS在windows客户端下读写HDFS文件的实现。

Hadoop之HDFS 内部机制知多少?

探寻Hadoop里另外一个重要组件HDFS的架构和高可用相关机制

大数据技术发展(二):Hadoop 技术生态圈的发展

Hadoop 是大数据领域中最重要的一门技术,我们很多人知道它是发源于 google 的"三驾马车",实际上真的是这样的吗?这篇文章一探 Hadoop 技术的起源。

面向对象的Python编程,你需要知道这些!

​​​​摘要:Python没有像 java 中的“private”这样的访问说明符。除了强封装外,它支持大多数与“面向对象”编程语言相关的术语。因此它不是完全面向对象的。

Rust从0到1-面向对象编程-Trait 对象

trait 对象与其他语言中的“对象”类似,但是又不相同。

Rust从0到1-面向对象编程-概念

根据某些定义,Rust 是面向对象的;而在其它一些定义下,Rust 又不是。

其他标签