Bootstrap
数据分析师应该了解的数据湖

数据湖是一个集中式存储库,允许您以任意规模存储所有结构化和非结构化数据。您可以按原样存储数据(无需先对数据进行结构化处理),并运行不同类型的分析 – 从控制面板和可视化到大数据处理、实时分析和机器学习,以指导做出更好的决策。

跨湖跨仓场景下如何实现海量数据分钟级分析

​​摘要:华为开发者大会2021(Cloud)大会期间,华为云FusionInsight MRS云原生数据湖HetuEngine架构师武文博,分享了“跨湖跨仓场景下如何实现海量数据分钟级分析”主题。

有了数据湖探索服务,企业决策“新”中有数

摘要:全托管Serverless服务DLI就像是我们日常使用的滴滴共享打车,我们不再需要为购买和保养私家车而支出固定成本。

基于云的技术架构设计实践-第5篇

如果说运维和监控保障了业务系统的稳定,而数据分析是可以帮助业务做增长的。那如何利用云产品做业务数据沉淀和分析呢? 下面我们讲讲关于数据的沉淀,展示和分析的一些简单实践。

过滤Spark数据集的四种方法

你知道有四种过滤Spark数据集的方法吗?

第13周总结:Spark&流计算,数据分析和机器学习

第13周总结:Spark&流计算,数据分析和机器学习总结

用数据搭建反馈系统

一个数据驱动型公司,最重要的就是对用户的数据进行挖掘,根据数据提取模型。最常见的是用来分析事物之间的相关性。便于我们决策。

数据分析师完整的指标体系构建 (干货)

拿下数据分析师offer的实战技能

利用 Python 分析了某化妆品企业的销售情况,我得出的结论是?

Python 实战案例分析 | 某化妆品企业的销售分析

代码回现 | 如何实现交易反欺诈?

交易反欺诈是VoltDB适用场景之一,是典型的事件驱动的业务,核心是摄取高频的交易数据,并逐条对交易进行一系列复杂的反欺诈规则校验,最终生成评判交易可疑度的分值,发送给下游业务系统,触发交易拦截动作。

如何支撑企业快速构建数字孪生体

​​摘要:详解华为云IoTA服务如何助力IoT数据开发者快速实现IoT数据价值变现,带你动手实践完成一整套工业物联网方案的开发。

数据分析师完整的指标体系构建 (干货)

拿下数据分析师offer的实战技能

教你用SQL进行数据分析

摘要:采用 SQL 作为数据查询和分析的入口是一种数据全栈的思路。

数据分析之伯克森谬误:颜值和性格真成反比吗

“颜值和性格成反比”更可能是我们犯了伯克森谬误而得出的错误结论;面对涉及到能力、品格、长相、运气的各种“负相关”论断,我们都应该保持戒心。

直播 | 如何使用Ranger增强权限管理?

日前,openLooKeng发布了新版本v1.2.0。在易用性和安全性上,该版本优化了数据加载性能,新增结果分页显示、动态添加目录等新功能,为用户提供更加友好的使用界面;同时也丰富了Ranger的功能,使openLooKeng可以提供更高细粒度的权限控制。

数据服务基础能力之元数据管理

定义上说,元数据(Metadata)即描述数据的数据,但是在实际使用的时候,还是存在很多细分的概念,业务层偏向应用端,技术层偏向底层系统的交互和实现,在对性别的描述上都是核心维度。本质上看元数据,介于系统和业务中间,提供双方都能明白的语义和逻辑。

数据分析流程浅析

又不知道写什么,便稍微介绍一下一般我们常用的数据分析的流程。本篇主要以90年代的 CRISP-DM 为例进行说明。

Pandas入门教程-Series类型数据

本文开始正式写Pandas的系列文章,就从:如何在Pandas中创建数据开始。Pandas中创建的数据包含两种类型:

认识数据产品经理(二 数据产品经理的稀缺性)

数据产品经理的稀缺性:好的数据产品经理,为什么可遇而不可求。

如何基于 BitMap 进行海量数据分析

GrowingIO 基于 BitMap 搭建的数据模型

技术分析:AnalyticDB强力支撑双11

每年双十一购物狂欢节都是云原生数据仓库AnalyticDB MySQL版(原分析型数据库MySQL版)的一块试金石。今年AnalyticDB除了在阿里数字经济体内进入更多核心交易链路,全力支撑双十一以外,AnalyticDB全面拥抱云原生,构建极致弹性,大幅降低成本,释放技术红利

数据分析从零开始实战,Pandas读写TSV/Json数据

上一篇文章中带大家了解了数据分析基础,配置好了数据分析的基本环境,以及利用pandas模块读写csv文件,在本文开头,我也补充了csv与tsv的基本介绍与区别,意在更好的让大家理解相关知识点,本文将带大家继续学习文件读取。

数据分析从零开始实战,Python、Pandas与各类数据库

前面四篇文章讲了数据分析虚拟环境创建和pandas读写CSV、TSV、JSON、Excel、XML格式的数据,HTML页面读取,今天我们继续探索pPython、Pandas操作各类数据库。

数据分析从零开始实战,Pandas读写CSV数据

本系列学习笔记参考书籍: 《数据分析实战》托马兹·卓巴斯,会将自己学习本书的笔记分享给大家,同样开成一个系列『数据分析从零开始实战』。

数据分析从零开始实战,Pandas读取HTML页面+数据处理解析

前面三篇文章讲了数据分析虚拟环境创建和Pandas读写CSV、TSV、JSON、Excel、XML格式的数据,今天我们继续探索Pandas,如何利用Pandas读取HTML页面+数据处理解析。

数据分析从零开始实战,Pandas读写Excel/XML数据

前面两篇文章讲了数据分析虚拟环境创建和pandas读写csv、tsv、json格式的数据,今天我们继续探索pandas读取数据,如何读取Excel和XML数据?

揭秘淘宝平台广告策略,拆解最佳投放实践

摘要:在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。本文主要针对“点击率”这一因素进行分析,与大家分享。

酷家乐 x StarRocks:家居SaaS独角兽如何实现数据分析全面升级,大幅降低平台成本

酷家乐是群核科技旗下知名业务品牌,专注云设计系统及三维内容制作的技术研发和应用,面向家居、房产、公装等全空间领域,为企业级客户提供设计渲染、营销展示、生产施工、几何建模等场景的解决方案和服务。

深度剖析 | 关于数据锁定和读取一致性问题

传统的 RDBMS 系统在三件事上值得注意:锁定:即锁定记录的功能,以便其他人无法更改它们。

Amdocs收购OPENET:关于5G应用落地的思考

Openet已经迈出了大胆的一步

5G革命:如何让「数据」实现最大性能?

早在2000年代中期,H-Store第一次在M.I.T.被我们提出来。

如何预防工业物联网中的恶意攻击?

本文摘录自我们最新白皮书《工业物联网的主动欺诈预防》。

现代电信企业:极低延迟与复杂决策如何兼得?

我们面临着这样的难题:这些系统需要做出复杂的决策,且要以极低延迟的方式做出决策。

其他标签