数据团队到底是成本?还是价值?如果没有泛化数据给使用数据的人,数据团队将永远被冗杂和重复的工作所困
系统讲解指标体系:指标体系建设的意义、什么是指标、指标体系建设思路、确认核心指标KPI(指北星指标)、绘制用户核心转化路径(达成目标路径)、拆解核心指标-指标拆解模型
spark SQL时空碰撞
越来越多的公司都在尝试 ABTest,要么是自己搭建系统,要么依赖于第三方的系统。那么在我们进行ABTest的时候,必备的基础知识有哪些?该如何一步一步的进行AB实验呢?本文将根据 AB 实验的流程带领大家一窥究竟。
数据分析之AB testing实战(附Python代码)
在线AB实验成为当今互联网公司中必不可少的数据驱动的工具,很多公司把自己的应用来做一次AB实验作为数据驱动的试金石。
此文主要是跟大家聊聊数据分析与OLAP差异,只有清晰它们之间差异,我们才可以深入了解所选型技术使用场景,脱离使用场景的技术选型就如无源之水,无本之末;我们对用场景认知程度,决定了选型技术的解决方案;如“盲人摸象”的例子,如果你只摸到了象的耳朵,
spark SQL时空碰撞
GrowingIO 基于 BitMap 搭建的数据模型
云厂商的一系列新产品的推出,虽然让数据开发工程师们尝到了甜头。但是我们也可以从中敏锐地嗅出一丝危机的气味。
我精心整理的 136 页 Excel 数据透视表 PDF 文件!【附获取方式】
上一篇文章中带大家了解了数据分析基础,配置好了数据分析的基本环境,以及利用pandas模块读写csv文件,在本文开头,我也补充了csv与tsv的基本介绍与区别,意在更好的让大家理解相关知识点,本文将带大家继续学习文件读取。
早在2000年代中期,H-Store第一次在M.I.T.被我们提出来。
本文摘录自我们最新白皮书《工业物联网的主动欺诈预防》。
谁更能从5G受益?
详述电商行业数据分析指标已经简述PageRank算法
摘要:在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。本文主要针对“点击率”这一因素进行分析,与大家分享。
GrowingIO 基于 BitMap 搭建的数据模型
Pandas+Seaborn+Plotly:联手探索苹果AppStore
近期成为月入两万的数据分析师的广告遍地都是,可能会对一些未入行的同学造成错觉。我个人感觉数据分析师这个岗位,可能近几年会消亡。未来数据分析可能会变成一个基本无门槛的模块,培养自己的产品sense,解决用户需求问题,或将成为未来的发展方向。
你们年货都买了些什么?
Python 实战案例分析 | 某化妆品企业的销售分析
MobTech袤博科技合伙人、首席数据官杨冠军在CSDN最新一期《新程序员 003:云原生和全面数字化实践》分享企业数字化转型的【三步走】方案。
数据可视化是使用可视化应用的方式来分析并展示庞杂数据的产品。让更多的人看到数据可视化的魅力,帮助非专业的工程师通过图形化的界面轻松搭建专业水准的可视化应用,满足您会议展览、业务监控、风险预警、地理信息分析等多种业务的展示需求。
本次与大家分享的11.11机房数据图谱大屏,作为这系列之一,以最新的视觉体验和可视化形态为观者传递了机房、网络的实时状况。本篇文章我们将以设计者的身份为大家带来相关见解与分析。
大家中秋节快乐!
如果说运维和监控保障了业务系统的稳定,而数据分析是可以帮助业务做增长的。那如何利用云产品做业务数据沉淀和分析呢? 下面我们讲讲关于数据的沉淀,展示和分析的一些简单实践。
Quick BI是专为云上用户量身打造的智能数据分析和可视化BI产品,本篇着重介绍Quick BI在可视化分析上的能力与演进之路。
Pandas 是一个 Python 软件库,它提供了大量能使我们快速便捷地处理数据的函数和方法。在本文将主要介绍 Pandas 的实用数据处理操作。
数据分析的 ”痛“ 谁能了解
数据分析技能与工具决定下限,体系化的思维与框架决定上限。
“颜值和性格成反比”更可能是我们犯了伯克森谬误而得出的错误结论;面对涉及到能力、品格、长相、运气的各种“负相关”论断,我们都应该保持戒心。
通过各种社交,公共媒体,地图,视频,图片,坐标,人物,文档,语音等多类型数据和视角,帮助我们发掘更层次的信息。一方面了解更多的目标信息情报,从数据情报中找到新的攻击视角,另一方面帮助业务,风控识别目标对象真伪,识别风险,追踪历史行为痕迹。
埋点方案、流程
摘要:为了探究垃圾的智能分类等问题,由中关村海华信息研究院、清华大学交叉信息研究院以及Biendata举办的2020海华AI垃圾分类大赛吸引了大量工程师以及高校学生的参与