Bootstrap

NoSQL数据库兄弟会

1、memcache介绍

•       很早出现的NoSql数据库

•       数据都在内存中,一般不持久化

•       支持简单的key-value模式

•       一般是作为缓存数据库辅助持久化的数据库

2、redis介绍

•       几乎覆盖了Memcached的绝大部分功能

•       数据都在内存中,支持持久化,主要用作备份恢复

•       除了支持简单的key-value模式,还支持多种数据结构的存储,比如 list、set、hash、zset等。

•       一般是作为缓存数据库辅助持久化的数据库

•       现在市面上用得非常多的一款内存数据库

3、mongoDB介绍

•       高性能、开源、模式自由(schema free)的文档型数据库

•       数据都在内存中,如果内存不足,把不常用的数据保存到硬盘

•       虽然是key-value模式,但是对value(尤其是json)提供了丰富的查询功能

•       支持二进制数据及大型(blob)对象

•       可以根据数据的特点替代RDBMS ,成为独立的数据库。或者配合RDBMS,存储特定的数据。

4、列式存储HBase介绍

•       HBase是Hadoop项目中的数据库。它用于需要对大量的数据进行随机、实时的读写操作的场景中。HBase的目标就是处理数据量非常庞大的表,可以用普通的计算机处理超过10亿行数据,还可处理有数百万列元素的数据表。

redis的适用场景

 

1.取最新N个数据的操作

比如典型的取你网站的最新文章,通过下面方式,我们可以将最新的5000条评论的ID放在Redis的List集合中,并将超出集合部分从数据库获取

  • 使用LPUSH latest.comments命令,向list集合中插入数据

  • 插入完成后再用LTRIM latest.comments 0 5000命令使其永远只保存最近5000个ID

  • 然后我们在客户端获取某一页评论时可以用下面的逻辑(伪代码)

FUNCTION get_latest_comments(start,num_items):

    id_list =redis.lrange("latest.comments",start,start+num_items-1)

    IFid_list.length < num_items

       id_list = SQL_DB("SELECT ... ORDER BY time LIMIT ...")

    END

    RETURNid_list

END

如果你还有不同的筛选维度,比如某个分类的最新N条,那么你可以再建一个按此分类的List,只存ID的话,Redis是非常高效的。

2.排行榜应用,取TOP N操作

这个需求与上面需求的不同之处在于,前面操作以时间为权重,这个是以某个条件为权重,比如按顶的次数排序,这时候就需要我们的sorted set出马了,将你要排序的值设置成sorted set的score,将具体的数据设置成相应的value,每次只需要执行一条ZADD命令即可。

3.需要精准设定过期时间的应用

比如你可以把上面说到的sorted set的score值设置成过期时间的时间戳,那么就可以简单地通过过期时间排序,定时清除过期数据了,不仅是清除Redis中的过期数据,你完全可以把Redis里这个过期时间当成是对数据库中数据的索引,用Redis来找出哪些数据需要过期删除,然后再精准地从数据库中删除相应的记录。

4.计数器应用

Redis的命令都是原子性的,你可以轻松地利用INCR,DECR命令来构建计数器系统。

5.Uniq操作,获取某段时间所有数据排重值

这个使用Redis的set数据结构最合适了,只需要不断地将数据往set中扔就行了,set意为集合,所以会自动排重。

6.实时系统,反垃圾系统

通过上面说到的set功能,你可以知道一个终端用户是否进行了某个操作,可以找到其操作的集合并进行分析统计对比等。没有做不到,只有想不到。

7.Pub/Sub构建实时消息系统

Redis的Pub/Sub系统可以构建实时的消息系统,比如很多用Pub/Sub构建的实时聊天系统的例子。

8.构建队列系统

使用list可以构建队列系统,使用sorted set甚至可以构建有优先级的队列系统。

9.缓存

将数据直接存放到内存中,性能优于Memcached,数据结构更多样化。

 

redis的特点

高效性:Redis读取的速度是110000次/s,写的速度是81000次/s

原子性:Redis的所有操作都是原子性的,同时Redis还支持对几个操作全并后的原子性执行。

支持多种数据结构:string(字符串);list(列表);hash(哈希),set(集合);zset(有序集合)

稳定性:持久化,主从复制(集群)

其他特性:支持过期时间,支持事务,消息订阅。