服务
关于
CloudProse博客

2014年8月4日星期一

您对市场上的AWS Redshift知之甚少,但坦率地说,我认为它是AWS上最被低估的服务。简而言之,Redshift是数据仓库基础架构的一场革命。面向列的数据库已经存在了很长一段时间,这种列数据库是为读取大量或OLAP(在线分析处理)工作负载而优化的一种数据库,但是在过去的十年中,随着诸如Vertica和ParAccel,添加了一个横向扩展模型,该模型允许使用PB级基于SQL的数据仓库。

但是,即使发生这种中断,进入的障碍仍然很高:不仅基本解决方案的硬件和软件成本很容易接近六位数,而且安装和维护的复杂性也大大增加了总拥有成本。结果,这些技术几乎是中小企业无法访问的。

但是,中小企业仍然迫切需要从其数据中获取答案。在如今的数据积累和在线活动中,许多SMB拥有相当大的“大”数据,这些数据迅速超过了MySQL和SQL Server等传统OLTP系统的功能。即使他们“隔夜”运行一些预先准备好的报告,这些报告会在一夜之间运行并永恒地存在,但仍有巨大的未开发潜力。当用户可以快速且交互式地浏览数据,构建新报告并轻松将仪表板向决策者展示时,分析的力量就来了。快速响应的数据仓库是此类发现的关键基础架构。

输入Redshift。支持Redshift的基础技术并不是什么新鲜事物,但是经济和服务交付确实是革命性的。像所有AWS服务一样,它是按小时付费的……但它变得更好了……成本最低的单节点部署每天的价格仅为6美元。如果您预订一年并提前付款,那么每年的总费用仅为1400美元!这与六位数的竞争对手部署相差甚远。市场上没有人能接近这个成本。

而且,由于Redshift的服务交付模式,总拥有成本不会高很多。这是“平台即服务”,这意味着在配置Redshift节点时,您可以通过一个简单的界面管理数据仓库的详细信息,并连接到数据库以加载数据,运行查询或连接到BI /分析/报告工具。没有要管理的服务器,没有要安装的软件,没有要更新的补丁程序。它“有效”。

现在,所有这些,我想提醒您注意... Redshift并非无关紧要。受过训练的DBA对建立数据仓库很重要,并且技术团队必须学习一些Redshift独特的功能,以正确,最佳地使用它。

不过,我认为您会同意…单击该按钮,启动集群,加载一些数据,并开始提供报告…肯定感觉像是一场革命!

作者
安迪·沃宗(Andy Warzon)Trek10
安迪·沃宗(Andy Warzon)

创办人& CTO

创办人&CTO Andy一直在AWS上进行开发已有十多年,并且是AWS认证解决方案架构师-专业人士。