资讯

阿里云发布数据库自治服务DAS,让数据库进入“自动驾驶”新时代

谈到数据库行业近几年的重大变化,我们很容易想到从传统数据库向云数据库的变迁。而另一个正在悄然发生的变化不太被人提及,尽管其意义同样非常重大,这就是数据库的“自治”。实际上,数据库实现“自治”,也就是系统自我管理,是数据库行业又一个划时代的变迁。

如果把从传统数据库向云数据库的转变比喻成“汽车换马车”的话,那么数据库的“自治”就是从“手动”到“自动”,更准确地说是到“自动驾驶”。而阿里云4月22日发布的数据库自治服务DAS(Database Autonomy Service)就是这一变迁的一个重要标志。

给“汽车”加上自动驾驶引擎

近几年来,随着云计算的普及,以服务形式呈现的云数据库应运而生,如阿里云的PolarDB、AnalyticDB等。云数据库天生具有的可扩展性、灵活性、高性价比等优势使得其在与传统数据库的竞争中赢得了先机,得到了市场广泛认可,代表了数据库的未来。Gartner预计,到2021年云数据库在整个数据库市场中的占比将首次达到50%。而到2023年,75%的数据库要跑在云平台之上。

云数据库大大减轻了数据库管理员(DBA)的工作,包括资源弹性、高可用、备份、监控等基本运维工作。不过,数据库的运维终究是一件非常复杂的工作,数据库上云之后还有很多非常复杂的工作要人来做。

“上云之后,让数据库发挥最优的效能,对于大部分应用开发者和数据库管理人员而言,需要很多数据库专业领域知识,依然充满挑战。” 阿里云数据库资深技术专家、DAS产品线负责人李广望表示。

如故障诊断,短时间内快速发现问题、找出原因并解决问题;还有数据库的持续调优等、SQL Review等,过去这些通常要DBA来参与,效率低,而且严重依赖DBA个人的经验。另外,规模化运维也是当下很多企业面临的一个现实问题。当企业的业务快速发展,需要运维成百上千的数据库集群,保证其稳定性、伸缩性的挑战会成指数型增长,如果还是依赖人工的优化和运维,人力成本很快就成为企业难以承受之重。因此,数据库走向自治就成为一个必然趋势。

实际上,随着人工智能、机器学习技术的快速发展,利用它们来优化数据库内核以及数据库运维、管控等一系列动作已经成为数据库行业的共识。阿里云此次推出的数据库自治服务DAS就是一种基于人工智能和机器学习技术实现的、能自动且主动帮助用户消除数据库管理的复杂性及人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

“从传统数据库到云原生数据库,相当于从马车时代进入汽车时代,但这个汽车还需要驾驶员,而今天我们的数据库自治服务就相当于给云原生数据库加上了自动驾驶引擎,让现代化的汽车还具备自动驾驶的能力,能够以非常轻盈的方式、非常便捷而且更稳定、更安全、更经济地用好数据库。”李广望表示。

自感知、自修复、自优化、自安全

阿里云的DAS由阿里云及达摩院联合研发,可提供自感知、自修复、自优化、自安全的全链路数据库管控能力,无需人工干预,让企业像体验“自动驾驶”一样使用数据库,数据库管理成本降低90%。

数据库有四大核心诉求,即高性能、高稳定性、高安全和低成本。阿里云DAS以其智能异常诊断、SQL自动限流、SQL自动优化、AutoScale、智能压测、智能调参等六大自治特性,很好地满足上述四大核心诉求。

“DAS就像一个不需要休息而且计算能力超强的伙伴,帮助企业去守护数据库,确保其安全、健康和高性能。” 阿里云数据库产品专家胡航丽表示。

其实,数据库的“自治”并不是一个新词,几年前市场已经有自治数据库出现,不过作为一个独立的数据库自治服务,阿里云DAS是业内第一个。

“与内置在数据库引擎中的自治能力相比,我们从设计第一天开始就作为数据库‘自动驾驶’级平台存在,我们是要把自治能力、自动驾驶能力赋能给所有的数据库,包括RDS、PolarDB、ADB、Redis等OLTP/OLAP/NoSQL数据库都要全面支持。”李广望表示。

由于是平台模式,其对数据库无侵入,使得其更易于推广到其他数据库、甚至线下的数据库。同时,阿里云DAS还在技术上实现了重大创新和突破,包括首个全局综合自治引擎、首个外置式Cost-based SQL诊断引擎、基于全局Workload的优化技术、基于机器学习的实时异常发现与预测等。

这些突破性的技术使得阿里云DAS具有了业内领先的自治能力。阿里云参考自动驾驶的级别将数据库的自治能力分为5级:从全靠人的零级(Level-0)到仅仅提供基础监控、告警等信息的第1级(Level-1),到提供诊断或者优化建议但由人来决策是否使用的第2级(Level-2),到部分场景实现完全自治的3级(Level-3)以及全部实现自治的第4级(Level-4)。目前,阿里云DAS的自治能力已突破第3级(Level-3),也就是绝大多数工作完全不需要人参与,正在迈向最高级,即完全的自动驾驶。

”阿里云DAS覆盖的绝大部分场景基本上可以由DAS来决策。不过,用户可以决定到底要开哪个特性,比如在负载增高的时候要不要我们主动干预它,或者系统自动去优化它。”胡航丽介绍说。

基于阿里云DAS强大的自治能力,DBA可以从繁琐的日常运维工作中解脱出来,这让DBA可以将更多精力放到业务创新和发展上,发挥更大的价值。比如系统出现故障时,DAS可以帮助快速定位。更为重要的是,阿里云DAS能预先发现问题,在故障真正发生之前就解决,DBA甚至是无感知的。

世界级的业务压力成就了世界级的产品

和阿里云的很多产品/服务一样,阿里云DAS也是首先来自阿里自己的需求,产品成熟后经过阿里自己的验证才对外输出。

DAS产品最早源于2014年的CloudDBA,是一个服务于内部的研发人员工具。2016年,阿里云对它进行了升级和产品化,作为云服务推向了市场。从2017年开始阿里云在其中加入自治功能,并利用阿里巴巴的场景和技术不断验证和完善,一直持续到2019年年底,正式更名为DAS。


阿里云DAS的演进历程

目前,阿里云DAS已大规模应用于阿里巴巴内部业务场景,阿里巴巴集团内部85%数据库实例已实现自动驾驶,累计优化超4200万 SQL、回收超4 PB空间,并服务了大量电商、金融、游戏等领域的企业。

在整个研发过程中阿里集团丰富的场景和案例起到了关键作用。“几乎所有机器学习的前提,就是拥有足够多的数据和标注案例,而这也是阿里巴巴的优势。阿里巴巴自己有海量业务,包括电商、本地生活等不同业务场景,同时也是国内最大的云平台。我们建立了一套线下的DAS实验室,对接应用日志、监控告警、以及用户工单系统等,可实现日志事件和异常的自动关联,从而实现自学习、持续优化的自治引擎能力。”李广望介绍说,

正是世界级的业务压力才能造就出世界级的数据库产品。以“双11”为例,2019年“双11”天猫实时成交额创出新高,达到2684亿元人民币。阿里旗下的自研云原生数据库PolarDB表现稳定:PolarDB TPS最高峰达到8700万次/秒,创下数据库的新记录,其中自然也有DAS的一份功劳。

应该说,阿里云DAS是阿里多年在数据库领域深厚技术积淀的一个展现,更是阿里云数据库成长过程的一个缩影。今天在数据库领域,阿里云除了赋予数据库智能化、自动驾驶的能力,以帮助用户用好数据库之外,同时还在致力于云原生数据库的研发,比如PolarDB、ADB,并且取得了亮眼的成绩。

2018年,阿里云作为第一家且唯一一家中国公司进入Gartner数据库魔力象限。在Forrester发布的数据库评估报告《The Forrester Wave: Database-As-A-Service,Q2 2019》中,阿里云数据库PolarDB也跻身“强劲表现者”阵营。根据阿里云的官方资料,目前已有约40万个数据库迁移到阿里云上,稳居国内云数据库市场份额第一。

在阿里云不断推出数据库产品的过程中,阿里云数据库的技术也得到广泛认可。阿里云数据库相关研究成果多次入选国际数据库顶级会议。在数据库的顶级会议VLDB、SIGMOD上都有阿里云相关论文入选。

“云计算的最大魅力是它给了我们一个平台,将我们过去的实践和技术普惠化,技术价值最大化,过去3年我们在阿里巴巴内部实现的数据库自动驾驶能力,通过阿里云平台能够帮助到所有的应用开发者。我相信,未来三年,所有云上数据库的80%将会实现自动驾驶能力;让所有的应用开发者更专注于自己的业务创新,将数据库交给DAS,让DAS加持下的数据库,承载您的业务持续飞驰在快车道! ”李广望表示。

本文链接:https://www.aliyun.net.cn/6376.html

上一篇:

下一篇: