推广 热搜: 行业  机械  设备    系统  教师  经纪    参数  蒸汽 

重磅开源:阿里妈妈技术质量开源面向广告搜索推荐系统的线上测试和性能测试平台

   日期:2024-12-29     移动:http://yejunbin01.xhstdz.com/mobile/quote/86126.html

2020年4月7日,阿里妈妈技术质量团队开源了线上测试平台MagicOTP和性能测试平台ACP。两个平台经过阿里巴巴广告业务的长期锤炼,在大规模广告搜索、推荐系统的线上测试和性能测试上深耕多年,内置了面向广告搜索、推荐领域的工业级线上测试和性能测试解决方案。


一、ACP(alimama-common-performance-platform)




ACP(alimama-common-performance-platform)平台是阿里妈妈的全链路智能性能测试平台。区别于业界一些开源的工具和平台,ACP平台将有监督建模、无监督建模、混沌工程等智能化技术引入到性能测试领域;并将其打造为高性能通用的基础组件。平台提供了压测query智能抽取、压测流程智能调控、系统指标智能监控三大智能化功能;在阿里妈妈实现了无人值守的智能化性能测试。

(github地址:https://github.com/alibaba/alimama-common-performance-platform-acp )


系统核心能力

1.    C++高性能压测工具

ACP提供了SYNC同步压测和ASYNC异步压测两种模式;同步压测的工作模式是阻塞式发送,异步压测采用非阻塞并发模式,目前开源版本支持同步压测模式。

Chain-Line链式的线程管理系统,智能调整内部线程和并发数,最终快速达到指定的qps。

基于Linux内核的消息队列的监听服务,在不需要重启进程的情况下做到实时调整qps。

组件:

  • 智能压测调控框架

  • Chain-Line链式的线程管理组件

  • Adaptive Auto Control实时流量调控组件

  • Kernel-queue消息队列读写组件

压测Client工作模式图:

2.   大规模分布式调度服务

性能测试的一个难点是如何高效利用测试资源,在压测机器有限,压测机器规格不一致,压测任务消耗硬件资源不一的情况下;如何高效调度成千上万个agent是我们要解决的问题。ACP平台利用zookeeper,使用DFS深度优先的搜索算法,实现了资源分配粒度达到内核级别,并开源了其产品化的能力。


3.   基于历史样本的有监督学习建模及预估能力

传统性能测试更多需要人来手工操作,测效率普遍不高,我们提供了基于随机森林( random Forest)、线性模型、非线性等多种算法建模组件;用建模、预估技术代替人力手动调压等操作,用户可以根据业务场景定制自己的建模方案,此外,我们也提供了多种样本处理组件。

1)    特征样本归一化,对于历史监控数据,我们将样本(sample)进行归一化处理(normalization),将不同量纲、不同单位的样本进行加权处理,保证后续建模的精度。

2)    特征样本去噪,历史监控数据有很多噪声,如作弊流量,异常流量,而这些噪声会直接影响模型的预估表现,减少无效样本对模型的影响。

3)     特征样本转换,feature transformer是将多维特征转为单维(Single-Demension)特征的过程,如服务器带宽和qps有着强关联,我们将二者做除法得出新特征,即每个请求占用的带宽(bytes per query),而这种特征能够直观反映系统表现。

4.   基于实时样本的无监督学习建模及预估能力

我们提供了基于arima模型的无监督学习建模预估能力(差分整合移动平均自回归模型,又称整合移动平均自回归模型)。和上述有监督建模预估相比,无监督建模预估准入门槛低,相比于之前的用历史监控数据建模的方案,arima不需要人为的收集历史数据和打标。


5.   性能测试用例智能生成

Netflix提出了Chaos Engineering,我们基于混沌工程和fuzz思想进一步探索了query智能组合构造方案,分钟内智能构造千万级数据样本;解决了压测数据样本单一,异常场景构造成本高,覆盖率低的问题,从而可以充分验证系统稳定性,鲁棒性。


后续开源计划

  1. 历史样本有监督学习建模及预估能力

  2. 实时样本无监督学习建模及预估能力

  3. 基于fuzz的性能测试用例智能生成方案

欢迎通过邮件组acp-opensource@list.alibaba-inc.com和github issue联系和反馈


概述

广告搜索推荐业务上,线下功能测试的覆盖和线上实际场景总是有一定的gap,深层次的原因是因为业务和算法模型强相关,线下不可能覆盖所有业务场景。鉴于此我们通过使用线上的数据,实时trace和智能化技术打造了线上智能测试平台MagicOTP,通过线上测试很好弥补了线下功能测试覆盖和实际业务场景之间的gap,实现了全场景的测试覆盖保障,同时在阿里妈妈落地了智能化的无人值守的发布闭环。

github地址:https://github.com/alibaba/online-test-platform


系统核心能力

1.     多种线上数据采集技术(时序、分布、规则采样、基因变异算法等),节省人工构造测试数据的成本,提高测试效率。

2.     健壮的规则校验引擎,测试数据通过规则进行多维度校验,相比传统冒烟的单点固定验证,具有更高的场景覆盖度。


3.     精准的规则智能推荐技术和智能化验证技术,基于大数据分析和字段联关系Association Rules建模,利用推荐算法和异常数据检测(K-sigma等)实现了智能化的规则推荐和校验。


4.     高效的多业务接入能力,在平台配置完任务,任务执行过程中自动推荐出基础校验规则,减少开发成本。当业务变更时维护只需简单修改规则即可。





本文地址:http://yejunbin01.xhstdz.com/quote/86126.html    物流园资讯网 http://yejunbin01.xhstdz.com/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关最新动态
推荐最新动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号