腾讯自动化测试的AI智能

摘要：本文是林奕在腾讯 DevDays 2018 分享内容的脱敏整理，介绍了 CSIG 测试开发中心（前 SNG 测试开发中心）在自动化测试领域所做的智能化尝试。

一、UI自动化测试的问题

从业务角度看自动化测试，看到的东西仅仅是冰山浮在水面上的一小部分，而在自动化测试深入的过程中，会发现有很多看不见的坑在冰山下面。

1.自动化测试的复杂度障碍

举一个例子来说明， UI自动化测试工具首要要解决的是识别UI中的各个元素，因为安卓、iOS、Windows这样的操作系统有非常不同的表现逻辑，导致测试工具要针对不同的平台区分不同版本的工具，QTA测试工具也是按照这种结构去划分的。这是在冰山之上很显而易见的部分。

（冰山之上）

但是随着新技术的发展，越来越多的研发框架引入，如网页渲染、UI引擎甚至3D渲染引擎接连出现。这些数量繁多的开发框架，因为实现原理不同，在自动化测试过程中都会出现很多问题。

（冰山之下）

因为技术繁多，会让负责自动化测试工具的同学很受挫折，每一项技术都需要针对性的方案去解决，又面对非常多的场景要考虑兼容通用。

如下面的例子，一个软件界面，在人眼中看到的是完整的样子，但在UI自动化工具眼中，就要拆分成多个不同的模块使用不同技术来识别。

这是一个混合客户端的例子，但在现实中往往会发现，在一个界面中，经常会混合很多种渲染技术。每当一个新的UI渲染技术出现，自动化工具都要进行适配，这样下来不仅成本会非常高，也是一件很难做兼容的事情。这样就给自动化测试工具带来了无尽的挑战，是自动化工具开发遇到的困难点。

2.自动化测试同质元素识别障碍

第二个例子是一个闹钟应用的界面，但是在控件树上看起来，却因为区分不出内容，而只能把每一个时间元素同等对待。工具没有好办法来识别哪一个条目是北京的闹钟。

虽然通过无障碍化产品设计的方式，可以部分解决这一问题，但取决于产品的定位，并不是每一个产品都会支持到无障碍化。除了无障碍之外，出现了很多例如React之类的响应式布局，开发在写代码时，很难预料实际运行时的UI结构，更难在开发时提供给测试使用的UI数据结构。这样一来，又给自动化测试增加了难度。

3.自动化测试成效问题

在谈到自动化测试时，很多同学提到投入产出比。成效是推行自动化测试很重要的问题。

如上图，纵坐标是自动化测试的投入度，横坐标是随着产品演进过程的投入时间。自动化测试有两种投入方式，分别是脚本式和录制回放式。脚本式在项目初期投入较高，而后会随着产品的功能逐渐完善而逐渐降低维护成本。但业务往往由于脚本式自动化测试初期投入过高，而选择初期比较简单上手的录制回放式方案。而录制回放式方法由于界面变动就需要重新录制脚本，导致后续版本要投入与之前相同的工作量，而无法最终收敛。

另外一种场景，业务选择了脚本式自动化测试方案。但是投入并不彻底，导致随着功能开发迭代，自动化测试脚本的维护工作量并不收敛。这代表这次自动化测试的实施是失败的。如下图：

这其中的原因，最可能是没有做好自动化测试的变更管理——变化是影响UI自动化测试成效的关键因素。

4.控件识别和定位技术是自动化测试技术的关键难题

把以上三个问题做一下归纳，会发现自动化测试一个核心需要攻破的难点，那就是控件识别和定位。它是影响自动化测试成效的关键因素之一。

二、AI带来的曙光

1.QTA所做的AI尝试

QTA是在SNG跑了很多年的自动化测试平台，已经接入了170个活跃的公司产品和项目。仅2018年Q1，就自动化执行了一百四十万个测试任务、五千万个用例，按成时间平均每秒就有3个用例被执行。这些数据基础，为QTA引入AI技术提供了可靠的数据来源。

QTAMetis就是为了解决控件识别和定位技术这一关键难题，而引入AI优化能力。

（传统自动化测试识别和定位）

（Metis AI自动化测试识别和定位）

应用成熟的目标检测技术，可以看到Metis已经成功的把对象定位出来。而后通过分类器，把每一个元素分类和识别出来，例如哪些是可以点击的按钮，哪些是一个图片区域。然后通过OCR技术，把原件中对应的文本提取出来；如果是Logo，则通过图片的分类器把对应的Logo类型分类出来，而映射为特定的文本。

可以看到，这一实现结果和人看到的是一样的，与人类的认知相仿。已经基本脱离了APP本身的代码实现，也不需要再关注应用后面的UI实现技术，可以解决文章前面所述的几个问题。

同时还有另一个好处，比如某一个控件在新版本换了位置，对自动化测试没有任何影响。在成效方面，也减少了变更时增加的维护量。

在这种技术下，自动化测试脚本变得简单化：