背景
最近家里娃需要挂专家号的儿保,奈何专家号实在过于抢手,身为程序员的我也没有其他的社会资源渠道可以去弄个号,只能发挥自己的技术力量来解决这个问题了。
首先把应用安装到我已经 Root 过的 Pixel 3 上面,点击应用图标打开的时候提示该手机已经Root过,请慎用,然后闪退,看来应该是加固保护做了 Root 检测了。

先截取下发送的数据请求,看下大致的流程。Android 7.0 以后,应用不会信任用户安装的根证书了,所以要抓包要么把根证书加到系统证书目录,要么就是通过Hook的手段强行绕过证书,我这边选第二种方法。安装 TrustmeAlready 以后,在 Lsposed 里面配置绕过证书。

顺利抓到数据。

接下来就是分析参数,这里面多数接口的信息都是比较明确的,比如获取医生信息、就诊信息等,基本上都是明文的信息,这些略过不表。比较关键的是一些涉及用户信息的,比如 tempCustId 以及 userCustId ,从实践来看,tempCustId 应该是就诊人的 ID,而 userCustId 应该是账号登录的人的 ID,因为可以登录自己账号帮别人挂号,这个也是合理的。然后 appKey 应该是登录的 token 信息,这边实践也是证明每次登录都是不一样的。最后有个关键的是 uuid,看起来就是平时理解的 uuid,可以到时候尝试随机生成试下。好了,基本参数分析完以后,开始构造参数来模拟请求,看看对不对。
很不幸,失败了。从尝试来看,唯一影响的就是上面的 uuid,因为从抓包的请求中扣下来填入模拟请求的话,这个请求是成功的,但是自己随机构造的话,就是失败的。看起来这个 uuid 应该涉及到一些加密算法的校验,解密失败在服务端认为异常的请求。

所以开起来还是要分析源代码看下这个参数的构建过程,使用 JADX 打开,看下源代码。

使用了阿里的加固方案,而且是把 Dex 转成了 SO 的文件,然后在运行时使用自定义的 ClassLoader 去加载的,看来要解决这个问题还是要先脱壳了。暂时先止步于此。
等等!在再次查看抓包的数据,发现在请求的过程中加载了大量的 HTML 的文件,所以我猜测这个 APP 只是一个套壳的网页应用,在分析可能的入口网址后,我拿地址在网页中打开。果然,跟我想象的一样。

那么 uuid 的生成是否可能在网页应用的源码里面呢,打开 devtools 尝试搜索 uuid 相关的字符串,果然找到了相应的代码。
至此,搞定了 uuid 的生成逻辑,距离成功又迈进了一大步。
现在距离最后的成功还差一步,就是在发起预约的时候,有个图形验证码需要校验。
通过多次调用请求图形验证码的接口,我发现它生成的规则比较固定,基本都是数字的组合,而且有一点就是,数字在图片上的布局也是固定的。所以这个地方如果用TensorFlow去做识别就比较简单了。
首先收集数据集。
然后对采集到的数据做标注提取以及灰度化处理。
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | def paa(file): img = Image.open(file).convert('L') # 读取图片并灰度化 img = img.crop((0, 10, 100, 36)) # 120*44图片裁剪为100*26 # 分离数字 img1 = img.crop((0, 0, 19, 26)) # 单个数字图片大小为19*26 img2 = img.crop((30, 0, 49, 26)) img3 = img.crop((60, 0, 79, 26)) img4 = img.crop((80, 0, 99, 26)) img1 = np.array(img1).flatten() # 扁平化,把二维弄成一维度 img1 = list(map(lambda x: 1 if x <= 180 else 0, img1)) img2 = np.array(img2).flatten() img2 = list(map(lambda x: 1 if x <= 180 else 0, img2)) img3 = np.array(img3).flatten() img3 = list(map(lambda x: 1 if x <= 180 else 0, img3)) img4 = np.array(img4).flatten() img4 = list(map(lambda x: 1 if x <= 180 else 0, img4)) return (img1, img2, img3, img4) |
单张图片采集出来的数字图片。
构建拟合函数并保存训练模型。
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 | import tensorflow.compat.v1 as tf tf.compat.v1.disable_eager_execution() from data import train_images, train_labels DLEN = len(train_images.data[0]) DNUM = len(train_images.data) x = tf.placeholder(tf.float32, [None, DLEN]) W = tf.Variable(tf.zeros([DLEN, 10])) b = tf.Variable(tf.zeros([10])) y = tf.nn.softmax(tf.matmul(x, W) + b) y_ = tf.placeholder("float", [None, 10]) cross_entropy = -tf.reduce_sum(y_*tf.log(y)) train_step = tf.train.GradientDescentOptimizer(0.001).minimize(cross_entropy) saver = tf.train.Saver() sess = tf.Session() sess.run(tf.global_variables_initializer()) for i in range(DNUM): batch_xs = [train_images.data[i]] batch_ys = [train_labels.data[i]] sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys}) correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1)) accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) saver.save(sess, 'model/model') sess.close() |
验证下训练的模型。
最后模拟请求发送,完成预约挂号。