背景

在AI越来越发达的今天,我们传统业务开发不得不面临的一个问题是,面对越来越膨胀的AI写的代码,我们该如何review? 不同的业务场景AI能够介入的效果不同。有些业务AI能够轻松介入,比如智慧客服,智能OA等等。但是在C端,支付结算领域,从来没有说过有智能支付,智能交易,智能结算。AI是不可控的,因此随之有了harness工程来约束模型。但是即使这样,我们也不敢让AI在生产上去代替交易系统,支付系统,结算系统去对实时资金流产生影响。在这些背景下,我觉得从某个领域进行单点突破还是可行的。比如在代码上线前进行的代码评审,做好事前评审,可以防范一些因为对业务的不理解和AI写的代码人没有理解的情况下,避免产生一些不好的影响。因此我们做了AI代码评审。

这件事是从2025年中开始做的,那个时候skill还没有那么火,我只是进行了初步尝试,利用大模型的基础训练的能力和我写的promot以及配合一些工具对项目代码进行拉取,diff等,进行AI代码评审。这个时候已经搭建了一个完整的工作流。主要是通过工具先把本次业务代码分支上的改动全部拉下来,然后分成几种情况,比如只diff某几个提交,或者diff这个分支的和master分支之间的差异。我甚至为了这盘醋包了一个饺子,为此我搭建了一个agent以及整个平台。只为了代码评审能够更好的工作。这个平台包含了一些操作,比如能够配置仓库,配置定时任务执行的时间,配置分支,配置钉钉群webhook以进行实时提交的评审通知等等。并且以代码评审为一个角度,切入了需求分析->产品文档->代码编写->代码评审->测试案例生成的整个工作流。当然我仅仅实现了代码评审这一个模块,其他模块还是比较初步的阶段。