为什么阿里巴巴禁止使用存储过程？

1,357次阅读

没有评论

共计 1584 个字符，预计需要花费 4 分钟才能阅读完成。

之所以有这个题目，我既不是故意吸引眼球，也不想在本文对存储过程进行教科书般论述。

《阿里巴巴Java开发手册》是这样规定的：

再结合我最近项目中遇到的存储过程问题，所以今天我打算来聊一聊这个问题。

这事儿要从去年在武汉出差时一位同事的发问说起。

问题是这样的：

我觉得存储过程挺好用的，你为什么不建议用呢？

当时我好似胸有万言，但终究没用一个实在的例子回答同事，只是从结论上大侃一通，代码相对于SQL，复用、扩展、通用性都要更强。想必同事并不信服。

现在想来，我最近正碰到的问题，算是一个可以回答同事的例子吧。

最近项目中有个新需求，需要校验一个用户是否有Job,Certification,Disclosure这三个业务数据。

翻看了代码发现，系统的用户个人页面的C#代码调用了三个存储过程，去抓取用户的Job,Certification,Disclosure数据。

我的新需求，自然需要复用这三个存储过程，否则:

若每一处都写一次抓取数据的业务逻辑代码，若业务逻辑发生变化，难以追查和维护所有读取Job,Certification,Disclosure的SQL。

如果我在C#代码中调用这已有的三个存储过程，事情本该非常快就能结束。我也是这么做的。

但code reviewer认为，我的需求中，并不需要Job,Certification,Disclosure这三个业务对象的数据。我只是需要给定用户是否有Job,Certification,Disclosure而已。所以我应将是否有无Job,Certification,Disclosure的判断逻辑写在数据库，最终通过网络从数据库传到web服务器的仅是true或false，节省网络流量，这样最好不过了。

也对。除开网络性能，从接口设计的角度讲，接口的传入和返回值，都应是你本身需要的数据，不应带有大量不需要或者需要caller去预处理的数据。从接口语义表达就可知调用的目的，这样代码可读性也会有大大提高。

那就动手改。但没想到的是问题来了。

为了讲述问题，我简化代码，假设系统现有的存储过程如下：

我在新的存储过程中调用它，我需要获得该person的jobs的数量，即GetJobs返回结果集的count。

为了实现这一目的，首先想到的是使用临时表，将返回结果集存入临时表，再对其进行count(*)的计数操作：

这种办法简单有效，但它存在严重的维护问题。未来如果被调用的存储过程的返回结果集字段有变动，那么MyProc中的临时表结构也需要随之变化。这是令人难以接受的。

那么将MyProc中的INSERT INTO换为SELECT INTO呢？很遗憾，答案是不行。SQL本身并不支持这种用法。

给现有存储过程GetJobs加output参数？本例中因为GetJobs已被其他多处代码或SQL scripts调用，所以对现有现有存储过程进行改动会有不小风险。

我搜遍网络，一位MS MVP的大神的文章几乎总结了所有存储过程之间传递数据的方法: How to Share Data between Stored Procedures。

他在文章中也无可奈何地说道

Keep in mind that compared to languages such as C# and Java, Transact-SQL is poorly equipped for code reuse, why solutions in T‑SQL to reuse code are clumsier.

最终我没能找到一种满意的办法，无奈之下我在新写的存储过程中将查询Jobs的语句写一了次。

存储过程在很多场景时有其优势，比如性能。但对于业务逻辑的通用方法，非常不推荐将其写在存储过程中，代码复用、扩展与客户端语言比，相差甚远。也许终究能实现，但代价与风险比客户端语言要高，得不偿失。

天知道还有没有机会和那位前同事再讨论这一话题呢。

更多精彩内容，关注我们▼▼

正文完

发表至： IT运维 MySQL Oracle 数据数据库

2023-02-28

0