工具理性（3）| 我对deepseek的使用

这几天，deepseek在朋友圈刷屏。本来没打算赶热点，到了下午看到这模型居然要“改变国运”了，就随意发表了几句评论：

关于新工具，比如DeepSeek，我是暂时不会使用的。因为（转换工具的）时间成本太昂贵，目前还是使用ChatGPT和Gemini。原则上，我不用一个只有好评、没有任何缺点的工具，不买单边上涨没有回调的牛市，不信任没有到的缺陷的圣人与名牧，不跟风东方三博士的油管，不买野德勒的方舟……

后来想起DeepSeek还在免费期，拿来试用一下也未尝不可，所以就在手机上装了一个。晚上在web端登录就慢多了，看起来全民薅羊毛带来的服务器压力已经开始了。去服务状态页看了一下，果然是“故障态已”，已经持续1个多小时，暂时已经无法登录。

好吧，我简单谈谈我对ai工具的使用策略。

第一，开源的ai模型与免费的ai大模型服务并不等同。ai模型开源的不少，因为问题不在于模型或源码，而在于算力。根据下午有限的测试，我问了deepseek一个简单的几何问题，大概是欧几里德原理的Proposition 22，deepseek的回答用了59秒。根据我的朋友圈刷屏的热度，估计过不了春节，运行deepseek的服务构架就会崩溃。当然，当服务崩溃的时候，许多人会绝望地发送更多测试问题，使得服务器的压力变得更大一些，略等于某种自发的“中断服务攻击”。

第二，我不喜欢免费服务。所谓免费的deepseek，暂时是在花着投资人的钱，一旦吸引了足够的用户量，立刻就会转入收费模式的。最好的办法是趁着免费期间建立自己使用deepseek的生产力模式，否则一旦开始收费，再来构建生产力模式就有点心疼了。

第三，我使用ai工具是为了提升效率。目前我主要的用途是编码、解决服务器配置的技术问题、修改英文写作、辅助神学翻译。在这些应用上，我觉得ChatGPT和Gemini，再加上copilot已经足够了。所以暂时没有动力测试新的ai工具。这三个工具我都使用付费订阅，因为我自己作为开发者和内容生产者，付费支持自己使用的软件工具持续更新，似乎是理所当然的事情。我付费的工具还有office 365，MemoQ，TurboTax，Bitwarden。此外，过去几年里每年我都会给Wikipedia做一点贡献，或者翻译文章，或者捐赠一点钱。在这个意义上，除非是自己部署的开源模型（自己在算力和服务器上投入），我对所有免费服务都有天然的担忧。

第四，deepSeek的蒸馏模型，使得回答变得更长，信息密度降低，阅读负担加重。当然，深度推理是很好的，但我有点受不了AI模型的唠叨。

第五，简单评估了一下deepseek的回答质量，在我目前最关注的神学翻译领域，在理解和术语的准确性上还是逊色于ChatGPT和Gemini。这大概是训练样本的质量造成的。

Anyway，DeepSeek这个产品实在是惊艳，在推理和代码任务方面甚至可能处于世界领先。我现在若有所保留，不过是在等待它收费而已。一旦进入商用，大概就可以认真测试，看看能否帮助提升生产力，其成本-效益比是否足以支撑长期付费使用了。至于自己部署模型，暂时还不在我的算力预算之内。