这几天,deepseek在朋友圈刷屏。本来没打算赶热点,到了下午看到这模型居然要“改变国运”了,就随意发表了几句评论:
关于新工具,比如DeepSeek,我是暂时不会使用的。因为(转换工具的)时间成本太昂贵,目前还是使用ChatGPT和Gemini。原则上,我不用一个只有好评、没有任何缺点的工具,不买单边上涨没有回调的牛市,不信任没有到的缺陷的圣人与名牧,不跟风东方三博士的油管,不买野德勒的方舟……
后来想起DeepSeek还在免费期,拿来试用一下也未尝不可,所以就在手机上装了一个。晚上在web端登录就慢多了,看起来全民薅羊毛带来的服务器压力已经开始了。去服务状态页看了一下,果然是“故障态已”,已经持续1个多小时,暂时已经无法登录。
好吧,我简单谈谈我对ai工具的使用策略。
第一,开源的ai模型与免费的ai大模型服务并不等同。ai模型开源的不少,因为问题不在于模型或源码,而在于算力。根据下午有限的测试,我问了deepseek一个简单的几何问题,大概是欧几里德原理的Proposition 22,deepseek的回答用了59秒。根据我的朋友圈刷屏的热度,估计过不了春节,运行deepseek的服务构架就会崩溃。当然,当服务崩溃的时候,许多人会绝望地发送更多测试问题,使得服务器的压力变得更大一些,略等于某种自发的“中断服务攻击”。
第二,我不喜欢免费服务。所谓免费的deepseek,暂时是在花着投资人的钱,一旦吸引了足够的用户量,立刻就会转入收费模式的。最好的办法是趁着免费期间建立自己使用deepseek的生产力模式,否则一旦开始收费,再来构建生产力模式就有点心疼了。
第三,我使用ai工具是为了提升效率。目前我主要的用途是编码、解决服务器配置的技术问题、修改英文写作、辅助神学翻译。在这些应用上,我觉得ChatGPT和Gemini,再加上copilot已经足够了。所以暂时没有动力测试新的ai工具。这三个工具我都使用付费订阅,因为我自己作为开发者和内容生产者,付费支持自己使用的软件工具持续更新,似乎是理所当然的事情。我付费的工具还有office 365,MemoQ,TurboTax,Bitwarden。此外,过去几年里每年我都会给Wikipedia做一点贡献,或者翻译文章,或者捐赠一点钱。在这个意义上,除非是自己部署的开源模型(自己在算力和服务器上投入),我对所有免费服务都有天然的担忧。
第四,deepSeek的蒸馏模型,使得回答变得更长,信息密度降低,阅读负担加重。当然,深度推理是很好的,但我有点受不了AI模型的唠叨。
第五,简单评估了一下deepseek的回答质量,在我目前最关注的神学翻译领域,在理解和术语的准确性上还是逊色于ChatGPT和Gemini。这大概是训练样本的质量造成的。
Anyway,DeepSeek这个产品实在是惊艳,在推理和代码任务方面甚至可能处于世界领先。我现在若有所保留,不过是在等待它收费而已。一旦进入商用,大概就可以认真测试,看看能否帮助提升生产力,其成本-效益比是否足以支撑长期付费使用了。至于自己部署模型,暂时还不在我的算力预算之内。