DeepSeek 让国内一众大模型同行度过了一个 " 痛苦 " 的春节。年前,DeepSeek 掀起 AI 海啸,有某大厂大模型业者就捶胸顿足:" 产品超出了我的想象,比咱家的各方面都好,真想跳槽到 DeepSeek。" 还有很多人反思,为啥咱自家就没做出 DeepSeek。也有业者不服气,认为 " 它的火只是一种情绪的泡沫。"
一、焦急:DeepSeek 比咱家的好太多
李辉(化名)是北京一家大模型公司的资深从业者。DeepSeek 爆火时,李辉的公司还没放假,他跟工位上的同事们展开热烈讨论。
" 我开玩笑说,真想跳槽到 DeepSeek。个人认为,产品能力与 ChatGPT 不存在差别,满意程度 80-90 分,国内其它大模型分数我只给一半。" 李辉说。
李辉的公司一直被认为是国内大模型行业的先行者,相关技术积累很深,过去一年与各行业开展大模型商业化应用,也取得了一些早收成果。但在李辉看来,DeepSeek 有两点让他觉得 " 很厉害、有希望 "。
一是产品能力。就李辉的使用体验,其它国内大模型用起来,十分挑用户输入的 prompt(提示词)。但 DeepSeek 用起来,向自然语言交互又迈进了一步。
" 不管说什么它都能理解,不用费劲解释或重新调整提示词,它回答起来上下文也很顺畅。"
李辉就让 DeepSeek 帮自己整理了一套某类型漫画,结果从中文到日文名,全部条分缕析、进行了罗列。" 我也有让它推荐下载地址,结果问了好几次都被 DeepSeek 拒绝,因为它也有版权保护意识。"
二是给行业带来了希望。李辉虽然身系 " 局中人 ",但他一直觉得:各行各业高估了大模型的作用。虽然 DeepSeek 的产品能力令他眼前一亮,但他仍然没有改变目前的观点。
" 让我稍微觉得欣慰的是,deepseek 用较为低廉的成本,取得了跟 OpenAI 差不多的效果,这意味着它的商业化发展有了更大的眉目。"
这句话切中的是 2024 年国内大模型的发展痛点。2023 年国内大模型烧的是钱、比的是技术,但到了 2024 年,国内各家都在抓紧探索大模型的商业化变现之路。
原因无它,只因为大模型是个烧钱机器,即便是账户上躺着数百亿现金的大公司,也经不起GPU、电力能源、训练成本三座吞金兽的重压。而 DeepSeek 推出后,全球乃至国内各家公司争相宣布接入,可以说 DeepSeek 正在给无资本、无技术、无知识储备的公司带来普惠。
如此夸竞对的产品,一个尴尬的问题也免不了被同事追问," 为何咱自家公司没能做出这样的产品?"
李辉说:" 做不出倒是符合预期。不仅咱们,国际上那么多巨头不也被干趴下了吗。很认真地说,如果有机会,我还真愿意跳槽去 DeepSeek。"
不过可能他已经晚了。小红书上,后悔没有接 DeepSeek offer 的帖子已经多如牛毛。
二、应激:这只是情绪的泡沫
李辉对 DeepSeek 这条鲶鱼是比较正向的评价,他痛苦自己 " 身在曹营心在汉 ",业内还有另一波 " 痛苦声音 " —不认同、不服气。
另一家总部位于北京的某大模型公司从业者王锐(化名),对 DeepSeek 的爆火持相对理性的态度。他和自家人都用 DeepSeek 做了测试,结果遇到两个 bug,让他对 DeepSeek 没有建立起先入为主的好印象。
他的父亲先是问 DeepSeek 立春是几时?别的大模型都能准确答出:是 22 时 10 分。但 DeepSeek 回答是:下午 4 点。
然后他自己又问 DeepSeek 春节档电影票房排名,结果 DeepSeek 把还没有上映的《流浪地球 3》也算了进来。
对小错误 " 斤斤计较 " 的背后,是王锐不认为市场主流的其他大模型产品能力就逊色于 DeepSeek," 大模型幻觉 "这个广泛存在的难题依旧存在。
他认为若一定要在此时此刻论 DeepSeek 的功绩,在于它在开创了全新的模型训练模式,在加速 AI 行业迭代的同时,对 AI 产品做了进一步的用户破圈,而这是 2024 年各家大模型都在努力去做但收效还在路上的一件事——即从重视 B 端客户(企业客户),转向面向 B 端和 C 端并重,尤其是 C 端,即普通人用户。
这个背景是,多家头部公司都在 2024 年不约而同地意识到:只靠 B 端客户,难以支撑起大模型的用户规模,因而需要 C 端也多多用起来,而面向 C 端用户推出相关 AI 应用级产品、探索相关的商业模式,成为各家去年重点发力目标。
2024 年,夸克(阿里系)和豆包(字节系)成为国内 166 款主要 App 中唯二迈入 " 亿级俱乐部 " 的玩家,成功为行业 AI to C 市场拓展打了个样。
而就在 2 月 6 日,阿里又宣布,引进全球顶尖人工智能科学家许主洪教授(Steven Hoi)出任集团副总裁,负责 AI To C 业务的多模态基础模型及 Agents(智能体)相关基础研究与应用解决方案,这些都是头部玩家在 AI to C 端市场布局的表现。更有媒体称,"AI to C 已经走到了 super APP 的前夜"。
不过 DeepSeek 虽然吸引了 1600 万次下载,但王锐有一个疑问是:很多人可能更多是出于一种跟风的情绪来下载使用它,而情绪从来就是一种泡沫。
《黑悟空》制作人冯骥就把 DeepSeek-R1,称为 " 国运级别的科技成果 "。在极客圈聚集的知乎和即刻平台内,也有人因而把 DeepSeek 视为 "AI 界的华为 ",但王锐认为,大家忽视了真正产品力上的对比。"而这些靠情绪而来的用户,是否真的是产品的核心高频用户,也是个疑问"。
图 | 截图来自冯骥微博
另一家 AI 公司从业者梁伦(化名)也和王锐持有部分相同的观点。他引用网上自来水的评价称," 感觉 DeepSeek 并没有 xx 产品(梁伦家的产品)回复的准确性高,这背后是资本的力量吗?"
但梁伦表示,DeepSeek 爆火后,身边同事也明显有了更乐观的情绪:" 这说明中国科技公司完全有机会挑战美国市场,也瞬间把国产 AI 的斗志给提了起来,之前那么多的冷嘲热讽,接下来的技术竞赛有得看。"
三、冷静:DeepSeek 能保持红利多久?
普通从业者对 DeepSeek 议论纷纷,很多是从个人角度考虑,比如是否应该跳槽,获得更大的职业发展性。老板们的眼界就不一样了。
去年 12 月末," 雷军出手千万年薪挖来 95 后 AI 天才少女罗福莉 " 的消息不胫而走,她被称为是 DeepSeek 的首席架构师。不过该消息并没有后续——即罗福莉官宣是否有加入。随着 DeepSeek 爆火全球,罗福莉是否产生了动摇不得而知。
舆论场上有一种声音,可能受到冲击更大的,是来自国内大模型的六大独角兽公司,也被称为 "AI 六小虎 "。
李辉就表示,此前 AI 六小虎对内讲故事,但在海外知名度多并不高,除了其中一家因被列入美国商务部的出口管制实体清单而在海外有了些许认知度外。因为国外大模型进不来,所以国内 AI 六小虎的故事,此前还多少还有点听众。
" 但现在就不同了,DeepSeek 直接就把战线拉到了跟 OpenAI、Gemini 齐平的水平。就在 2 月 6 日(昨日,编者注),Google 发布 Gemini 2.0(多模态大模型),媒体都报道剑指的就是 DeepSeek,这在之前是不可想象的。DeepSeek 对海外巨头形成了降维打击,接下来 AI 六小虎的故事、企业融资、企业估值是否有变化,值得关注。甚至是否会终结国内的百模大战,也不是不可能。"
此外,李辉还补充道,DeepSeek 可能反而会让业界对大模型的期待降低,DeepSeek 一定程度上戳破了大模型的泡沫,让行业回归理性。
" 之前是画大饼,现在是开始讲谁性价比更高了,因为大模型谁都能搓,但能搓出来既好用又便宜的才行。最近几个大模型发布的时候都在强调价格低。"
这说的确实也是事实。从 2024 年至今,各家大模型卷起了价格战。各大厂主力大模型纷纷降价,比如去年 5 月,通义千问 GPT-4 级主力模型 Qwen-Long,API 输入价格就直降 97%。这意味着,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。
其它诸如智谱 AI 等也都纷纷降价。有媒体冠上标题,"大模型定价进入了厘时代",意思是每一千 tokens 价格不足 1 厘。
不过,一如普通从业者的意见分化,国内也有不少来自机构的声音认为,目前市场对 DeepSeek 的" 追捧有点过了 "。
有大厂不愿意具名的业者就表示,"DeepSeek 目前可能还威胁不到大厂,因为大厂也能做。" 也有声音点出,可能 DeepSeek 目前更适合中小企业,因为中小企业一般都是 "哪个便宜够用就用哪个"。
李辉虽然觉得 DeepSeek 产品力很棒,但他仍然有两点疑问。DeepSeek-R1 的成本宣称仅为国外大模型的三十分之一 ,事实果真如此?
第二个疑问是,既然有 DeepSeek,就有可能哪天冒出来一个 DeepFind,DeepSeek 未必就是国内性价比大模型的终点。
就在昨日,有媒体报道,有 "AI 教母 " 之称的李飞飞等斯坦福大学和华盛顿大学的研究人员以不到 50 美元的云计算费用,成功训练出了一个名为 s1 的人工智能推理模型,据称该模型在数学和编码能力测试中的表现,与 Open AI 的 O1 和 DeepSeek 的 R1 等尖端模型不相上下。媒体采访相关业内人士后发现,s1 是基于阿里云通义千问模型进行了监督微调,意思是后者才是 " 真牛 "。
不管怎么说,国内有竞争,对各方都是好事一件。对于普通企业和个体用户来说,能够不断以较低的成本使用能力更强的 AI,就是利好。只是对从业者而言,在中国 AI 军团开始真正登上国际舞台肉搏的这个时代,痛苦和快感将是 2025 年的一体两面。
有话要说...