东方创新力量崛起：DeepSeek的突围与“幻觉率”危机

2025-02-07 18:00:00 林华黎来源：东南网责任编辑：叶同辉

DeepSeek（深度求索）一经问世便声名鹊起。自1月13日起至2月6日DeepSeek连续14天问鼎美国AppStore搜索榜第一。2月7日DeepSeek相关概念股依旧全线上涨。

一家成立于2023年名不见经传的小公司，搅动了世界AI（人工智能）市场格局，抢到话语权：中国AI技术不再是“跟随者”，而是向“定义者”跨越式递进。

在美国对华技术封锁、硬件供应的压力下，DeepSeek来了一个漂亮的弯道超车。高效能的模型和极低的训练成本，是DeepSeek突围的关键。

AI行业普遍信奉规模定律：通过不断给模型“投喂”训练参数来提升模型性能。Deepseek创新推理模型，让模型自己通过思维链路分解问题，层层推导，得出答案。极少的标注数据，超强的推理能力，性能比肩OpenAI付费模型o1，但预训练费用（DeepSeek-R1）不到600万美元，是OpenAI同等模型训练成本的1/10，API定价也只有OpenAI的1/30。人送外号：AI界的“拼多多”。

DeepSeek的开源策略让全球开发者共享成果。创始人梁文峰在此前的采访中提到“英伟达的领先，不只是一个公司的努力，而是整个西方技术社区和产业共同努力的结果。中国AI发展同样需要这样的生态。”

DeepSeek无疑书写了2025年第一篇“爽文”，笔者也亲身体验了DeepSeek-R1系统，它的逻辑推演能力确实让人眼前一亮，但也有不可忽视的硬伤——容易“撒谎”，即高“幻觉率”。这是指推理模型的多层次非线性复杂架构，让少量错误的数据标注在层层迭代下，像滚雪球一样不断放大，最终出现答非所问、信息虚假的频率。在使用专业术语的语境下，幻觉率更是显著提高。GPT-4的幻觉率大约在10%到14%之间，而DeepSeek-R1的幻觉率高达14.3%，大大高于其前身V3的3.9%。Vectara机器学习团队指出，推理增强模型可能比普通大语言模型更易产生“幻觉”。而DeepSeek极强的推理和表达能力又让“幻觉”更逼真，难以识破。‌

AI模型的“幻觉”折射出背后的数据标注产业面临重要课题：AI应用场景的细分，需要数据标注更加准确、专业。高质量训练数据的短缺会成为行业进步的阻碍。

近日，国家发展改革委、国家数据局、财政部、人力资源和社会保障部四部门日前联合印发《关于促进数据标注产业高质量发展的实施意见》提出至2027年的发展目标：数据标注产业专业化、智能化及科技创新能力显著提升，产业规模大幅跃升，年均复合增长率超过20%。福建作为数字中国建设先行区，也在积极推进数据标注训练试点和基地建设：1月24日，福建省数据管理局发布“福建省数据标注基地”名单，为福建省数据标注产业发展提供坚实支撑；“数字工匠”培育计划的推进，也为福建省数字经济的发展不断输出强有力的人才和技术支持。

DeepSeek让中国科技力量成为暴风眼，国内外AI行业刮起的创新飓风不仅带来数字经济加速发展的巨大机遇，也让数据标记、数据确权、数据安全等领域面临诸多挑战。

（本网记者林华黎）

更多》产业经济

从Labubu爆火看中国原创IP出海新机遇

一个名为“Labubu(拉布布)”的小精灵,以其独特的兔耳、尖牙、“丑萌”的表情,在全球范 …[详细]

更多》专题聚焦

立足当地特色经营

福建海峡银行成立于1996年12月，是一家地方性股份制商业银行。成立以来，一代又一代的海行 …[详细]

东方创新力量崛起：DeepSeek的突围与“幻觉率”危机

从Labubu爆火看中国原创IP出海新机遇

立足当地 特色经营

立足当地特色经营