DeepSeek(深度求索)一经问世便声名鹊起。自1月13日起至2月6日DeepSeek连续14天问鼎美国AppStore搜索榜第一。2月7日DeepSeek相关概念股依旧全线上涨。 一家成立于2023年名不见经传的小公司,搅动了世界AI(人工智能)市场格局,抢到话语权:中国AI技术不再是“跟随者”,而是向“定义者”跨越式递进。 在美国对华技术封锁、硬件供应的压力下,DeepSeek来了一个漂亮的弯道超车。高效能的模型和极低的训练成本,是DeepSeek突围的关键。 AI行业普遍信奉规模定律:通过不断给模型“投喂”训练参数来提升模型性能。Deepseek创新推理模型,让模型自己通过思维链路分解问题,层层推导,得出答案。极少的标注数据,超强的推理能力,性能比肩OpenAI付费模型o1,但预训练费用(DeepSeek-R1)不到600万美元,是OpenAI同等模型训练成本的1/10,API定价也只有OpenAI的1/30。人送外号:AI界的“拼多多”。 DeepSeek的开源策略让全球开发者共享成果。创始人梁文峰在此前的采访中提到“英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。中国AI发展同样需要这样的生态。” DeepSeek无疑书写了2025年第一篇“爽文”,笔者也亲身体验了DeepSeek-R1系统,它的逻辑推演能力确实让人眼前一亮,但也有不可忽视的硬伤——容易“撒谎”,即高“幻觉率”。这是指推理模型的多层次非线性复杂架构,让少量错误的数据标注在层层迭代下,像滚雪球一样不断放大,最终出现答非所问、信息虚假的频率。在使用专业术语的语境下,幻觉率更是显著提高。GPT-4的幻觉率大约在10%到14%之间,而DeepSeek-R1的幻觉率高达14.3%,大大高于其前身V3的3.9%。Vectara机器学习团队指出,推理增强模型可能比普通大语言模型更易产生“幻觉”。而DeepSeek极强的推理和表达能力又让“幻觉”更逼真,难以识破。 AI模型的“幻觉”折射出背后的数据标注产业面临重要课题:AI应用场景的细分,需要数据标注更加准确、专业。高质量训练数据的短缺会成为行业进步的阻碍。 近日,国家发展改革委、国家数据局、财政部、人力资源和社会保障部四部门日前联合印发《关于促进数据标注产业高质量发展的实施意见》提出至2027年的发展目标:数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。福建作为数字中国建设先行区,也在积极推进数据标注训练试点和基地建设:1月24日,福建省数据管理局发布“福建省数据标注基地”名单,为福建省数据标注产业发展提供坚实支撑;“数字工匠”培育计划的推进,也为福建省数字经济的发展不断输出强有力的人才和技术支持。 DeepSeek让中国科技力量成为暴风眼,国内外AI行业刮起的创新飓风不仅带来数字经济加速发展的巨大机遇,也让数据标记、数据确权、数据安全等领域面临诸多挑战。 (林华黎) |