在全球科技界引起冲击的中国AI 初创公司DeepSeek是什么?

ArrayDeepSeek 是一家鲜为人知的中国初创公司,它发布了一款人工智能 (AI) 模型,其能力可与谷歌和 OpenAI 的创作相媲美,在全球科技界掀起了冲击波。 DeepSeek-R1 的创建者表示,其模型的开发所用的计算机芯片比美国科技巨头所用的芯片更少,而且先进程度也较低。阅读更多 list of 4 itemslist 1 of 4哥伦比亚屈服于特朗普风暴 华盛顿强加其条件list 2 of 4中国“深度求索”引发人工智能相关股票暴跌list 3 of 4特朗普发出关税威胁后,哥伦比亚在驱逐航班问题上让步list 4 of 4特朗普转向化石燃料而欧洲加速推进可再生能源end of list 在上周发布的一份研究论文中,该模型的开发团队表示,他们在训练该模型的计算能力上花费了不到 600 万美元,这只是美国科技巨头 OpenAI 和谷歌(ChatGPT 和 Gemini 的创造者)数十亿美元人工智能预算的一小部分。 硅谷最具影响力的科技风险投资家之一马克·安德森 (Marc Andreessen) 将该模型的发布称为“人工智能的斯普特尼克时刻”。 一家能够与硅谷顶级企业相媲美的中国小型初创公司的突然出现,挑战了人们对美国在人工智能领域主导地位的假设,并引发了人们对 英伟达和 Meta 等公司高昂的市场估值可能脱离现实的担忧。 周一,在生产驱动生成人工智能的半导体方面几乎垄断的英伟达股价暴跌 17%,市值蒸发近 6000 亿美元。 美国总统唐纳德·特朗普上周宣布启动一项价值 5000 亿美元的人工智能计划,由 OpenAI、总部位于德克萨斯州的甲骨文和日本软银集团牵头。特朗普表示,DeepSeek 应该成为“警钟”,提醒美国工业界需要“全神贯注于竞争以赢得胜利”。 DeepSeek是什么? DeepSeek 总部位于杭州,由连续创业者梁文峰于 2023 年底创立,梁文峰还经营着对冲基金 High-Flyer。 虽然梁文峰在中国以外鲜为人知,但他在将新兴技术与投资相结合方面有着丰富的经验。 据中国媒体新浪财经报道,2013 年,他与浙江大学的一位校友共同创立了杭州雅克比投资管理有限公司,这是一家使用人工智能实施交易策略的投资公司。 梁文峰随后分别于 2015 年和 2016 年成立了另外两家专注于计算机导向投资的公司——杭州幻方科技有限公司和宁波幻方量化投资管理合伙企业。 人工智能的使用如何影响人际关系?【英语视频】 在 2023 年接受中国媒体 Waves 采访时,梁文峰驳斥了初创公司涉足人工智能为时已晚或成本过高的说法。 根据 ChinaTalk Substack 发布的他的评论翻译,梁文峰说,“仅复制成本就相对低廉——基于公开论文和开源代码,最少的训练时间,甚至微调就足够了。然而,研究涉及大量实验、比较以及更高的计算和人才要求。” 梁文峰说,他对人工智能的兴趣主要受到“好奇心”的驱动。 根据记录,梁文峰说,“从更广泛的角度来看,我们想验证某些假设。例如,我们假设人类智能的本质可能是语言,而人类思维本质上可能是一个语言过程。” 他补充道,“你认为的‘思考’实际上可能是你的大脑编织语言。这表明,类似人类的通用人工智能可能从大型语言模型中诞生,”他指的是人工智能(AGI),一种试图模仿人类思维认知能力的人工智能。 DeepSeek 没有立即回应置评请求。 周一,《华尔街日报》记者格雷戈里·扎克曼表示,他了解到,他之前从未听说过的梁文峰为一本关于已故美国对冲基金经理詹姆斯·西蒙斯的书的中文版撰写了序言。 扎克曼在一篇专栏文章中写道,“显然,西蒙斯留下了深刻的影响,”并描述了梁文峰如何称赞他的书是一部“解开了许多以前未解之谜并为我们带来丰富经验值得借鉴”的巨著。 扎克曼写道,“就连我的母亲也没有从这本书中得到那么多。” 为什么 DeepSeek 会席卷科技界? 简而言之,该公司的成功引发了人们对硅谷和美国政府在人工智能领域所采取的方法的质疑。 人们普遍认为,美国科技公司在人工智能领域具有关键优势,尤其是因为它们规模庞大,这使得它们能够吸引来自世界各地的顶尖人才,并投入巨额资金建设数据中心和购买大量昂贵的高端芯片。 DeepSeek 的出现挑战了需要数十亿美元才能走在人工智能前沿的假设。 市场分析通讯《Kobeissi Letter》的创始人 亚当(Adam Kobeissi)周一在 X 上表示,“OpenAI 成立于 10 年前,拥有 4500 名员工,并筹集了 66 亿美元的资金。DeepSeek 成立不到 2 年,拥有 200 名员工,开发成本不到 1000 万美元。” “这两家公司现在怎么会成为竞争对手了?” DeepSeek 的工程师在研究论文中表示,他们使用了大约 2000 块 英伟达H800 芯片来训练其模型,这些芯片的先进程度不如最先进的芯片。 该团队表示,他们利用多个专门的模型协同工作,使速度较慢的芯片能够更有效地分析数据。 对于美国政府来说,DeepSeek 的出现引发了人们对其试图通过限制高端芯片出口来遏制中国人工智能进步的战略的质疑。 DeepSeek 的研究论文表明,要么最先进的芯片不需要创建高性能的人工智能模型,要么中国公司仍然可以采购足够数量的芯片——或者两者兼而有之。 特朗普宣布斥资 5000 亿美元建立 AI 基础设施的“星际之门”项目【英语视频】 总部位于加州的英伟达的 H800 芯片旨在遵守美国的出口管制,在 2023 年 10 月之前,这些芯片一直自由出口到中国,当时,时任总统乔·拜登政府将其列入了限制物品清单。 梁文峰在 2023 年接受 Waves 采访时表示,他的公司在英伟达 A100 GPU 被禁止出口之前就储存了 10000 个。GPU 或图形处理单元是用于加速计算设备上的图形和图像处理的电子电路。 Stability AI 前研究总监塔尼什克·亚伯拉罕(Tanishq Abraham)表示,鉴于阿里巴巴和百川等中国公司推出了各种模型,他对中国在 AI 方面的进步水平并不感到惊讶。 亚伯拉罕告诉半岛电视台说,“尽管中国获得 GPU 的能力受到限制,但中国仍然设法创新并从他们拥有的一切中榨取性能。” “我认为这给美国公司上了一课,他们仍然可以挖掘出很多潜力。” 加州大学圣地亚哥分校机器智能、计算和安全中心联席主任塔拉·贾维迪表示,DeepSeek 让她对全球人工智能发展的“快速进展”感到兴奋。 贾维迪告诉半岛电视台说,“我唯一的希望是,对这一声明的关注将激发人们对该主题的更大兴趣,进一步扩大人才库,最后但并非最不重要的是,增加美国对人工智能研究的私人和公共投资。” 2025 年 1 月 27 日纽约证券交易所开市(法新社) 与此同时,投资者对美国科技界的信心受到了打击——至少在短期内如此。 除了英伟达的大幅下滑外,谷歌母公司 Alphabet 和微软的股价周一分别下跌 4.03% 和 2.14%,但苹果和亚马逊收盘上涨。 昆士兰大学专门研究人工智能的教授蒂姆·米勒告诉半岛电视台说,“如果 DeepSeek 的成本数字是真实的,那么现在几乎任何公司的任何大型组织都可以在此基础上构建和托管它。” “所以,从这个意义上说,游戏已经完全改变了,因为有一个新的‘规则’,任何人都可以玩。” 这是否意味着中国正在赢得人工智能竞赛? 不一定。 虽然技术分析师普遍认为 DeepSeek-R1 的表现与 ChatGPT 相似——甚至在某些任务上表现更好——但该领域正在快速发展。 OpenAI 首席执行官萨姆·奥尔特曼本月早些时候表示,该公司将在考虑用户反馈后数周内发布其最新的推理 AI 模型 o3 mini。 周一,奥尔特曼承认 DeepSeek-R1“令人印象深刻”,同时为公司对更强大计算能力的关注辩护。 奥尔特曼在 X 上说道,“我们显然会提供更好的模型,而且有一个新的竞争对手也令人振奋! 我们会发布一些版本。” “但我们最高兴的是继续执行我们的研究路线图,并相信现在比以往任何时候都更重要的是,更多的计算才能使我们的使命取得成功。” 2025 年 1 月 21 日,OpenAI 首席执行官萨姆·奥尔特曼在华盛顿特区白宫与美国总统唐纳德·特朗普一起出席新闻发布会(法新社) Tech Buzz China 创始人马睿表示,当 OpenAI 于 2022 年首次发布 ChatGPT 时,中国科技行业本身也大吃一惊。 马睿告诉半岛电视台说,“大多数企业家完全错过了生成式人工智能所代表的机会,感到非常谦卑。” “很明显,他们从那时起就一直在努力工作。我认为上周末向我们展示了他们是多么认真地自我反省,并接受了‘赶上’硅谷的挑战。我认为,为了让美国保持领先地位,华盛顿应该专注于推动硅谷的发展,而不是压制中国。” Stability AI 前研究主管亚伯拉罕表示,人们的看法也可能受到这样一个事实的影响:与 DeepSeek 不同,OpenAI 等公司尚未向公众免费提供其最先进的模型。 他说,“DeepSeek 将其最佳模型免费提供使用。另一方面,OpenAI 的最佳模型并不免费。” “因此,大多数免费使用 ChatGPT 的人都对 DeepSeek 感到震惊,并认为 DeepSeek 的能力有了巨大的提升,而 OpenAI 已经将类似的性能模型付费了几个月。这种对前沿人工智能模型的付费导致人们无法真正掌握人工智能的进展和能力。” 昆士兰大学教授米勒表示,DeepSeek 的进步和其他最新发展表明,中国在人工智能领域至少与美国“并驾齐驱”。 他说,“去年年底,我曾做过一个有点不经意的预测,人工智能的下一个科学突破可能来自一个小参与者,比如一个没有太多计算能力的大学研究人员——他们需要更聪明才能参与竞争。” “DeepSeek 的明显进步几乎就是一个例子:由于没有足够的计算能力来构建像 ChatGPT 一样大的模型,他们必须更聪明,需要是发明之母。” 来源 : 半岛电视台

1月 30, 2025 - 23:30
 3541
在全球科技界引起冲击的中国AI 初创公司DeepSeek是什么?

DeepSeek 是一家鲜为人知的中国初创公司,它发布了一款人工智能 (AI) 模型,其能力可与谷歌和 OpenAI 的创作相媲美,在全球科技界掀起了冲击波。

DeepSeek-R1 的创建者表示,其模型的开发所用的计算机芯片比美国科技巨头所用的芯片更少,而且先进程度也较低。

在上周发布的一份研究论文中,该模型的开发团队表示,他们在训练该模型的计算能力上花费了不到 600 万美元,这只是美国科技巨头 OpenAI 和谷歌(ChatGPT 和 Gemini 的创造者)数十亿美元人工智能预算的一小部分。

硅谷最具影响力的科技风险投资家之一马克·安德森 (Marc Andreessen) 将该模型的发布称为“人工智能的斯普特尼克时刻”。

一家能够与硅谷顶级企业相媲美的中国小型初创公司的突然出现,挑战了人们对美国在人工智能领域主导地位的假设,并引发了人们对 英伟达和 Meta 等公司高昂的市场估值可能脱离现实的担忧。

周一,在生产驱动生成人工智能的半导体方面几乎垄断的英伟达股价暴跌 17%,市值蒸发近 6000 亿美元。

美国总统唐纳德·特朗普上周宣布启动一项价值 5000 亿美元的人工智能计划,由 OpenAI、总部位于德克萨斯州的甲骨文和日本软银集团牵头。特朗普表示,DeepSeek 应该成为“警钟”,提醒美国工业界需要“全神贯注于竞争以赢得胜利”。

DeepSeek是什么?

DeepSeek 总部位于杭州,由连续创业者梁文峰于 2023 年底创立,梁文峰还经营着对冲基金 High-Flyer。

虽然梁文峰在中国以外鲜为人知,但他在将新兴技术与投资相结合方面有着丰富的经验。

据中国媒体新浪财经报道,2013 年,他与浙江大学的一位校友共同创立了杭州雅克比投资管理有限公司,这是一家使用人工智能实施交易策略的投资公司。

梁文峰随后分别于 2015 年和 2016 年成立了另外两家专注于计算机导向投资的公司——杭州幻方科技有限公司和宁波幻方量化投资管理合伙企业。

人工智能的使用如何影响人际关系?【英语视频】

在 2023 年接受中国媒体 Waves 采访时,梁文峰驳斥了初创公司涉足人工智能为时已晚或成本过高的说法。

根据 ChinaTalk Substack 发布的他的评论翻译,梁文峰说,“仅复制成本就相对低廉——基于公开论文和开源代码,最少的训练时间,甚至微调就足够了。然而,研究涉及大量实验、比较以及更高的计算和人才要求。”

梁文峰说,他对人工智能的兴趣主要受到“好奇心”的驱动。

根据记录,梁文峰说,“从更广泛的角度来看,我们想验证某些假设。例如,我们假设人类智能的本质可能是语言,而人类思维本质上可能是一个语言过程。”

他补充道,“你认为的‘思考’实际上可能是你的大脑编织语言。这表明,类似人类的通用人工智能可能从大型语言模型中诞生,”他指的是人工智能(AGI),一种试图模仿人类思维认知能力的人工智能。

DeepSeek 没有立即回应置评请求。

周一,《华尔街日报》记者格雷戈里·扎克曼表示,他了解到,他之前从未听说过的梁文峰为一本关于已故美国对冲基金经理詹姆斯·西蒙斯的书的中文版撰写了序言。

扎克曼在一篇专栏文章中写道,“显然,西蒙斯留下了深刻的影响,”并描述了梁文峰如何称赞他的书是一部“解开了许多以前未解之谜并为我们带来丰富经验值得借鉴”的巨著。

扎克曼写道,“就连我的母亲也没有从这本书中得到那么多。”

为什么 DeepSeek 会席卷科技界?

简而言之,该公司的成功引发了人们对硅谷和美国政府在人工智能领域所采取的方法的质疑。

人们普遍认为,美国科技公司在人工智能领域具有关键优势,尤其是因为它们规模庞大,这使得它们能够吸引来自世界各地的顶尖人才,并投入巨额资金建设数据中心和购买大量昂贵的高端芯片。

DeepSeek 的出现挑战了需要数十亿美元才能走在人工智能前沿的假设。

市场分析通讯《Kobeissi Letter》的创始人 亚当(Adam Kobeissi)周一在 X 上表示,“OpenAI 成立于 10 年前,拥有 4500 名员工,并筹集了 66 亿美元的资金。DeepSeek 成立不到 2 年,拥有 200 名员工,开发成本不到 1000 万美元。”

“这两家公司现在怎么会成为竞争对手了?”

DeepSeek 的工程师在研究论文中表示,他们使用了大约 2000 块 英伟达H800 芯片来训练其模型,这些芯片的先进程度不如最先进的芯片。

该团队表示,他们利用多个专门的模型协同工作,使速度较慢的芯片能够更有效地分析数据。

对于美国政府来说,DeepSeek 的出现引发了人们对其试图通过限制高端芯片出口来遏制中国人工智能进步的战略的质疑。

DeepSeek 的研究论文表明,要么最先进的芯片不需要创建高性能的人工智能模型,要么中国公司仍然可以采购足够数量的芯片——或者两者兼而有之。

特朗普宣布斥资 5000 亿美元建立 AI 基础设施的“星际之门”项目【英语视频】

总部位于加州的英伟达的 H800 芯片旨在遵守美国的出口管制,在 2023 年 10 月之前,这些芯片一直自由出口到中国,当时,时任总统乔·拜登政府将其列入了限制物品清单。

梁文峰在 2023 年接受 Waves 采访时表示,他的公司在英伟达 A100 GPU 被禁止出口之前就储存了 10000 个。GPU 或图形处理单元是用于加速计算设备上的图形和图像处理的电子电路。

Stability AI 前研究总监塔尼什克·亚伯拉罕(Tanishq Abraham)表示,鉴于阿里巴巴和百川等中国公司推出了各种模型,他对中国在 AI 方面的进步水平并不感到惊讶。

亚伯拉罕告诉半岛电视台说,“尽管中国获得 GPU 的能力受到限制,但中国仍然设法创新并从他们拥有的一切中榨取性能。”

“我认为这给美国公司上了一课,他们仍然可以挖掘出很多潜力。”

加州大学圣地亚哥分校机器智能、计算和安全中心联席主任塔拉·贾维迪表示,DeepSeek 让她对全球人工智能发展的“快速进展”感到兴奋。

贾维迪告诉半岛电视台说,“我唯一的希望是,对这一声明的关注将激发人们对该主题的更大兴趣,进一步扩大人才库,最后但并非最不重要的是,增加美国对人工智能研究的私人和公共投资。”

2025 年 1 月 27 日纽约证券交易所开市(法新社)

与此同时,投资者对美国科技界的信心受到了打击——至少在短期内如此。

除了英伟达的大幅下滑外,谷歌母公司 Alphabet 和微软的股价周一分别下跌 4.03% 和 2.14%,但苹果和亚马逊收盘上涨。

昆士兰大学专门研究人工智能的教授蒂姆·米勒告诉半岛电视台说,“如果 DeepSeek 的成本数字是真实的,那么现在几乎任何公司的任何大型组织都可以在此基础上构建和托管它。”

“所以,从这个意义上说,游戏已经完全改变了,因为有一个新的‘规则’,任何人都可以玩。”

这是否意味着中国正在赢得人工智能竞赛?

不一定。

虽然技术分析师普遍认为 DeepSeek-R1 的表现与 ChatGPT 相似——甚至在某些任务上表现更好——但该领域正在快速发展。

OpenAI 首席执行官萨姆·奥尔特曼本月早些时候表示,该公司将在考虑用户反馈后数周内发布其最新的推理 AI 模型 o3 mini。

周一,奥尔特曼承认 DeepSeek-R1“令人印象深刻”,同时为公司对更强大计算能力的关注辩护。

奥尔特曼在 X 上说道,“我们显然会提供更好的模型,而且有一个新的竞争对手也令人振奋! 我们会发布一些版本。”

“但我们最高兴的是继续执行我们的研究路线图,并相信现在比以往任何时候都更重要的是,更多的计算才能使我们的使命取得成功。”

2025 年 1 月 21 日,OpenAI 首席执行官萨姆·奥尔特曼在华盛顿特区白宫与美国总统唐纳德·特朗普一起出席新闻发布会(法新社)

Tech Buzz China 创始人马睿表示,当 OpenAI 于 2022 年首次发布 ChatGPT 时,中国科技行业本身也大吃一惊。

马睿告诉半岛电视台说,“大多数企业家完全错过了生成式人工智能所代表的机会,感到非常谦卑。”

“很明显,他们从那时起就一直在努力工作。我认为上周末向我们展示了他们是多么认真地自我反省,并接受了‘赶上’硅谷的挑战。我认为,为了让美国保持领先地位,华盛顿应该专注于推动硅谷的发展,而不是压制中国。”

Stability AI 前研究主管亚伯拉罕表示,人们的看法也可能受到这样一个事实的影响:与 DeepSeek 不同,OpenAI 等公司尚未向公众免费提供其最先进的模型。

他说,“DeepSeek 将其最佳模型免费提供使用。另一方面,OpenAI 的最佳模型并不免费。”

“因此,大多数免费使用 ChatGPT 的人都对 DeepSeek 感到震惊,并认为 DeepSeek 的能力有了巨大的提升,而 OpenAI 已经将类似的性能模型付费了几个月。这种对前沿人工智能模型的付费导致人们无法真正掌握人工智能的进展和能力。”

昆士兰大学教授米勒表示,DeepSeek 的进步和其他最新发展表明,中国在人工智能领域至少与美国“并驾齐驱”。

他说,“去年年底,我曾做过一个有点不经意的预测,人工智能的下一个科学突破可能来自一个小参与者,比如一个没有太多计算能力的大学研究人员——他们需要更聪明才能参与竞争。”

“DeepSeek 的明显进步几乎就是一个例子:由于没有足够的计算能力来构建像 ChatGPT 一样大的模型,他们必须更聪明,需要是发明之母。”

来源 : 半岛电视台