左右不逢缘 发表于 2024-12-29 22:41:48

“AI界拼多多”?Deepseek发布新模型

近日,一家来自中国杭州的公司Deepseek在全球AI界刷屏。12月26日,Deepseek发布了全新系列模型DeepSeek-v3,一夜之间霸榜开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及 Claude-3.5-Sonnet不分伯仲。据了解,该模型的训练成本仅600万美元,成本降低10倍,资源运用效率极高。

独家记忆 发表于 2024-12-29 22:42:36

套壳的吧

TyCoding 发表于 2024-12-29 22:43:06

厉害厉害

TyCoding 发表于 2024-12-29 22:43:21

中国人创新不一定最强,但是模仿一定是no1

拾光 发表于 2024-12-29 22:43:43

颠覆性创新,某些老外已经用deepseek取代闭源gpt4o,因为完全开源 谁都能看到里面的代码 能很好作为研究模型进行二开

拾光 发表于 2024-12-29 22:44:10

中国人只要不内卷,做什么都行。

独家记忆 发表于 2024-12-29 22:44:15

训练算法超大模型,降低成本,老外都在热议,这可不是套壳,套壳阿里百度早上了。

meta的llama 4080亿亿,花费上亿美元,1.2万张计算卡,这家公司6000多亿参数用了2000多张卡,花了两个月,训练成本不到700万美金。

成本降低97%,属于训练算法创新
页: [1]
查看完整版本: “AI界拼多多”?Deepseek发布新模型