“AI界拼多多”？Deepseek发布新模型

左右不逢缘 发表于 2024-12-29 22:41:48

近日，一家来自中国杭州的公司Deepseek在全球AI界刷屏。12月26日，Deepseek发布了全新系列模型DeepSeek-v3，一夜之间霸榜开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及 Claude-3.5-Sonnet不分伯仲。据了解，该模型的训练成本仅600万美元，成本降低10倍，资源运用效率极高。

独家记忆 发表于 2024-12-29 22:42:36

套壳的吧

TyCoding 发表于 2024-12-29 22:43:06

厉害厉害

TyCoding 发表于 2024-12-29 22:43:21

中国人创新不一定最强，但是模仿一定是no1

拾光发表于 2024-12-29 22:43:43

颠覆性创新，某些老外已经用deepseek取代闭源gpt4o，因为完全开源谁都能看到里面的代码能很好作为研究模型进行二开

拾光发表于 2024-12-29 22:44:10

中国人只要不内卷，做什么都行。

独家记忆 发表于 2024-12-29 22:44:15

训练算法超大模型，降低成本，老外都在热议，这可不是套壳，套壳阿里百度早上了。

meta的llama 4080亿亿，花费上亿美元，1.2万张计算卡，这家公司6000多亿参数用了2000多张卡，花了两个月，训练成本不到700万美金。

成本降低97%，属于训练算法创新

页: [1]

DZ插件网's Archiver

“AI界拼多多”？Deepseek发布新模型