“AI界拼多多”?Deepseek发布新模型
近日,一家来自中国杭州的公司Deepseek在全球AI界刷屏。12月26日,Deepseek发布了全新系列模型DeepSeek-v3,一夜之间霸榜开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及 Claude-3.5-Sonnet不分伯仲。据了解,该模型的训练成本仅600万美元,成本降低10倍,资源运用效率极高。 套壳的吧 厉害厉害 中国人创新不一定最强,但是模仿一定是no1 颠覆性创新,某些老外已经用deepseek取代闭源gpt4o,因为完全开源 谁都能看到里面的代码 能很好作为研究模型进行二开 中国人只要不内卷,做什么都行。 训练算法超大模型,降低成本,老外都在热议,这可不是套壳,套壳阿里百度早上了。meta的llama 4080亿亿,花费上亿美元,1.2万张计算卡,这家公司6000多亿参数用了2000多张卡,花了两个月,训练成本不到700万美金。
成本降低97%,属于训练算法创新
页:
[1]