国产模型何时崛起?deepseekV4已经N个下周了。!
半个外行来看,模型的几大关键要素:数据,算力与模型
-
数据:中文互联网不缺字,缺*高质量长文本和专业版权数据。很多高质量的学术数据都是英文的,但是现在的大厂应该能拿到这些,预训练与一梯队差距能有多大?
-
模型:工程优化做到极致(便宜、长文本),但底层架构创新虽有,但是似乎很难有跨阶级突破,都是相互借鉴然后小步慢跑?话说opus 5T量级,sonnet都有1T,别人都在搞10T了
-
算力:单卡算力靠堆料能追,但HBM显存禁运 + CUDA生态垄断是实打实的枷锁。集群跑不稳,成本降不下来。未来在那里?
个人期望: 我们的电力资源是得天独厚的,希望大家早点尝到更多的国产甜头,都不需要A\这些赏饭吃。
7 个帖子 - 7 位参与者