发布日期:2026-06-16 14:22 点击次数:91

万众期待的DeepSeek新模子揭开面纱。4月24日, DeepSeek全新系列模子V4预览版块持重上线并同步开源。这次DeepSeek统统上线两个版块,DeepSeek-V4-Pro对标顶级闭源模子,1.6T,49B激活,陡立文长度1M;DeepSeek-V4-Flash系更小更快的经济版,284B,13B激活,陡立文长度1M。 21点棋牌app2026中国最新版官网
早在4月8日,DeepSeek App就仍是进行了改版,上线营救复杂推理的“巨匠时势”,和贬责浮浅任务的“快速时势”。跟着V4的发布不错看到,负责“巨匠时势”的是1.6T参数目的V4-pro,营救“快速时势”的则是284B的V4-flash。
博亚体育app中国官网入口据先容,DeepSeek-V4领有百万字超长陡立文,在Agent才能、全国学问和推感性能上均完了国内与开源限制的越过。DeepSeek-V4-Pro性能并排顶级闭源模子。辞全国学问测评中,大幅越过其他开源模子,仅稍逊于顶尖闭源模子Gemini-Pro-3.1。
比拟前代模子,DeepSeek-V4-Pro的Agent才能权臣增强。在Agentic Coding评测中,V4-Pro已达到现时开源模子最好水平,并在其他Agent联系评测中相同阐扬优异。
自R1版块发布以来,DeepSeek就被视为以转换表情引颈模子发展。这一次新模子发布也不例外,据DeepSeek先容,DeepSeek-V4创始了一种全新的注重力机制,在token维度进行压缩,21点棋牌app2026中国最新版下载麇集DSA疏淡注重力(DeepSeek Sparse Attention),完了了寰球越过的长陡立文才能,何况比拟于传统方法大幅裁汰了对计较和显存的需求。
当年DeepSeek网页版最多陡立文长度是128K,从4月24日驱动1M是全线官方做事的默许陡立文。据先容,这一变化背后是新的注重力机制V4在token维度作念压缩,再重复DeepSeek自家的DSA疏淡注重力。成果上,现在1M陡立文下,V4-Pro的单token推理FLOPs独一V3.2的27%,KV cache只消V3.2的10%。V4-Flash更极致,单token FLOPs只消V3.2的10%,KV cache只消 7%。
近段时代以来,DeepSeek另一个备受顺心的音书是,梁文锋终于对外部融资松了口。此前有音书称,DeepSeek正在洽道融资,投资方为腾讯与阿里巴巴,DeepSeek本轮融资的估值约200亿好意思元。那时,DeepSeek、腾讯、阿里三方均未公开证据或回话上述投资意向。
此外,业界也以为,DeepSeek新模子蜗步龟移或与V4将覆按框架从英伟达迁徙到华为昇腾上磋磨。据悉,DeepSeek V4将摄取华为本领公司探讨的最新芯片,部署国产算力。
现在,DeepSeek-V4-Pro每百万tokens输入(缓存掷中)价钱为1元,每百万tokens输入(缓存未掷中)价钱为12元;每百万tokens输出价钱为24元。DeepSeek强调,输入下半年昇腾950超节点批量上市后,pro版块价钱会大幅下调。
更简易的DeepSeek-V4-Flash每百万tokens输入(缓存掷中)价钱为0.2元,每百万tokens输入(缓存未掷中)价钱为1元;每百万tokens输出价钱为2元。
采写:南齐N视频记者 林文琪