
如何理解 DeepSeek 最新提出的 mHC 架构? - 知乎
而DeepSeek的这个选择,简直是神来之笔。 具体来看看双随机矩阵的一些性质,你就能明白Deepseek这样选择的深意。 先说谱范数的事儿。 双随机矩阵有个非常好的性质——它的谱范 …
如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚 …
普通人怎样用好Deepseek? - 知乎
DeepSeek-R1则专门是为了 代码生成+数学问题解决 而设计,整体速度极快,精确度实测后非常高,推理能力一流。 适合需要快速实现技术需求的场景,比如程序员、理工科学生等。
deepseek官网地址告诉我? - 知乎
Feb 2, 2025 · DeepSeek简介: DeepSeek,特别是V3版本,因其十分有效的控制训练模型成本和开源免费的模式震惊全球,登顶应用商店的下载排行榜,甚至重创国外的科技股,而且截止到 …
有必要自己将deepseek部署到本地吗? - 知乎
Feb 13, 2025 · 所以我认为,deepseek部署有可行性就够了,至于有没有必要性,很多人没那么重要。 大家听到openai训练ai需要几千亿美元,让ai推理需要十块H100 (一块280万人民币),部 …
DeepSeek深度思考和联网搜索有什么区别? - 知乎
Feb 5, 2025 · DeepSeek为大家提供了:深度思考R1和联网搜索,两个功能强悍的按钮,但,在和知乎网友的交流过程中,我发现有很多人,不知道这两个强悍的工具如何搭配使用。 今天就 …
求问deepseek出现这种情况怎么办啊? ? - 知乎
Jan 31, 2025 · DeepSeek 不是告诉你原因和解法了嘛。 原因:当前对话已超出深度思考的最大长度限制 解法:开启一个新对话继续思考吧 至于具体解释,得看这几个参数,DeepSeek R1 的 …
如何评价 DeepSeek 于 2025 年 8 月 19 日更新的 V3.1 版本?
Aug 22, 2025 · 重点 2:DeepSeek V3-0324 和 DeepSeek V3 用的同一个 base model,但这次的 V3.1 放出了新的 base model,大概率是重新训的新模型。 DeepSeek 的逻辑可能是,只要 …
如何评价2025年8月19日DeepSeek新发布的V3.1模型?性能 ...
Aug 19, 2025 · 这次,DeepSeek-V 3.1 使用了 UE8M0 FP8 Scale 的参数精度,而UE8M0 FP8 是专门针对即将发布的下一代国产芯片设计。 好家伙,所以,在外面模型一顿厮杀的时 …
OpenAI GPT-5 和 DeepSeek 等 AI 工具均向用户免费,免费 ...
你可以把DeepSeek和OpenAI看作是平台型应用,免费但钱景无限,类似于微信、谷歌搜索,虽然现在体量和用户达不到,但趋势很明显。 这些平台型应用都是免费的,看不出有什么盈利的 …