Languch C Function

About 213,000,000 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
如何理解 DeepSeek 最新提出的 mHC 架构？ - 知乎
而DeepSeek的这个选择，简直是神来之笔。具体来看看双随机矩阵的一些性质，你就能明白Deepseek这样选择的深意。先说谱范数的事儿。双随机矩阵有个非常好的性质——它的谱范 …
zhihu.com
https://www.zhihu.com › question
如何评价 DeepSeek 的 DeepSeek-V3 模型？ - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性，论文中并没有给出对应的FP8矩阵乘法的算子效率。另外，论文中缺乏per-token加per-channel量化的讨论，不清楚 …
zhihu.com
https://www.zhihu.com › question
普通人怎样用好Deepseek? - 知乎
DeepSeek-R1则专门是为了代码生成+数学问题解决而设计，整体速度极快，精确度实测后非常高，推理能力一流。适合需要快速实现技术需求的场景，比如程序员、理工科学生等。
zhihu.com
https://www.zhihu.com › question
deepseek官网地址告诉我？ - 知乎
Feb 2, 2025 · DeepSeek简介： DeepSeek，特别是V3版本，因其十分有效的控制训练模型成本和开源免费的模式震惊全球，登顶应用商店的下载排行榜，甚至重创国外的科技股，而且截止到 …
zhihu.com
https://www.zhihu.com › question
有必要自己将deepseek部署到本地吗？ - 知乎
Feb 13, 2025 · 所以我认为，deepseek部署有可行性就够了，至于有没有必要性，很多人没那么重要。大家听到openai训练ai需要几千亿美元，让ai推理需要十块H100 (一块280万人民币)，部 …
zhihu.com
https://www.zhihu.com › question
DeepSeek深度思考和联网搜索有什么区别？ - 知乎
Feb 5, 2025 · DeepSeek为大家提供了：深度思考R1和联网搜索，两个功能强悍的按钮，但，在和知乎网友的交流过程中，我发现有很多人，不知道这两个强悍的工具如何搭配使用。今天就 …
zhihu.com
https://www.zhihu.com › question
求问deepseek出现这种情况怎么办啊？ ? - 知乎
Jan 31, 2025 · DeepSeek 不是告诉你原因和解法了嘛。原因：当前对话已超出深度思考的最大长度限制解法：开启一个新对话继续思考吧至于具体解释，得看这几个参数，DeepSeek R1 的 …
zhihu.com
https://www.zhihu.com › question
如何评价 DeepSeek 于 2025 年 8 月 19 日更新的 V3.1 版本？
Aug 22, 2025 · 重点 2：DeepSeek V3-0324 和 DeepSeek V3 用的同一个 base model，但这次的 V3.1 放出了新的 base model，大概率是重新训的新模型。 DeepSeek 的逻辑可能是，只要 …
zhihu.com
https://www.zhihu.com › question
如何评价2025年8月19日DeepSeek新发布的V3.1模型？性能 ...
Aug 19, 2025 · 这次，DeepSeek-V 3.1 使用了 UE8M0 FP8 Scale 的参数精度，而UE8M0 FP8 是专门针对即将发布的下一代国产芯片设计。好家伙，所以，在外面模型一顿厮杀的时 …
zhihu.com
https://www.zhihu.com › question
OpenAI GPT-5 和 DeepSeek 等 AI 工具均向用户免费，免费 ...
你可以把DeepSeek和OpenAI看作是平台型应用，免费但钱景无限，类似于微信、谷歌搜索，虽然现在体量和用户达不到，但趋势很明显。这些平台型应用都是免费的，看不出有什么盈利的 …

Pagination
- 1
- 2
- 3
- Next