2025 年 1 月 20 日,DeepSeek(深度求索)正式发布了 DeepSeek-R1 模型,并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中,DeepSeek-R1 也是该平台上获赞最多的模型。 如今,刚过一年时间,DeepSeek 的新模型又在 GitHub 悄然现身。
朋友们,见证历史的时刻又要到了! 《金融时报》报道,DeepSeek V4,下周正式登场! 距离上一次DeepSeek发布重大模型R1,已经过去了整整一年多。 这一年里,AI行业风起云涌,OpenAI连推数代GPT,Anthropic的Claude杀入顶级阵营,谷歌Gemini疯狂迭代。 整个硅谷都在用数 ...
使用微信扫码将网页分享到微信 「服务器繁忙,请稍后再试。」 一年前,我也是被这句话硬控的用户之一。 DeepSeek 带着 R1 在一年前的今天(2025.1.20)横空出世,一出场就吸引了全球的目光。 那时候为了能顺畅用上 DeepSeek,我翻遍了自部署教程,也下载过不少 ...
【新智元导读】3 月 12 日,据《白鲸实验室》独家爆料,DeepSeek V4 和姚顺雨领衔操刀的混元新模型,均预计将于下个月(2026 年 4 月)发布。 3 月 11 日,OpenRouter 新上线了两个神秘模型——Healer Alpha 与 Hunter Alpha。 OpenRouter 页面显示,Healer Alpha 被描述为具备视觉 ...
How did a little-known Chinese start-up cause the markets and U.S. tech giants to quake? Here’s what to know. By Cade Metz Reporting from San Francisco Tech stocks tumbled. Giant companies like Meta ...
前述内容由第一财经“星翼大模型”智能生成,相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别,第一财经不承担由此产生的任何责任。 如您有疑问或需要更多信息,可以联系我们 yonghu@yicai.com 论文延续DeepSeek一贯的风格,在工程化层面将 ...
这个春节,在所有人都盯着DeepSeek,会不会再度搞事情的时候,DeepSeek罕见地保持了沉默。 这下子,中国AI圈的画风就有些割裂了。一边是智谱、千问、即梦纷纷亮剑,接连发布新模型,争先恐后地展示技术进步。而另一边,则是DeepSeek新模型缺席春节假期,与 ...
3月12日,据白鲸实验室独家爆料:DeepSeek V4将于4月正式上线。 消息刚出,AI圈瞬间炸锅——“终于要来了?”“这次不会又是画饼吧?”。 之所以会出现这种又兴奋、又怀疑的复杂反应,是因为过去几个月,DeepSeek的发布时间表已经被反复“预告”了太多次。
NO.1 OpenAI披露更多关于与五角大楼协议细节 当地时间3月1日,据媒体报道,OpenAI披露了更多关于与五角大楼协议的细节。OpenAI首席执行官Sam Altman承认,公司与美国国防部达成的协议“确实有些仓促”,而且“观感不太好”。此前,五角大楼与Anthropic公司谈判破裂 ...