在青少年编程教育领域,传统的在线考试系统正面临技术降维打击。当老师们还在为 Scratch ...
快科技4月10日消息,据国家网络安全通报中心微信公众号通报,国家通报中心监测发现, 近期集中爆发多起供应链投毒攻击事件,攻击目标包括API研发工具Apifox、Python开发库LiteLLM以及JavaScript HTTP库Axios,涉及开源软件仓库和商用工具两大核心供应链场景。 其中,Axios投毒事件因OpenClaw等大量AI应用及插件生态直接依赖该库,导致风险通过依赖链向终端用户进一 ...
3月,一封来自Unity 海外资源商店的邮件在国内3D开发者圈炸开了锅:3月31日起,所有位于中国大陆及港澳地区的组织,将无法继续访问海外 Unity 资源商店,也无法再获取免费或付费资源。官方建议国内开发者未来使用团结引擎进行创作。
人类最后一次考试(Humanity's Last Exam)上,不依靠工具,Muse Spark分数比Gemini 3.1 Deep Think和 GPT 5.4 Pro都要好,而使用工具之后,也仅仅比GPT 5.4 Pro低那么0.3。
回过头来,Mythos 预览版寻找漏洞的能力已经初见端倪。 尤其对比之前 Claude 最强模型 Opus 4.6 自主发现并利用漏洞的成功率接近 0%,Mythos 预览版的表现可以堪称逆天。
2026年4月7日,旧金山Mission Bay的Anthropic总部会议室里,一场紧张的决策会议正在进行。CEO Dario Amodei面前的屏幕上显示着一组令人不安的数据:他们最新研发的AI模型Claude ...
PRODUCT今天,智谱开源了 GLM-5.1:744B 参数,40B 激活,MIT 协议零人工介入,能独立工作超过 8 小时,GLM-5.1 从零交付了一套完整的 Linux 桌面系统:窗口管理器、文件浏览器、终端、文本编辑器、系统监视器、游戏库等 ...
Anthropic发布Claude Mythos Preview模型,该模型在完全自主状态下发现了数千个高危零日漏洞,包括存在27年的OpenBSD漏洞。Anthropic联合多家科技巨头启动Project Glasswing计划,定向开放模型给关键基础设施组织。
深夜,最强Claude Mythos终于祭出,所有榜一,Opus 4.6神话破灭!更恐怖的是,它不仅能秒破27年未解的系统漏洞,甚至进化出了自我意识。 一份244页惊悚报告,揭秘了一切。 今夜,硅谷彻底无眠!
面向软件工程的 SWE-bench Verified 从 Opus 4.6 的 80.8% 暴涨到 93.9%,SWE-bench Pro 从 53.4% 冲到 77.8%;面向高难度数学推理的 USAMO 2026,更是从从 42.3% 直接飙到 97.6%——几乎满分。