site:www.51cto.com - 搜索 News

资讯

18 小时

英伟达揭示RL Scaling魔力！训练步数翻倍=推理能力质变，小模型突破 ...

过去的研究多数持悲观态度：认为 RL 带来的收益非常有限，有时甚至会让模型「同质化」加重，失去多样性。然而，来自英伟达的这项研究指出，造成这一现象的根本原因在于：数学、编程等任务在 base model 的训练数据中被过度呈现，以及 RL ...

18 小时

突发！刚被OpenAI收购就惨遭Claude“卡脖子”！Windsurf CEO怒了：想花钱 ...

这位开发者自称是 Claude 的铁粉，Claude Opus 4 一发布就兴奋地上手测试。他让模型构建一个复杂功能，结果非常惊艳——一次成型，无需调试、无需来回沟通。但当他查看费用时，瞬间清醒： ...

18 小时

GPT-4o连验证码都解不了？SOTA模型成功率仅40%

4、对比分析详尽：对OpenAI-o3、GPT-4o、Claude-3.7、Gemini2.5-Pro等模型进行系统评估；人类解题成功率高达93.3%，最强模型OpenAI-o3仅为40.0%；并从策略偏差、视觉错误、执行失败等维度剖析失败原因。

23 小时

GPT-5七月上线？内部爆料+奥特曼疯狂暗示，自曝前方时刻「令人恐惧」

但是也有OpenAI内部员工预警了，自曝说其实内部最多也就比公开可用的模型领先两个月，所以GPT-5不会有巨大的飞跃，只是略有提升而已，不同的是会与许多工具集成。

18 小时

“AI 编程”商战启动：Windsurf 称 Anthropic 限制其直接访问 Claude 模型

6 月 4 日消息，据外媒 TechCrunch 今日报道，被传正被 OpenAI 收购的 AI 编程初创公司 Windsurf 称，Anthropic 已大幅削减其平台对 Claude 3.7 Sonnet 和 Claude 3.5 Sonnet ...

23 小时

超越GPT-4o！华人团队新框架让Qwen跨领域推理提升10%，刷新12项基准测试

数据最初来源于WebInstruct，其中包含约500万个从StackExchange和教育门户网站爬取的自然指令。这些数据虽然适用于一般的指令调优，但大部分缺乏可验证答案或推理结构。随后利用Gemini-1.5-Pro识别具有简洁答案的可验证问题 ...

21 小时

OpenAI CEO警示：AI智能体正重塑职场格局，基层岗位面临结构性冲击

在 2025 年 Snowflake Summit 主题演讲中，OpenAI 首席执行官山姆・奥尔特曼（Sam Altman）抛出震撼观点：AI 智能体正以惊人速度渗透企业运营，其角色已从工具演变为 "数字基层员工"，直接引发职场结构的根本性变革。

6 小时

Go 官方宣布不再改进错误处理语法，背后原因是什么？

尽管 Go 团队明确表示不会再推进错误处理的语法层改动，但这并不意味着错误处理的优化空间已经封闭。通过标准库的增强、工具链的改进以及更注重错误处理的上下文信息，开发者仍然可以在保持语言一致性的前提下，提升代码的可读性和开发效率。这一决定不仅体现了 Go 语言对显式性和简单性的坚持，也为未来的工具生态和开发体验优化留下了更多可能性。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果