AI.x社区是51CTO打造的AIGC专属社区,连接企业AIGC决策者和实践者、大模型企业、生成式AI创客与开发者,全方位汇聚生成式AI技术动态、AIGC创新实践案例、技术趋势报告和前沿技术进展,推动生成式AI技术的创新与实践落地 ...
51CTO内容中心是51CTO优质技术内容的创造和运营平台,始终保持敏锐的技术洞察力,探索IT技术发展趋势,聚焦前沿技术应用场景落地,秉持创新、深度、专业、多元的原则,内容覆盖主流技术方向,以文章、视频、直播、沙龙、大会等不同形式,为技术人员提供优质内容和服务,赋能全球技术人员成长 ...
大模型应用落地,靠的是两条腿走路——模型能力和工程化实践。 前面提到的所有这些术语,本质上都属于工程化落地的范畴。它们是在模型能力之上,为了让大模型真正解决实际问题而构建的技术方案和产品形态。 Part.01Coding Agent:专注代码开发的 Agent 子类 ...
梯度提升树:XGBoost/LightGBM通过梯度优化提升精度 深度学习融合:决策树与神经网络结合实现特征自动提取 量子决策树:量子 ...
大家好,我是玄姐。 问题的本质:传统 RAG(检索增强生成)是"临时查资料",AI 每次都要从零开始理解你的文档。没有积累,没有链接,没有进化。 Karpathy 在最近的技术分享中提出了一种全新范式:LLM Wiki 让 AI 不是帮你"查"资料,而是帮你"写"一本持续更新的 ...
当你的“龙虾”需要从10000+Markdown文件中精准调取记忆时,grep已经不够用了。YC总裁Garry Tan开源的GBrain,正是为解决这个问题而生,它一个经过实战检验的AI记忆中枢。在此之前,他分享的gstack已经爆火网络,一个媲美superpowers的强大skill,覆盖完整的产品开发流程。
Andrej Karpathy此前在推文中分享了大模型在编程时的典型失败模式。最近,有人将这些观察直接转化为Claude Code的配置文件。 用过Claude Code的人大概都有类似经历。它喜欢过度解释,会加一些没让它加的代码,或者把三条提示之前设的约束给忘了。多数人把这当作 ...
Claude Code 支持多种 API 接入方式,从个人订阅直连、API Key 调用,到企业级 Amazon Bedrock、Google Vertex AI、Microsoft Foundry,以及通过 LiteLLM 等 LLM Gateway 接入任意兼容提供商。本文梳理各方案的配置步骤、适用场景和选型建议,覆盖从个人开发者到企业团队的全部需求。
在大模型的后训练阶段,一个诱人的想法是:让模型自己给自己当老师——把正确答案作为"特权信息"喂给同一个模型,让它指导自身的学习。这就是OPSD(On-Policy Self-Distillation,在线策略自蒸馏)。然而论文发现,这种方法存在严重的结构性缺陷:模型会在推理时 ...
Google上周开源了Gemma 4:一款功能强大的小模型,完全可直接在你的个人设备上运行。Google Gemma在X发布了通过简单的 3 个步骤 ...
最近在看 Mintlify 的技术博客时,被一个标题吸引住了:"We replaced RAG with a virtual filesystem"。第一反应是:这不是在开玩笑吧?RAG 不是 AI 文档助手的标准答案吗?但看完他们的实现细节后,我觉得这个思路值得认真想想。 传统 RAG 的痛点,可能比你想象的更痛 我 ...
聚合人工智能话题下,包括 机器学习、深度学习、计算机视觉、自然语言处理等领域的新闻资讯、前沿理论、技术知识、应用 ...