资讯

作为开源阵营中曾经「最有希望挑战 OpenAI」的旗手,Llama 4 原本承载着开发者与产业界的高度期待。但现在,它却在发布一周内从「高光」跌入「信任危机」,成为大模型竞赛中一次罕见的口碑「滑铁卢」。
研究人员通过实验证明,这种「最佳-N选择」策略会系统性地提高Arena分数,违背了基础的布拉德利-特里模型(Bradley-Terry model)假设。 利益冲突声明:@AiEleuther的lm eval harness可以说是Arena的竞争对手。一些公司使用我们的库来发布提示和脚本以重现他们的结果。我们为用户提供这些选项,以便他们可以进行跨模型的苹果对苹果比较。
ShowMeAI南乔的月度观察在纷乱的历史里,找寻共性和规律大家好,我是南乔。本文是「赛博月刊」25 年 4 月刊的观察和随笔,汇总了我们整理月刊过程中的诸多思考。点击上方卡片,阅读月刊全文说明:「赛博月刊」系列发表在 @赛博禅心,每期收录 AI ...
界面新闻 on MSN1 小时
腾讯把“Manus”放进了QQ浏览器
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 5月19日,QQ浏览器宣布升级为AI浏览器,正式推出QBot,使用腾讯混元和DeepSeek双模型。团队透露,QQ浏览器用户规模超4亿。
作者:Bryan编辑:Cage在上一篇研究图谱中,我们指出医疗领域很可能是 Vertical Agent 最先落地的领域,其中最有代表性的公司之一是 OpenEvidence,一款专为医生设计的 AI 专业诊断 ...
2025年5月,谷歌旗下研究工具NotebookLM迎来重大更新,计划推出名为“Sparks”(火花)的1-3分钟视频概览功能,其中10%内容由AI生成。这一创新将进一步整合Gemini2.5 chatbot和Deep Research报告功能,为用户提供从文档到短视频的智能化内容创作体验。AIbase综合最新社交媒体动态,深入解析“火花”视频概览的技术亮点及其对AI内容生成领域的深远影响。
5月19日,证券时报记者获悉,罗永浩正式开启与百度优选的战略合作,将于5月23日晚8点开启首场直播。这是其继抖音、淘宝后,首次选择以AI技术为核心的新兴电商平台。据罗永浩所属机构“交个朋友”透露,此次合作源于双方对AI技术驱动电商变革的共识。
从全球知名AI模型评测平台Chatbot Arena(大模型竞技场)的最新榜单来看,最新发布的Gemini2.0系列旗舰模型与2025年港澳宝典Grok 3确实排在前列,但与排在第5位的DeepSeek-R1并没有拉开实质性的差距,以大模型竞技场的评分来看,差距在15分-40分之间。
早在2023年,AI旅行领域就出现了一批创业潮,包括目前用户所熟知的Wanderboat、Mindtrip、Layla等AI原生旅游创业公司均诞生于这一节点,据「硅基研究室」了解,AI旅游也同样是独立开发者投身的热门领域之一。
(以下内容从德邦证券《通信行业周报:美国BIS加强AI芯片出口管制,算力供需将向国内回归》研报附件原文摘录) 投资要点: 1.1美国芯片出口政策反复,国内芯片有望迎来空间。我们认为,特朗普政府进一步调整中美芯片进出口管制对我国算力供应造成更深限制。但考虑到我国AI模型应用已经居于世界头部区间,对于模型厂商而言,因为美国禁令而放弃此前投入并不现实。同时,尽管国产算力芯片仍然落后于国际先进水平,但De ...
作者|周一笑邮箱|zhouyixiao@pingwest.comAI Agent最新一波求码潮来了,继Manus全面开放注册不再限码之后,Lovart.ai ...
1.1美国芯片出口政策反复,国内芯片有望迎来空间。我们认为,特朗普政府进一步调整中美芯片进出口管制对我国算力供应造成更深限制。但考虑到我国AI模型应用已经居于世界头部区间,对于模型厂商而言,因为美国禁令而放弃此前投入并不现实。同时,尽管国产算力芯片仍然落后于国际先进水平,但DeepSeek技术思路的全面开源或在一定程度上弥补这一差距。因此美国禁令或促使国内AI厂家转向国产算力芯片。国产芯片有望迎来 ...