资讯

{ "articleTitle": "阿里工程师春节加班冲刺AI,Qwen系列模型开源加速追赶DeepSeek", "articleContent": ...
据彭博社报道,今年1月,中国AI公司DeepSeek推出的低成本高性能AI模型在全球科技界引发震动,也给中国科技巨头阿里巴巴带来了巨大的紧迫感。为迅速追赶这一技术突破,阿里巴巴的工程师们甚至取消了最重要的中国传统节日——春节的休假,选择彻夜留守公司, ...
文 / 大力财经 作者 / 魏力 导语:AI圈爆火的「口碑增长」密码,从烧钱换量到自然裂变,中国大模型正在重写增长规则。
从SRDA公开的设计理念来看,其解决问题的思路已与DeepSeek等前沿研究中对某些挑战的分析方向不谋而合。这或许提示我们,以数据流为中心的专用计算架构,会在未来的AI算力发展中扮演越来越重要的角色。
近日,星云智联正式发布国内领先的S1400系列AI智算高速互联网卡。该系列产品专为满足人工智能大模型训练与推理等智算场景的极致需求而设计,凭借其全自研核心技术与卓越性能,为飞速发展的人工智能产业提供极致高效、稳定可靠的全场景互联解决方案与坚实的网络底 ...
快科技6月12日消息,昨日,阿里员工的万字离职帖冲上热搜,创始人马云还对该帖子进行了回复。 而在巴黎举行的VivaTech科技大会上,阿里创始成员之一的蔡崇信也承认了过去阿里的失误。
有接近人士向虎嗅透露,该高管曾担任DeepSeek的“CTO”角色,不过也有知情人指出,DeepSeek内部架构中并无明确设置“CTO”职位。该职位在名义上可能并不存在,但确有高管承担类似的技术统筹与研发决策职责。
施懿宸认为,通过优化算法,可以在训练阶段减少算力消耗,同时也能在实际应用中提高AI的性能和效率。同时,他也指出,训练数据质量的提升至关重要。高质量的数据结合精进的算法,能够进一步降低算力需求,同时还能提高AI的成果和产出。
2025 年的科技圈,AI 话题热度居高不下,从 DeepSeek 火遍全网,到各大科技巨头纷纷入局,中国前沿科技成了全球热议焦点。 在这场科技浪潮中,游戏行业率先 “乘风破浪”,而网易的《逆水寒》手游,堪称其中最亮眼的 “弄潮儿”,一举实现百亿营收 ...
2025年高考已经结束,机器之心使用七款大模型产品,做了高考数学I卷,结果第一名Gemini拿到145分,豆包和DeepSeek以1分之差并列第二,即使最后一名也获得134分,成绩亮眼。机器之心挑战高考数学I卷的AI大模型选手分别是五款国产AI:Do ...
作者 | 玉盘 AI 团队审核 | 华卫“大模型每生成 1 美元价值,需支付 3 美元算力成本”,算力成本挑战已无争议。从软件层面的各类优化方案层出不穷,真正从硬件源头着手的方案却屈指可数,市面上能看到的包括 Groq ...