第二代InfLLM开源,同尺寸快三倍!零参数,可训练稀疏注意力
新智元报道 编辑:LRST【新智元导读】InfLLM-V2是一种可高效处理长文本的稀疏注意力模型,仅需少量长文本数据即可训练,且性能接近传统稠密模型。通过动态切换短长文本处理模式,显著提升长上下
阅读全文新智元报道 编辑:LRST【新智元导读】InfLLM-V2是一种可高效处理长文本的稀疏注意力模型,仅需少量长文本数据即可训练,且性能接近传统稠密模型。通过动态切换短长文本处理模式,显著提升长上下
阅读全文屡遭 AI 伤害的泰勒·斯威夫特,最近却因 AI 被粉丝「围攻」了。起因是一场全球营销活动。为了宣传她的第十二张专辑《The Life of a Showgirl》,泰勒·斯威夫特(Taylor Sw
阅读全文让每个人都能获得均等的医疗服务水平。👦🏻 播客采访:Koji、Ronghui🥷 整理编辑:Starry🧑🎨 排版: NCon最近,美国多家 AI+医疗明星公司接连传来进展:OpenEvidence(
阅读全文如果你用过大型语言模型(LLMs)干点正经事,你肯定知道那种等待的煎熬。你输入一个问题,按下回车,然后……啥也没有。就一个转圈的光标在那晃,直到第一个词终于蹦出来。这种延迟叫“首次令牌时间”(time
阅读全文时令 发自 凹非寺量子位 | 公众号 QbitAI又一个万亿参数级国产模型开源了!就在刚刚,蚂蚁正式发布百灵大模型的第一款旗舰模型——拥有万亿参数的通用语言模型Ling-1T。刚一登场,不仅超越开源模
阅读全文梦晨 发自 凹非寺量子位 | 公众号 QbitAI黄仁勋出面回应竞争对手的大动作了。面对AMD拿出公司10%股权换取OpenAI订单的操作,老黄接连用了两次“惊讶”(surprised/suprisi
阅读全文闻乐 发自 凹非寺量子位 | 公众号 QbitAI备受Meta审核规定“折磨”,依旧猛发论文!表示可能要辞职的LeCun带着最新研究来了,仍然和三位FAIR同事合作。Yann LeCun团队新论文发现
阅读全文组委会 发自 凹非寺量子位|公众号 QbitAI为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动「2025人工智能年度榜单」评选报名。这是量子位人工智能年度榜单的
阅读全文整理|冬梅 当地时间 2025 年开发者日(DevDay 2025)上,OpenAI 再次震撼业界,推出了一系列重磅开发者更新,标志着其正在从一家模型公司向通用智能平台转型。此次大会,OpenAI 重
阅读全文作者 | 北航彭浩团队 基于扩散模型(Diffusion Model)的生成方法已显示出用于从离线强化学习 (offline Reinforcement Learning) 数据集建模轨迹的巨大潜力,
阅读全文策划 |QCon 全球软件开发大会 当研发进入 Agent 时代,提效只是开始,质变才是真正的未来。一场关于智能研发范式的深度对话,即将开启。扫码预约直播。直播介绍直播时间10 月 10 日 20:0
阅读全文钛媒体作者丨预见能源01在能源转型与科技革命交织的当下,一个看似普通的工业金属正悄然重塑全球经济版图。近日,高盛在其重磅研究报告《AI与国防将电网置于能源安全中心》中掷地有声地指出:铜将成为“新石油”
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~国庆各种新闻满天飞,大佬们都不过节的。。。今天快速梳理了一下所有的新闻,给家人们补补课。Anthropic、OpenAI、Google假期前后,御三
阅读全文我们已经可以认真讨论「零人公司」这件事了。2025 年 DevDay 现场,OpenAI CEO Sam Altman 在接受博主 Rowan Cheung 的采访时抛出了这个观点。语气轻松,但分量不
阅读全文CSwitch现在支持一键切换模型新增七牛云直接接入,现在注册再送1000万 Token!点击查看七牛云文档获取密钥CSwitch 0入侵一键切换Claude Code第三方详细的配置和使用视频:下载
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!我们都知道,大模型肚子里只有训练时
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!9月30日,两位分别来自OpenA
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!算泥社区《AI大模型与异构算力融合
阅读全文图片来源:Brighter with HerbertZ Highlights再先进的硬件,如果缺乏智能,就没法发挥作用;反过来,哪怕AI智能强大,但无法被良好地“embody”在具体形态中,它也无法落
阅读全文图片来源:Relace无数初创企业都在销售面向软件工程师的工具,例如用于追踪代码库变更的版本控制系统,以
阅读全文图片来源:David AI LabsDavid AI Labs 这家初创公司通过出售音频数据集来帮助训练
阅读全文图片来源:Harvey汤姆·凯利博士是一名创伤外科医生,他目睹各地医生深陷行政工作的泥潭。为了改变现状,
阅读全文蚂蚁的 Ling-1T 终于发了,大半夜的中文叫百灵,1T 参数,Instruct 版本、非推理、MoE架构HuggingFace:https://huggingface.co/inclusionAI
阅读全文作者|董道力邮箱|dongdaoli@pingwest.com人类和动物的差别在什么地方?这是一个很难回答的问题,但有三个特征是人类能成为“万物之灵”必不可少的。首先,是学会使用工具。当人类祖先第一次
阅读全文文章转载于新智元2024年,OpenAI营收大约为40亿美元,估值约为1570亿美元。2025年上半年,OpenAI收入43亿美元,全年预测130亿美元,而估值是5000亿美元!OpenAI的估值超过
阅读全文文章转载于特工宇宙内容编辑丨特工小九AI 正在改变人们所具备的技能、从事的任务以及团队的组织形态。这种变化在大公司和小公司身上的表现截然不同。对于大公司而言,AI 主要是在既有团队结构上带来渐进式收益
阅读全文机器之心原创作者:吴昕Ling-1T给效率革命交了一份更贴近场景的答卷——万亿级储备,百亿级开销,产业级落地。规模、速度与推理精度,其实可以兼顾。完全测不过来了。仅仅一个 9 月,全球就有十余家主流玩
阅读全文机器之心编译作者:Han Fang、Karthik Abinav Sankararaman机器之心编辑部LLM 后训练最佳入门介绍。在大模型时代,Scaling Law 一度是 AI 领域公认的准则:
阅读全文本文共同第一作者为李鸿宇(布朗大学博士生)和孙凌峰(Robotics and AI Institute 研究员,博士毕业于加州大学伯克利分校)。通讯作者付佳慧在 Robotics and AI Ins
阅读全文在多模态模型里,CLIP-style encoder 往往把视觉表征过早地拉近到文本空间:对于抽象层面的问答,如总结图片大致内容,这样的表征其实是没有什么问题的,但一旦追问与语言无强依赖的细节,模型就
阅读全文