突破T级模型“内存墙”:协同压缩框架将1.3TB MoE模型塞入128GB笔记本
本文介绍的“协同压缩”框架,首次成功将 T 级参数的 MoE 大模型部署到 128GB 内存的消费级 PC 上,实现了 >5 tokens/秒的本地推理。该工作由 Moxin AI 团队完成,于 GO
阅读全文本文介绍的“协同压缩”框架,首次成功将 T 级参数的 MoE 大模型部署到 128GB 内存的消费级 PC 上,实现了 >5 tokens/秒的本地推理。该工作由 Moxin AI 团队完成,于 GO
阅读全文AI 写代码的速度已经快到离谱了,一句话就能生成一堆“看起来能跑”的函数。但问题是:这些代码真正上生产环境后,往往不是崩就是漏,维护成本甚至比人类敲的还高。我们现在遇到的,不是“代码不够多”,而是“代
阅读全文作者: 丁亮亮/smallniding 本文将求根溯源,从历史时间线发展的角度一起来看看AI是如何诞生的,以及在诞生后这几十年的发展过程中经历了哪些变革和演进,在演进的过程中我会介绍大量涉及到的细分技
阅读全文脚本之家 设为“星标⭐”第一时间收到文章更新本文转载自微信公众号:差评X.PIN(chaping321)差友们,昨晚你们网速足够快的话,应该已经见证了一场互联网大戏——Cloudflare 崩了。这
阅读全文“刚收到通知,整个后端小组都被优化了,连十年经验的大佬也没留下。”凌晨一点,群里的粉丝发了这条消息。几乎同时,我的猎头朋友发了条朋友圈:“急招AI大模型工程师,年薪120万起!持续三个月没招到合适的人
阅读全文将 脚本之家 设为“星标⭐”第一时间收到文章更新来源 | IT杨秀才在分布式系统的架构设计中,分库分表是一个无法回避的话题。当数据量达到一定规模,单库单表已经无法承载业务压力时,我们就需要考虑将数据分
阅读全文以开源 × AI 为底座,重构开发者生态与社区体验,解锁更多创作可能。 OSC 邀你加入共创,共同谱写社区未来十年。 🔗www.oschina.net 1️⃣新版体验说明 新版目前正处于逐步替换
阅读全文中国科学院、中国工程院11月21日公布2025年院士增选名单。2025年分别选举产生中国科学院院士73人,中国工程院院士71人。以下为新当选中国科学院、中国工程院院士完整名单,值得注意的是AI领域大牛
阅读全文新智元报道 编辑:定慧 KingHZ 【新智元导读】史上最强三季度财报出炉,可能没有之一。黄仁勋一边把GPU卖到断货,一边告诉世界「AI不是泡沫,是历史必然」。这场算力狂潮到底是科技变革,还是资
阅读全文转自 | 菜鸟教程在互联网行业,职级往往比职位更能体现个人价值。同样是高级工程师,在阿里是 P6,在字节是 2-1,在百度可能是 T5。不同公司的体系不一样,薪资差距也相当明显。以下是整理自多家大厂的
阅读全文在过去很长一段时间里,网页自动化都是一件“又繁琐又容易出错”的事情。无论是 Selenium、Puppeteer,还是 Playwright,这些工具虽然功能强大,但都依赖复杂的 DOM 结构、XPa
阅读全文浅谈降本增笑背后的高可用困局 2025年对技术团队不算平静。降本增笑
阅读全文阿里妹导读在 AI 时代,若你还在紧盯代码量、执着于全栈工程师的招聘,或者仅凭技术贡献率来评判价值,执着于业务提效的比例而忽略产研价值,你很可能已经被所谓的“常识”困住了脚步。AI 时代,技术人如何自
阅读全文这是2025年的第130篇文章( 本文阅读时间:15分钟 )01背景与挑战Dify 作为一款低代码 AI 应用开发平台,凭借其直观的可视化工作流编排能力,极大降低了大模型应用的开发门槛。然而,在实际企
阅读全文一行代码引发的全球级故障2025年11月18日,Cloudflare经历了一次全球范围的服务中断,导致大量网站无法正常访问。这起事件的根源并非外部攻击或基础设施故障,而是一行看似普通的Rust代码中的
阅读全文随着 LLM 应用的飞速发展,越来越多的 Agent 应用开始走近每个人。围绕着 Agent 应用的核心,目前业界有零代码、低代码和高代码三条主流的技术路线。AgentScope 作为 Python
阅读全文创作不易,方便的话点点关注,谢谢点击上方“讳疾忌医-note”,选择“关注/置顶/星标公众号” 干货福利,第一时间送达!觉得内容对您有帮助方便的话点点爱心。谢谢持续更新中: 现代C++高效编程实战手册
阅读全文微软 AI 首席执行官 Mustafa Suleyman 最近在 X(原 Twitter)发文,针对近期用户对 Windows 系统上 AI 功能的不满作出回应,表示“听到有人说 AI 平庸,我就想笑
阅读全文近期,某企业在对二进制制品进行安全扫描后,但线上生产环境仍然出现了包含 「0day漏洞」的制品的情况,引发紧急下线修复。分析其原因,主要有以下两点:没有自动更新知识库:传统模式下依赖安全厂商更新,更新
阅读全文将 脚本之家 设为“星标⭐”第一时间收到文章更新来源 | DT商业观察(ID:DTcaijing)不久前,“一直没明白为什么微信能取代QQ”的话题登上了微博热搜,掀起了2万多条讨论和6万多次互动。在微
阅读全文脚本之家 设为“星标⭐”第一时间收到文章更新出品 | 前端充电宝(ID:FE-Charge)跨平台这条赛道,看着已经卷了很多年,大家以为方向差不多定型了;结果最近 Snapchat 又给出了新的思路。
阅读全文脚本之家 设为“星标⭐”第一时间收到文章更新来源 | 君哥聊技术(ID:gh_1f109b82d301)使用 MySQL 数据库时,对于一个可以为空的字段,如果没有值,应该保存 NULL 还是给一个默
阅读全文你是否也对衣物洗烘有着更高的期待?是摆脱阴雨天“等待晾晒”焦虑的从容洗衣;还是洗烘过的衣服能够依旧保持最佳状态;又或是根据环境自动调节洗烘参数的节能帮手;今天,我们就从这份藏在衣物里的幸福感说起,来聊
阅读全文对于当下的开发者而言,现在是一个最好的时代,也是一个最“卷”的时代。一方面,以RAG(检索增强生成)、智能Agent为代表的AI应用浪潮汹涌,仿佛一夜之间,开发者手里就多了一把“创世”的锤子;另一方面
阅读全文一个时代,一门语言,一位传奇。责编 | 梦依丹出品 | CSDN(ID:CSDNnews)2025 年是 C++ 正式发布 40 周年。12 月,这门编程语言背后的创造者 Bjarne Stroust
阅读全文整理 | 郑丽媛出品 | CSDN(ID:CSDNnews)近期,《Arc Raiders》宣布即将推出双人合作模式,以及类似《Helldivers 2》的社区任务活动——但在玩家还没来得及为新玩法兴
阅读全文从教育者视角,看国产大模型如何赋能AI教学。作为一名在人工智能领域教学多年的大学教师,我一直在寻找能够同时满足教学演示、学生实践和科研需求的AI工具。曾经过着不断寻找Claude中转站的生活,每月支付
阅读全文来源 | 机器之心几乎毫无预兆,马斯克人工智能公司 xAI 发布了最新模型 Grok 4.1。就在刚刚,xAI 宣布,Grok 4.1 已经向所有用户开放,可以在 Grok 官网、X 以及 iOS 和
阅读全文作者丨我爱计算机视觉 来源丨我爱计算机视觉 编辑丨极市平台导读 MIT 提出 VARC:把 ARC 视觉谜题当成 64×64 图像翻译,用 ViT+画布增强+测试时训练,零外部数据取得 60.4
阅读全文