Mooncake 最新进展:SGLang 和 LMCache 基于 Mooncake 实现高效 PD 分离框架
这是2025年的第56篇文章( 本文阅读时间:15分钟 )近日,阿里云高级技术专家马腾受邀参加在上海举办的 2025 全球开发者先锋大会(GDC),分享了主题《新技术新方案:产业共建大模型时代下的 M
阅读全文这是2025年的第56篇文章( 本文阅读时间:15分钟 )近日,阿里云高级技术专家马腾受邀参加在上海举办的 2025 全球开发者先锋大会(GDC),分享了主题《新技术新方案:产业共建大模型时代下的 M
阅读全文近日,在全球顶级网络系统会议NSDI 2025上,阿里云基础网络技术5篇论文被主会录用,论文研究成果涵盖多个领域,包括面向大模型训练的网络故障诊断、大模型训练网络仿真、容器网络性能问题诊断、基于AI推
阅读全文这是2025年的第54篇文章( 本文阅读时间:15分钟 )01OverviewDeepSeek-V3 在多个评测中展现出强大性能,成为当前最受关注的开源大模型之一。由于采用了大规模 MoE 架构,如何
阅读全文这是2025年的第48篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介保险业被视为社会“稳定器”与经济“助推器”,正快速数字化转型。中华联合财产保险股份有限公司运用“云+大模型”技术
阅读全文这是2025年的第49篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介天津市神州商龙科技股份有限公司成立于1998年,专为餐饮行业提供数字化解决方案。公司服务10万余家知名餐饮企业,
阅读全文这是2025年的第50篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介在数字化转型浪潮中,云计算成为企业创新的核心驱动力。苏州盖雅信息技术有限公司(简称盖雅工场)作为劳动力管理领域的
阅读全文这是2025年的第51篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介厦门立马耀网络科技有限公司在数字化转型中,凭借敏锐的市场洞察和技术创新,将云计算深度融合于业务。其品牌“蝉妈妈”
阅读全文这是2025年的第52篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介福建紫讯科技成立于2015年,致力于为跨境电商提供高效软件解决方案。通过整合大数据、云计算和AI,构建了完整的跨
阅读全文这是2025年的第53篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介茶百道自2008年成立,从100家门店扩展至7000多家,年销量达8亿杯。2018年起,茶百道开启全国加盟,通过
阅读全文近期,Qwen3 正式发布并全部开源 8 款「混合推理模型」。旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-
阅读全文这是2025年的第47篇文章( 本文阅读时间:15分钟 )本文是《5步教你创建大模型自定义插件》的下篇,主要就已有的自定义插件中的生图能力为例,演示如何生成一个图文并茂的文章。01引言不了解自定义插件
阅读全文这是2025年的第41篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介在数字化转型中,云计算成为企业创新的关键驱动力。森马服饰借助阿里云函数计算,应对新零售挑战,实现业务模式重塑和效
阅读全文这是2025年的第42篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介朴数智能,一家专注AI自动化的科技公司,借助阿里云的云服务,尤其是云手机和桌面云技术,成功实现业务的快速增长和数
阅读全文这是2025年的第43篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介享道出行运维总监曹亚娟分享了公司如何利用云计算实现创新和发展。作为上汽集团的移动出行品牌,享道出行在阿里云的帮助
阅读全文这是2025年的第44篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介千寻位置,成立于2015年,利用北斗卫星系统及全球5000多座增强站,提供厘米级定位服务。该公司借助阿里云的计算
阅读全文这是2025年的第45篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介在数字化浪潮中,中国宠物行业蓬勃发展,国内养宠规模已超2亿,形成千亿市场。成立于2013年的PETKIT小佩,专
阅读全文这是2025年的第46篇文章( 本文阅读时间:15分钟 )文末参与互动有好礼哦!01简介在北京溯源精微科技有限公司的故事里,云计算成为了驱动生物科技革新的核心力量。自2011年成立以来,溯源精微深耕生
阅读全文这是2025年的第40篇文章( 本文阅读时间:15分钟 )01序幕:一场跨越20年的技术对话在杭州某科技园的会议室里,一场特殊的代码评审正在进行。屏幕上同时展示着2005年基于WebLogic开发的供
阅读全文刚刚,Qwen3正式发布并全部开源8款「混合推理模型」。此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总
阅读全文01前言4 月 18 日 - 19 日,由 CSDN & Boolan 联合举办的 2025 全球机器学习技术大会(ML-Summit)于上海顺利举行。大会聚焦人工智能与机器学习前沿技术,汇聚了来自科
阅读全文这是2025年的第39篇文章( 本文阅读时间:15分钟 )01AI 的自我升级AI 如何进行自我升级?《手搓Manus?MCP 原理解析与MCP Client实践》中提到,AI 在解决问题时,会根
阅读全文这是2025年的第38篇文章( 本文阅读时间:15分钟 )01MCP的通信方式业界推测 2025 年是 AI Agent 的元年,从目前的技术发展速度看确实是有这个趋势。从年初 DeepSeek 的爆
阅读全文近日,中国电子学会正式颁发“2024中国电子学会科学技术奖”,由阿里云联合清华大学、中国移动(苏州)软件技术有限公司共同申报的“性能可预期的大规模数据中心网络关键技术与应用”项目荣获中国电子学会技术发
阅读全文这是2025年的第36篇文章( 本文阅读时间:15分钟 )本文通过100行代码看到MCP的核心原理并不复杂,但它的设计巧妙深入理解使我们能够超越简单的SDK使用,创建更强大、更灵活的AI应用集成方案。
阅读全文作者:赵望博|达摩院实习生摘要过去一年来,由 Sora 模型开始推动的 Diffusion Transformer(DiT)架构在视觉生成领域展现出了强大的能力,得到了包括 Stable Diffus
阅读全文这是2025年的第34篇文章( 本文阅读时间:15分钟 )我于 2023 年 12 月负责前端构建持久化缓存服务的设计与开发工作,并先后于 2024 年 3 月,12 月上线编译缓存和依赖缓存服务,如
阅读全文在中国有3亿+探险人群,对少有人走的路充满好奇有70%国土仍未被路网丈量,静待勇敢者开拓前行的足迹有1200+救援队分布各地,执甲待命,守护生命最后一道防线当信号消失时,代码开始发光2024年8月28
阅读全文这是2025年的第32篇文章( 本文阅读时间:15分钟 )RTP-LLM是阿里巴巴智能引擎团队自研的大模型推理加速引擎,作为一个高性能的大模型推理解决方案,已在阿里内部众多LLM场景中得到实际应用与检
阅读全文这是2025年的第31篇文章( 本文阅读时间:15分钟 )01摘要LangEngine v1.2.1 推出 openmanus-preview 的 Java 版本,由于LangEngine框架前期已经
阅读全文这是2025年的第30篇文章( 本文阅读时间:15分钟 )01前言大模型作为新兴领域,不断地冒出来新的专有术语和新的概念,让大家觉得很神秘,捉摸不透。但是大部分复杂性的背后都会有一个极其简单便于理解的
阅读全文