Logics-STEM:错题驱动练就8B参数STEM推理模型新 SOTA!
在大语言模型(LLM)推理能力持续演进的技术浪潮中,阿里集团与复旦大学联合推出的Logics-STEM,为科学、技术、工程与数学(STEM)领域的LLM复杂推理任务提供了一种可复现、可扩展的数据-算法
阅读全文在大语言模型(LLM)推理能力持续演进的技术浪潮中,阿里集团与复旦大学联合推出的Logics-STEM,为科学、技术、工程与数学(STEM)领域的LLM复杂推理任务提供了一种可复现、可扩展的数据-算法
阅读全文这是2025年的第132篇文章( 本文阅读时间:25分钟 )01背景小蜜作为淘宝/天猫服务的门户,每日承担着上百万次的服务咨询。作为淘天集团乃至行业内最大体量的对话机器人应用之一,阿里小蜜在对话算法能
阅读全文这是2025年的第131篇文章( 本文阅读时间:15分钟 )01前言ROLL是阿里巴巴未来生活实验与智能引擎团队开源的面向大模型的强化学习(RL)框架,该框架提供了完整的RL训练链路,支持模型通过与环
阅读全文这是2025年的第130篇文章( 本文阅读时间:15分钟 )01背景与挑战Dify 作为一款低代码 AI 应用开发平台,凭借其直观的可视化工作流编排能力,极大降低了大模型应用的开发门槛。然而,在实际企
阅读全文这是2025年的第129篇文章( 本文阅读时间:15分钟 )01背景随着 AI 与大模型应用的普及,高维向量作为表征复杂数据(如文本、图像、语音)的关键载体,其存储与高效检索需求在推荐系统、图像检索、
阅读全文这是2025年的第128篇文章( 本文阅读时间:15分钟 )01前言今天我们习以为常的 async/await,是 Python 异步编程的标准范式。但很少有人意识到,这个简洁优雅的语言结构并非凭空而
阅读全文这是2025年的第127篇文章( 本文阅读时间:15分钟 )DMS Airflow 是基于 Apache Airflow 构建的企业级数据工作流编排平台,通过深度集成阿里云 DMS(Data Mana
阅读全文近期,阿里巴巴 ROLL 团队(淘天未来生活实验室与阿里巴巴智能引擎团队)联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构(Asynchronous Training)、A
阅读全文这是2025年的第125篇文章( 本文阅读时间:15分钟 )“都AI时代了,你们这些人怎么还在研究规则引擎?” 无聊时朋友调侃道。QLExpress 是 Java 嵌入式脚本引擎,可以很方便地集成到
阅读全文人工智能浪潮奔涌而来,成为继电力、互联网之后的又一通用技术革命。但也给出了新的命题:AI,该往何处去? 11月3日,《阿里巴巴AI向善行动报告2025》发布,这是国内科技企业发布的首份AI向善报告。
阅读全文这是2025年的第123篇文章( 本文阅读时间:15分钟 )01背景今年我们团队重点投入在“云小二 Aivis”项目中。云小二 Aivis 是阿里云服务领域的数字员工,它标志着我们从传统的智能辅助客服
阅读全文这是2025年的第122篇文章( 本文阅读时间:15分钟 )01前言“What I cannot create, I do not understand.” -- Richard Feynman2
阅读全文这是2025年的第121篇文章( 本文阅读时间:15分钟 )01背景1.1 业界分析与思考随着大模型的不断演进,测试行业基于AI也在做不同程度的探索,在agent智能体生成方面,基本使用的是promp
阅读全文这是2025年的第120篇文章( 本文阅读时间:15分钟 )本文整理自阿里云智能集团高级技术专家周礼在 2025 全球机器学习技术大会上的精彩演讲《Apache RocketMQ x AI:面向异步化
阅读全文车道级地图:解锁精准导航与智能驾驶新场景高德地图作为一款国民级的APP,为用户提供一体化的出行、生活体验,是我们最大的愿景。在瞬息万变的交通环境中,“该走哪条车道”曾是驾驶者的普遍焦虑。高德地图以车道
阅读全文这是2025年的第118篇文章( 本文阅读时间:15分钟 )在AI时代天猫技术质量同学在质量保障方面也不断探索AI在测试全流程提效的落地方案,传统测试工作链条拆解为“需求解析 → 用例生成 → 数据构
阅读全文这是2025年的第116篇文章( 本文阅读时间:15分钟 )参考Langchain的这篇文章[1],面对目前我们常见Chat模式的Agent形态以外,还可以充分发挥Agent新的运行形态:自主持续运行
阅读全文在工作学习中,我们时常有要将图片或PDF内容提取出来的诉求,而当前各工具的提取结果难以令人满意,例如:· 手写的错题整理成电子笔记· 参考资料中表格放进汇报PPT· 化学等专业领域论文编辑使用当资料中
阅读全文视频效果:01前言在AI原生应用开发的时代,传统的后端架构正在被重新定义。本文将带你体验如何使用 Qoder、阿里云ADB Supabase 和通义千问图像编辑模型(Qwen Image Edit),
阅读全文这是2025年的第114篇文章( 本文阅读时间:15分钟 )游戏在中国的发展已有30多年。上世纪90年代,游戏以客户端游戏和PC游戏为主,部署在IDC中,架构相对传统和简单。2007年之后,网页游戏开
阅读全文这是2025年的第112篇文章( 本文阅读时间:15分钟 )在微服务架构占据信息系统应用架构主流的当下,Java语言体系凭借Spring Cloud等成熟生态占据主导地位,而Python开发者却常常面
阅读全文这是2025年的第111篇文章( 本文阅读时间:15分钟 )01为什么 AI 编码采纳率不高?目前尝试过不少 AI 编程工具,重度使用过的包括 VSCode+Roo Code 、Continue、Tr
阅读全文这是2025年的第110篇文章( 本文阅读时间:15分钟 )RecIS是一个专为超大规模稀疏-稠密计算设计的统一架构深度学习开源框架,由爱橙科技智能引擎团队与淘天集团算法技术、阿里妈妈技术团队联合推出
阅读全文这是2025年的第109篇文章( 本文阅读时间:15分钟 )01前言每一个驾驶者都深有体会:在复杂的路口前,只能看到眼前几辆车的动向,却无从知晓数百米外哪个车道即将拥堵;在畅通的高速上,无法预见前方因
阅读全文“当大模型不再关注刷榜时,AGI或许才真正到来 ......”9月26日,位于杭州云栖小镇的“2025云栖大会评测标注分论坛”上,阿里巴巴AI数据总经理魏虎(空望),正式发布了阿里巴巴新一代的大模型评
阅读全文这是2025年的第109篇文章( 本文阅读时间:15分钟 )01引言:在“摩擦力”中追寻心流Vibecoding——是每一位开发者都在追寻的理想境界:一种思想与代码完全同步、创造力毫无阻碍的沉浸式“心
阅读全文这是2025年的第108篇文章( 本文阅读时间:15分钟 )文末点击阅读原文,下载《企业 AI 应用构建指南》 PDF 完整版。01简介随着 LLM 在近些年的发展,模型参数规模与多模态等能力同步提升
阅读全文这是2025年的第106篇文章( 本文阅读时间:15分钟 )01前言:独立运行时Agent架构的必要性当前,智能Agent的开发正面临两条截然不同的路径选择。一方面,高代码方式通过SDK和API编码提
阅读全文PD 分离架构:大模型推理部署的重要演进PD 分离 (Disaggregated prefill and decoding) 架构对大模型推理——尤其是大规模部署场景——具有显著价值。LLM 推理过程
阅读全文这是2025年的第105篇文章( 本文阅读时间:15分钟 )01背景大模型技术近年快速发展,在各行业均有广泛落地。随着大模型应用的开发与上线,如何构建其端到端可观测体系成为越来越重要的问题。本文基于百
阅读全文