全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    如何结合多模态RAG和异步调用实现大模型内容理解?

    作者:阿里云开发者发布日期:2025-03-28 08:30:00

    阿里妹导读文章探讨了如何利用多模态大模型和工程优化手段提升物流理赔业务效率。核心方案包括:通过多模态RAG技术实现图片查重,结合异步调用方法优化货损识别功能。一. 项目背景和方案架构1.1 项目背景理

    阅读全文
  • 文章封面

    如何与AI结对编程:我与AI的8000行代码实践

    作者:阿里云开发者发布日期:2025-03-27 08:30:00

    阿里妹导读作者分享了跟 AI 协作的一些经验,使用中如何对 AI 输入和反馈,经过磨合后,工作效率会大大提升。前言今年我提交了八千多行代码,但没有一行是我自己写的。最近我的工作日常就是:给 AI 提需

    阅读全文
  • 文章封面

    一文了解DeepSeek及应用场景

    作者:阿里云开发者发布日期:2025-03-26 08:30:00

    阿里妹导读本文详细介绍了DeepSeek及其应用场景,涵盖了大模型的发展历程、基本原理和分类(通用与推理模型)。文章分析了DeepSeek的具体特性、性能优势、低成本训练与调用特点,以及其技术路线(如

    阅读全文
  • 文章封面

    AI联网搜索时的prompt小技巧

    作者:阿里云开发者发布日期:2025-03-25 08:30:00

    阿里妹导读本文详细介绍了如何利用AI工具,特别是那些具有深度联网搜索能力的大模型,来提高信息检索的效率和准确性。前言随着今年DeepSeek的爆火,结合去年至今KIMI、通义千问、豆包大模型的快速发展

    阅读全文
  • 文章封面

    大模型联网搜索的短板与突破之路

    作者:阿里云开发者发布日期:2025-03-24 08:30:00

    阿里妹导读本文作者详细分析了当前大模型在联网搜索功能中存在的几个主要问题,并提供了具体的案例和解决方案。一、背景和原理大模型联网搜索的功能,是指大模型通过实时的进行互联网搜索来获取实时信息,然后做出更

    阅读全文
  • 文章封面

    MCP:跨越AI模型与现实的桥梁

    作者:阿里云开发者发布日期:2025-03-21 08:30:00

    阿里妹导读本文主要围绕AI技术的进步,特别是Anthropic的Claude 3.7 Sonnet模型在逻辑推理、代码生成和复杂任务执行方面的能力提升及其应用场景。一、引言AI 技术近年来取得了显著进

    阅读全文
  • 文章封面

    Manus的技术实现原理浅析与简单复刻

    作者:阿里云开发者发布日期:2025-03-20 08:30:00

    阿里妹导读作者参考网络相关信息并加上个人理解,对Manus的技术实现原理进行深入分析,并做了一个简单版本的复刻,欢迎大家在评论区互相交流探讨~最近Manus可谓是AI圈的“新晋网红”,上线第一天就全网

    阅读全文
  • 文章封面

    性能比肩最强开源,QwQ-32B一键部署,百万Token免费送!

    作者:阿里云开发者发布日期:2025-03-19 08:30:00

    阿里妹导读本文介绍如何通过百炼平台调用QwQ-32B开源模型。百炼平台提供的标准化 API 接口,免去了自行构建模型服务基础设施的麻烦,并支持负载均衡及自动扩缩容,确保了 API 调用的高稳定性。此外

    阅读全文
  • 文章封面

    如何监控vLLM等大模型推理性能?

    作者:阿里云开发者发布日期:2025-03-18 08:30:00

    阿里妹导读本文将深入探讨 AI 推理应用的可观测方案,并基于 Prometheus 规范提供一套完整的指标观测方案,帮助开发者构建稳定、高效的推理应用。近两年来,随着大语言模型(LLM)的快速普及,A

    阅读全文
  • 文章封面

    23招教你掌握大模型提示词技巧

    作者:阿里云开发者发布日期:2025-03-17 08:30:00

    阿里妹导读当模型越来越懂人话,我们还需要学习提示语(Prompt)吗?本文总结了23招向AI提问的好方式。过去一个月,全球AI领域接连引爆"深水炸弹":推理成本直降80%的Deepseek-R1横空出

    阅读全文
  • 文章封面

    主流多智能体框架设计原理

    作者:阿里云开发者发布日期:2025-03-14 08:30:00

    阿里妹导读本文描述了关于智能体(Agents)和多智能体系统(Multi-Agent Systems, MAS)的详尽介绍,涵盖了从定义、分类到具体实现框架的多个方面。一、介绍1.1 什么是智能体关于

    阅读全文
  • 文章封面

    详解大模型应用可观测全链路

    作者:阿里云开发者发布日期:2025-03-13 08:30:00

    阿里妹导读阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。一、背景近日,随着阿里通义千问推出的 QwQ 系列深度思考模型爆火全球

    阅读全文
  • 文章封面

    万字长文讲透 RAG在实际落地场景中的优化

    作者:阿里云开发者发布日期:2025-03-12 08:30:00

    阿里妹导读本文主要围绕DB-GPT应用开发框架如何在实际落地场景做RAG优化。背景在过去两年中,检索增强生成(RAG,Retrieval-Augmented Generation)技术逐渐成为提升智能

    阅读全文
  • 文章封面

    从零开始的DeepSeek微调训练实战(SFT)

    作者:阿里云开发者发布日期:2025-03-11 08:30:00

    前言本文重点介绍使用微调框架unsloth,围绕DeepSeek R1 Distill 7B模型进行高效微调,并介绍用于推理大模型高效微调的COT数据集的创建和使用方法,并在一个medical-o1-

    阅读全文
  • 文章封面

    Transformer到底解决什么问题?

    作者:阿里云开发者发布日期:2025-03-10 08:30:00

    阿里妹导读本文希望围绕“Transformer到底是解决什么问题的”这个角度,阐述NLP发展以来遇到的关键问题和解法,通过这些问题引出Transformer实现原理,帮助初学者理解。近期小组内发起AI

    阅读全文
  • 文章封面

    AI 世界生存手册(二):从LR到DeepSeek,模型慢慢变大了,也变强了

    作者:阿里云开发者发布日期:2025-03-07 08:30:00

    阿里妹导读大家都可以通过写 prompt 来和大模型对话,那大模型之前的算法是怎样的,算法世界经过了哪些比较关键的发展,最后为什么是大模型这条路线走向了 AGI,作者用两篇文章共5.7万字详细探索一下

    阅读全文
  • 文章封面

    AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了

    作者:阿里云开发者发布日期:2025-03-06 08:30:00

    阿里妹导读大家都可以通过写 prompt 来和大模型对话,那大模型之前的算法是怎样的,算法世界经过了哪些比较关键的发展,最后为什么是大模型这条路线走向了 AGI,作者用两篇文章共5.7万字详细探索一下

    阅读全文
  • 文章封面

    JDK21有没有什么稳定、简单又强势的特性?

    作者:阿里云开发者发布日期:2025-03-05 08:30:00

    阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上的版本,想要用更加稳定的Java虚拟线程还请升级哦:-)一

    阅读全文
  • 文章封面

    校招阿里这三年,聊点非技术的

    作者:阿里云开发者发布日期:2025-03-04 08:30:00

    阿里妹导读作者总结了在阿里的三年时间中所收获的宝贵经验和成长感悟。二零二一年的七月九号,我以校招生的身份入职了阿里,开启了一段十分有意思、有意义的阿里旅程。这三年,我从企业金融技术部,到ICBU技术部

    阅读全文
  • 文章封面

    ComfyUI:搭积木一样构建专属于自己的AIGC工作流(保姆级教程)

    作者:阿里云开发者发布日期:2025-03-03 08:30:00

    阿里妹导读通过本篇文章,你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动图】工作流。一、省流版简介通过本篇文章,你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动

    阅读全文
  • 文章封面

    一篇关于DeepSeek模型先进性的阅读理解

    作者:阿里云开发者发布日期:2025-02-28 08:30:00

    阿里妹导读本文以DeepSeek模型为核心,探讨了其技术先进性、训练过程及行业影响。首先介绍DeepSeek的快速崛起及其对AI行业的颠覆作用。DeepSeek通过强化学习(RL)实现Time Sca

    阅读全文
  • 文章封面

    使用A10单卡24G复现DeepSeek R1强化学习过程

    作者:阿里云开发者发布日期:2025-02-27 08:30:00

    阿里妹导读本文描述DeepSeek的三个模型的学习过程,其中DeepSeek-R1-Zero模型所涉及的强化学习算法,是DeepSeek最核心的部分之一会重点展示。一、背景随着DeepSeek的火爆使

    阅读全文
  • 文章封面

    记一次内存利用率问题排查

    作者:阿里云开发者发布日期:2025-02-26 08:30:00

    阿里妹导读本文详细记录和分析了在应用升级到JDK 11后,由于堆外内存(Direct Memory)管理策略的变化导致的内存利用率告警问题。背景近期,我们应用开始出现sunfire内存利用率的告警,规

    阅读全文
  • 文章封面

    JVM 里的逻辑漏洞,居然让你的哈希表慢了 20%!

    作者:阿里云开发者发布日期:2025-02-25 08:30:00

    阿里妹导读本文通过分析一段使用 ConcurrentHashMap 的代码发现,该段代码在 JDK 24 中比 JDK 23 快了 20% 以上,这一性能提升源于 JVM 对标量替换优化的改进。文章详

    阅读全文
  • 文章封面

    LLM 联网搜索,到底是咋回事?

    作者:阿里云开发者发布日期:2025-02-24 08:30:00

    阿里妹导读本文展示从零开始搭建一个本地聊天助手的过程,涵盖了模型部署、搜索逻辑设计、内容提取与整合等关键步骤,特别介绍了如何让模型具备联网搜索能力。0x0 序近段时间 DeepSeek 的服务火遍了全

    阅读全文
  • 文章封面

    GPU是如何进行算力管理的?

    作者:阿里云开发者发布日期:2025-02-21 08:30:00

    阿里妹导读本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下,对GPU算力管理和分配带来的挑战。以及面对这些挑战,GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面

    阅读全文
  • 文章封面

    基于LLM打造沉浸式3D世界

    作者:阿里云开发者发布日期:2025-02-20 08:30:00

    阿里妹导读阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索,为了解决LLMs与3D结合的问题,近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案,通过自

    阅读全文
  • 文章封面

    一文讲清Nvidia GPU和阿里云GPU异构机型

    作者:阿里云开发者发布日期:2025-02-19 08:30:00

    阿里妹导读本文从Nvidia GPU架构的发展历程讲起,重点介绍了各代架构的关键特性和技术进步提高了GPU间的通信效率和并行处理能力。文章特别强调了这些技术在大模型时代的应用,如加速AI训练和推理。阿

    阅读全文
上一页