DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路
魔搭社区 投稿量子位 | 公众号 QbitAIGRPO训练又有新的工具链可以用,这次来自于ModelScope魔搭社区。随着DeepSeek-R1的成功出圈,其使用的GRPO算法受到了业界的广泛关注。
阅读全文魔搭社区 投稿量子位 | 公众号 QbitAIGRPO训练又有新的工具链可以用,这次来自于ModelScope魔搭社区。随着DeepSeek-R1的成功出圈,其使用的GRPO算法受到了业界的广泛关注。
阅读全文西湖大学 投稿量子位 | 公众号 QbitAI人工智能正迎来前所未有的变革,其中,大语言模型(LLM)的崛起推动了智能系统从信息处理向自主交互迈进。以DeepSeek为代表的LLM,凭借强大的语言理解
阅读全文DeepSeek 发自 凹非寺量子位 | 公众号 QbitAI未来同事,你好~这是一则招聘帖。量子位是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并正致力于帮助更多人第一时
阅读全文白交 衡宇 发自 凹尔蒿寺量子位 | 公众号 QbitAI又一豪华AI创业团队诞生!两位来自谷歌DeepMind顶尖科学家,官宣组团构建超级智能自主系统(superintelligent autono
阅读全文允中 发自 凹非寺量子位 | 公众号 QbitAI继DeepSeek 之后,一款由国内开发的通用AI Agent产品也引发热议——Manus,其背后折射出的是国人对于Agent应用落地的迫切心情。在国
阅读全文SimDINO团队 投稿量子位 | 公众号 QbitAI最新开源的视觉预训练方法,马毅团队、微软研究院、UC伯克利等联合出品!SimDINO和SimDINOv2,通过编码率正则化简化DINO和DINO
阅读全文advml团队 投稿量子位 | 公众号 QbitAIIEEE/CVF国际计算机视觉与模式识别会议(CVPR),作为人工智能领域最具学术影响力的顶级会议之一,将于2025年6月11日至6月15日在美国田
阅读全文克雷西 一水 发自 凹非寺量子位 | 公众号 QbitAI这壁垒……一夜走红的Manus,现在已经有了开源复刻版!5个人3个小时,一个完全免费、无需排队等待的OpenManus就做好了。至于复现程度,
阅读全文梦晨 发自 凹非寺量子位 | 公众号 QbitAI起猛了,DeepSeek开口说话了。而且是超低延迟实时秒回,还可以随时打断的那种,先来看一段VCR:DeepSeek以及其他任意大模型接入这样的高质量
阅读全文梦晨 发自 凹非寺量子位 | 公众号 QbitAI见识过32B的QwQ追平671的DeepSeek R1后——刚刚,7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事?新方法LADDER,通
阅读全文小q 投稿量子位 | 公众号 QbitAI只要极少量的标注样本,就能让模型精准分割3D场景?来自哥本哈根大学、苏黎世联邦理工学院等机构的研究人员,提出了一个全新的多模态Few-shot 3D分割设定和
阅读全文组委会 发自 凹非寺量子位|公众号 QbitAIDeepSeek的火热,让更多中国AI的可能性被看见。下一个AI“国产之光”将会是谁?时值第三届中国AIGC产业峰会,量子位将根据过去一年里AIGC企业
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAI就在刚刚,腾讯版Sora补齐了又一重要拼图——图生视频。而且还是熟悉的配方,和去年12月发布的文生视频模型HunyuanVideo一样,发布即开源。那
阅读全文允中 发自 凹非寺量子位 | 公众号 QbitAIBGE系列模型自发布以来广受社区好评。近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。BGE-VL在图文检索、
阅读全文克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要两台苹果Mac Studio,在家就能跑满血DeepSeek R1了?一家大模型工作室在推特上宣布,成功用两台搭载512GB M3 Ultra的
阅读全文金磊 发自 凹非寺量子位 | 公众号 QbitAI具身智能领域的融资消息,真是一个接一个。就在刚刚,逐际动力(LimX Dynamics)方面表示,近期又完成了一个A+轮融资。为什么要加一个“又”呢?
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAIOpenAI即将推出的Agent,每月最低收费都要一万多?根据最新爆料,OpenAI计划为专业人士推出量身定制版Agent,用于执行销售线索分类、软件
阅读全文IDEA研究院 投稿量子位 | 公众号 QbitAIAI能看懂细节了!IDEA研究院发布基于多模态大语言模型的目标检测模型DINO-XSeek。结合视觉与语言理解,只需通过自然语言描述,DINO-XS
阅读全文金磊 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,RTX 5070被网友们喷成“史上最差的70系列”了。这咋回事呢?因为老黄在1月份CES上发布RTX 5070时是这么说的:得益于AI啊,我
阅读全文梦晨 发自 凹非寺量子位 | 公众号 QbitAIChatGPT新Bug引热议:无法画出“有0头大象的房间”。要么会出现真实画风的大象,要么会出现玩具象,很多网友重复了很多次都是通用的结果。假如后续追
阅读全文SpatialVLA团队 投稿量子位 | 公众号 QbitAI与3D物理环境交互、适应不同机器人形态并执行复杂任务的通用操作策略,一直是机器人领域的长期追求。现有的通用操作模型局限于2D输入,缺乏鲁棒
阅读全文组委会 发自 凹非寺量子位|公众号 QbitAI过去一年,我们见证了AI无数个“里程碑式”时刻。从Sora带来的超写实视频生成能力,到开源大模型在性能上逐渐追平闭源模型;从多模态理解能力质的飞跃,到A
阅读全文DeepSeek 发自 凹非寺量子位 | 公众号 QbitAI未来同事,你好~这是一则招聘帖。量子位是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并正致力于帮助更多人第一时
阅读全文金磊 克雷西 发自 凹非寺量子位 | 公众号 QbitAI国内首个原生AI IDE(集成开发环境),来自字节,实测在此:哪怕一点代码都不懂,只要能说出自己的需求,就能靠AI开发出一个功能完备的应用。例
阅读全文允中 发自 凹非寺量子位 | 公众号 QbitAI大模型刷榜 MMLU、屠榜 GPQA 的玩法一夜变天???要知道,过去几年,各种通用评测逐渐同质化,越来越难以评估模型真实能力。GPQA、MMLU-p
阅读全文梦晨 发自 凹非寺量子位 | 公众号 QbitAI基础模型竞争又紧张刺激起来了!GPT-4.5刚登顶竞技场且全任务分类第一名,6小时后总榜就被马斯克的新版Grok-3反超。两者都是获得3000+票数,
阅读全文衡宇 发自 凹非寺量子位 | 公众号 QbitAI1973年,比尔·盖茨高中毕业,进入哈佛大学就读。彼时的他尚未意识到,未来三年,这座承载着三十四位诺贝尔奖得主荣光的学府,将在他的人生中交织出最激烈的
阅读全文组委会 发自 凹非寺量子位|公众号 QbitAIDeepSeek的火热,让更多中国AI的可能性被看见。下一个AI“国产之光”将会是谁?时值第三届中国AIGC产业峰会,量子位将根据过去一年里AIGC企业
阅读全文明敏 一水 发自 凹非寺量子位 | 公众号 QbitAI太酷了!一个人,只用3个小时,完全靠AI开发游戏,9天时间就赚了17360美元(折合人民币12.64万)。就是这样一个飞行模拟游戏,最近引来上千
阅读全文SepLLM团队 投稿量子位 | 公众号 QbitAI文字中貌似不起眼的标点符号,竟然可以显著加速大模型的训练和推理过程?来自华为、港大、KAUST和马普所的研究者,就提出了一种新的自然语言建模视角—
阅读全文