具身智能新时代!VLA迎来最强基础模型Magma:UI导航、机器人操作全能
新智元报道 编辑:LRS【新智元导读】Magma是一个新型多模态基础模型,能够理解和执行多模态任务,适用于数字和物理环境:通过标记集合(SoM)和标记轨迹(ToM)技术,将视觉语言数据转化为可操
阅读全文新智元报道 编辑:LRS【新智元导读】Magma是一个新型多模态基础模型,能够理解和执行多模态任务,适用于数字和物理环境:通过标记集合(SoM)和标记轨迹(ToM)技术,将视觉语言数据转化为可操
阅读全文新智元报道 编辑:NJY【新智元导读】美政府掀起了一阵AI First狂潮,而幕后推手正是科技狂人马斯克。他领衔的DOGE正打造一款AI神器GSAi,要提升政府内部12000名员工的效率,甚至还
阅读全文新智元报道 编辑:LRST【新智元导读】TimeDistill通过知识蒸馏,将复杂模型(如Transformer和CNN)的预测能力迁移到轻量级的MLP模型中,专注于提取多尺度和多周期模式,显著
阅读全文新智元报道 编辑:KingHZ【新智元导读】谷歌发布了1000亿文本-图像对数据集,是此前类似数据集的10倍,创下新纪录!基于新数据集,发现预训练Scaling Law,虽然对模型性能提升不明
阅读全文新智元报道 编辑:Aeneas 好困【新智元导读】打造出AlphaGo的超级天才、谷歌DeepMind十二年老将Ioannis Antonoglou下场创业了,初创Reflection已融资1.
阅读全文新智元报道 编辑:英智【新智元导读】生成式AI正重塑众多行业格局!传统搜索、网站与自由开发者、教育科技等行业受到冲击。AI对行业变革又有哪些推动作用?答案就在报告中。近日,SimilarWeb发
阅读全文新智元报道 编辑:KingHZ【新智元导读】CVPR 2025,混合新架构MambaVision来了!Mamba+Transformer混合架构专门为CV应用设计。MambaVision 在To
阅读全文新智元报道 编辑:编辑部 JHNZ【新智元导读】离了个大谱,Manus全网邀请码一票难求?激动人心的是,开源界凌晨来了一场核爆攻击,用3小时代码量开源了平替项目——OpenManus,免费体验不
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】就在刚刚,上海半图科技完成数千万人民币天使轮融资,IDG资本独家领投!这支汇集了米哈游、字节、叠纸人才的创始团队,在AI游戏,3D技术,虚拟偶像等领
阅读全文新智元报道 编辑:LRST【新智元导读】OmniParser V2可将屏幕截图转换为结构化元素,帮助LLM理解和操作GUI;在检测小图标和推理速度上显著提升,延迟降低60%,与多种LLM结合后表
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】仅用32B,就击败o1-mini追平671B满血版DeepSeek-R1!阿里深夜重磅发布的QwQ-32B,再次让全球开发者陷入狂欢:消费级显卡就
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】智源联手多所顶尖高校发布的多模态向量模型BGE-VL,重塑了AI检索领域的游戏规则。它凭借独创的MegaPairs合成数据技术,在图文检索、组合图像
阅读全文新智元报道 编辑:LRST【新智元导读】StyleStudio能解决风格迁移中风格过拟合、文本对齐差和图像不稳定的问题,通过跨模态AdaIN技术融合文本和风格特征、用教师模型稳定布局、引入基于风
阅读全文新智元报道 编辑:编辑部 HNZ【新智元导读】由UCLA等机构共同组建的研究团队,全球首次在20亿参数非SFT模型上,成功实现了多模态推理的DeepSeek-R1「啊哈时刻」!就在刚刚,我们在未
阅读全文新智元报道 编辑:桃子 好困【新智元导读】PyTorch机器学习大神Horace He宣布,正是离职加入OpenAI前CTO初创Thinking Machines。这位技术奇才,曾被OpenAI
阅读全文新智元报道 编辑:Aeneas 好困【新智元导读】3月28日至30日,中国具身智能大会将在北京海淀隆重举行!本次大会阵容顶级,学术影响力空前,来自中国工程院、中国科学院、上交、清华、浙大、同济的
阅读全文新智元报道 编辑:编辑部 HNY【新智元导读】就在昨天,全国产算力训出的讯飞星火X1全面升级!70B小身板在数学领域全面领先,性能直接对标OpenAI o1和DeepSeek-R1。单机部署成本
阅读全文新智元报道 编辑:犀牛【新智元导读】台积电豪掷千亿美元在美建厂,特朗普高调站台。与此同时,昔日霸主英特尔奋起直追,18A制程被寄予厚望,英伟达、博通等巨头秘密测试。代工大战硝烟再起!然而,18A
阅读全文新智元报道 编辑:LRST【新智元导读】基于内置思维链的思考方法为解决多轮会话中存在的问题提供了研究方向。按照思考方法收集训练数据集,通过有监督学习微调大语言模型;训练一个一致性奖励模型,并将该
阅读全文新智元报道 编辑:Aeneas 犀牛【新智元导读】19岁退学哈佛,投身AI创业,跟硅谷大佬称兄道弟,走上人生巅峰!如今,三位00后创始人的这家AI招聘公司,已经估值20亿美元,用时两年成为百亿级
阅读全文新智元报道 编辑:编辑部 HYj【新智元导读】Karpathy发出灵魂拷问,评估AI究竟该看哪些指标?答案或许就藏在经典游戏里!最近,加州大学圣迭戈分校Hao AI Lab用超级马里奥等评测AI
阅读全文新智元报道 编辑:Aeneas 英智【新智元导读】Hugging Face发布了「超大规模实战手册」,在512个GPU上进行超过4000个scaling实验。联创兼CEO Clement对此感到
阅读全文新智元报道 编辑:犀牛 桃子【新智元导读】近日,马斯克和谷歌联创谢尔盖·布林,分别抛出了惊人言论。前者大胆预测,2029年AI将超越人类智慧总和,20%概率会导致文明灭绝。而后者则喊话员工每周工
阅读全文新智元报道 编辑:犀牛【新智元导读】DeepMind再放大招!继AlphaGo之后,他们利用改进的强化学习技术,让AI在《我的世界》类游戏Craftax中超越了人类专家水平。AI仅需少量数据就能
阅读全文新智元报道 编辑:KingHZ【新智元导读】基于连续概念,Meta团队新研究提出了超越「下一个token预测」语言建模新范式。更加重要的是,新方法不仅能增强原有的范式,而且比起知识蒸馏,数据量减
阅读全文新智元报道 编辑:编辑部 JHZ【新智元导读】GPT-4.5上线一天,已经引起了集体群嘲:这个模型彻头彻尾失败了,OpenAI已经陷入严重困境,失去护城河!有人算出,GPT-4.5比DeepSe
阅读全文新智元报道 编辑:LRS【新智元导读】Nature杂志首次分析过去十年全球机构撤稿率,发现医学领域成重灾区,中国部分医院撤稿率极高。但文章在数据采样上有偏差,结论并不十分公正。撤稿,是对科研人员
阅读全文新智元报道 编辑:KingHZ 英智【新智元导读】最近,OpenAI的研究团队在采访中表示,全新的Deep Research功能,可以为你节省几个小时甚至几天的时间!Deep Research(
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】OpenAI的重磅炸弹GPT-4.5,刚刚如期上线了!它并不是推理模型,但是规模最大、知识最丰富,最鲜明的特点就是情商高、很类人。Pro版用户和付
阅读全文新智元报道 编辑:编辑部 HNYs【新智元导读】Phi-4系列模型上新了!56亿参数Phi-4-multimodal集语音、视觉、文本多模态于一体,读图推理性能碾压GPT-4o;另一款38亿参数
阅读全文