3710亿数学Tokens!全球最大开源数学数据集MegaMath震撼发布,碾压DeepSeek-Math
©来源 | 机器之心在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。近日,LLM360 推出了 MegaMath:全球目前最大的开源数学推理预训练数据集,共计 3710
阅读全文©来源 | 机器之心在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。近日,LLM360 推出了 MegaMath:全球目前最大的开源数学推理预训练数据集,共计 3710
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!美团美团的使命是“帮大家吃得更好,生活更好”,公司聚焦“零售 + 科技”战略,
阅读全文最近,由 Anthropic 推出的 Computer Use 利用基于多模态大模型的智能体操控电脑完成各种任务,让人们为之兴奋,也带动了学术界与工业界在 OS Agents 相关领域的研究与发展。浙
阅读全文射学影像是现代医疗诊断的关键,每年全球约有 80 亿次影像检查。随着 AI 技术的快速发展,医学视觉语言模型 (VLM) 在放射学任务中显示出良好的前景,但大多数现有的 VLM 仅产生最终答案而不展示
阅读全文©来源 | 机器之心在视觉生成领域,扩散模型(Diffusion Models)已经成为生成高质量图像、视频甚至文本的利器。然而,生成结果往往离我们所偏好的不一致:结果不美观,图文不符,等等。虽然我们
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!地平线地平线是市场领先的乘用车高级辅助驾驶和高阶智能驾驶解决方案供应商。我们的
阅读全文本文系统总结了多语言大模型的相关工作,探讨了跨语言大模型对⻬⽅法,包括参数调整对⻬和参数冻结对⻬。同时该综述也涵盖了多语⾔⼤模型的训练数据和未来⽅向,希望帮助研究者全面了解多语言大模型的研究现状。该工
阅读全文论文标题:Bridging Traffic State and Trajectory for Dynamic Road Network and Trajectory Representation Le
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南方科技大学南方科技大学是深圳市在中国高等教育改革发展的时代背景下于 2012
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴通义实验室AI搜索团队致力于AI搜索、RAG、Agent System
阅读全文独木不成林,但“人多嘴杂”也未必是好事!随着基于大型语言模型(LLM)的多智能体系统逐渐成为解决复杂问题的主流方案,一个令人头疼的问题也随之而来:多智能体之间的通信冗余。想象一下,一个团队里每个人都想
阅读全文本文介绍了 VideoPainter,一种用于视频修复的双分支框架,旨在实现高质量的视频内容恢复和编辑能力。通过构建大规模(390K 视频片段)视频修复数据集,结合轻量级上下文编码器(仅占骨干网络参数
阅读全文©作者 | 机器之心自回归解码已然成为大语言模型的推理标准。大语言模型每次前向计算需要访问它全部的参数,但只能得到一个 token,导致其生成昂贵且缓慢。近日,EAGLE 团队的新作《EAGLE-3:
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学香港科技大学(The Hong Kong University o
阅读全文搞科研,最怕的就是每天“眼睛读文献,脑袋想方案”。以为只要文献读的够多,准备就足够充分,就能找到好选题,写出好文章。实际上是在用“勤奋读文献”掩盖“不敢开始干”的焦虑。过来人都知道:科研成果是干出来的
阅读全文随着人工智能技术的飞速发展,图像到视频(I2V)生成已成为艺术与科技融合的前沿领域。然而,现有方法在将静态绘画转化为动态视频时,仍面临两大核心挑战:(1)不动:现有模型无法准确解读和执行文本提示中的运
阅读全文本文由加拿大滑铁卢大学魏聪、陈文虎教授团队与 Meta GenAI 共同完成。第一作者魏聪为加拿大滑铁卢大学计算机科学系二年级博士生,导师为陈文虎教授,陈文虎教授为通讯作者。近年来,视频生成技术在动作
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海交通大学上海交通大学人工智能学院(https://sai.sjtu.edu
阅读全文Advanced Science 青年科学家奖2025开放申请!Advanced Science 青年科学家奖 (Advanced Science Young Innovator Award)面向全球
阅读全文以 DeepSeek-R1 为代表的强化学习范式,近期在语言模型领域掀起了一次“推理革命”。而这一次,轮到视频了。最近,港中文联合清华团队正式发布了首个将 “R1 范式”系统性落地到视频推理领域的模型
阅读全文基于当前观察,预测铰链物体的运动,尤其是 part-level 级别的运动,是实现世界模型的关键一步。尽管现在基于 diffusion 的方法取得了很多进展,但是这些方法存在处理效率低,同时缺乏三维感
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里巴巴通义实验室招聘研究型实习生,研究方向为通用Agent技术(pl
阅读全文万物皆卷的时代,升学、就业的竞争越来越激烈,想要保研、申博、进大厂,没有高质量论文在手就相当于“裸奔”!尤其是这个人人惶恐又内卷的时代,想要抓住点什么来增强安全感。有一份拿得出手的成绩——发论文的数量
阅读全文你是否想过,未来的机器人如何真正理解并完成我们日常生活中的各种复杂任务?想象一下这样的场景:你走进厨房,告诉家中的机器人:“帮我用微波炉热一下碗里的饭。”对人类来说,这似乎再简单不过,但机器人要真正理
阅读全文在 InternVL-2.5 上实现 10 倍吞吐量提升,模型性能几乎无损失。最新 1-bit 多模态大模型 KV cache 量化方案 CalibQuant 来了。通过结合后缩放和校准方法,可显著降
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!埃默里大学埃默里大学(Emory University)创建于1836年,位于
阅读全文随着人工智能领域的不断发展,深度学习模型在多个任务中展现出强大的能力,尤其是在大规模语言模型(LLMs)和多模态大语言模型(MLLMs)中。最近,DeepSeek R1 的提出引发了对强化学习(RL)
阅读全文在大语言模型(LLMs)检索增强生成(RAG)技术快速迭代的今天,一个根本性难题始终存在困扰 RAG 的可信生成:当模型参数记忆与外部检索知识冲突时,如何实现知识依赖的精准调控?目前方法只能依赖大模型
阅读全文本文深入分析了 prompt tuning 的推理机理,并针对分析结果提出了动态提示扰动的方法,提升 LLMs 在复杂推理任务中的表现。论文标题:Improving Complex Reasoning
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲研究院微软亚洲研究院的机器学习组致力于推动 AI 在电池领域的基础和应
阅读全文