告别碎片化评测!AIGVE-Tool打造AI视频评估「全家桶」,多维指标一键测评
文章标题:AIGVE-Tool: AI-Generated Video Evaluation Toolkit with Multifaceted Benchmark项目主页:https://www.a
阅读全文文章标题:AIGVE-Tool: AI-Generated Video Evaluation Toolkit with Multifaceted Benchmark项目主页:https://www.a
阅读全文©作者 | 王浩单位 | 浙江大学来源 | 机器之心本文由浙江大学、中南大学、上海交通大学、Tiktok、北京大学、南洋理工大学联合完成。第一作者王浩为浙江大学硕博连读生,发表NeurIPS、ICLR
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!高德地图高德共享出行,是国内首创的一站式聚合打车平台,汇聚了全国范围内的各家运
阅读全文沃的顶会强化学习(RL)与多目标优化(MOO)的深度融合正推动AI决策能力迈向新高度。港科大团队提出的动态梯度平衡框架,通过多任务协同优化,在自动驾驶场景中同时提升安全性(碰撞率↓38%)和能效(能耗
阅读全文深度神经网络(Deep Neural Network, DNN)模型已经在各行业中广泛应用,由对抗样本引发的安全问题受到日益关注。现有对抗鲁棒性评测平台不具备自动优化模型架构或自动提升攻击性能的能力,
阅读全文近日,浙江大学赵洲教授团队联合字节跳动,发布第三代语音合成模型 MegaTTS3,在各大专业评测数据下均展现领先水平。MegaTTS3 以仅 0.45B 参数的轻量化架构,不仅实现高质量的中英双语语音
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!佛罗里达大学佛罗里达大学坐落于Gainesville,是一座大学城风格的城市,
阅读全文宣传海报关于讲座报告时间2025年4月15日(周二)20:00-21:30(北京时间)报告时长60分钟+30分钟提问互动报告题目并联机器人机构学基础与装备创新观看方式扫码入会:如果您之前未关注“Wil
阅读全文本文为大家介绍上海科技大学 YesAI Lab 在 CVPR 2025 上入选 Highlight 的工作。本研究针对视觉语言模型提示学习中的带噪标签问题,提出了一种新的鲁棒提示学习方法 NLProm
阅读全文©来源 | 机器之心在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。近日,LLM360 推出了 MegaMath:全球目前最大的开源数学推理预训练数据集,共计 3710
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!美团美团的使命是“帮大家吃得更好,生活更好”,公司聚焦“零售 + 科技”战略,
阅读全文最近,由 Anthropic 推出的 Computer Use 利用基于多模态大模型的智能体操控电脑完成各种任务,让人们为之兴奋,也带动了学术界与工业界在 OS Agents 相关领域的研究与发展。浙
阅读全文射学影像是现代医疗诊断的关键,每年全球约有 80 亿次影像检查。随着 AI 技术的快速发展,医学视觉语言模型 (VLM) 在放射学任务中显示出良好的前景,但大多数现有的 VLM 仅产生最终答案而不展示
阅读全文©来源 | 机器之心在视觉生成领域,扩散模型(Diffusion Models)已经成为生成高质量图像、视频甚至文本的利器。然而,生成结果往往离我们所偏好的不一致:结果不美观,图文不符,等等。虽然我们
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!地平线地平线是市场领先的乘用车高级辅助驾驶和高阶智能驾驶解决方案供应商。我们的
阅读全文本文系统总结了多语言大模型的相关工作,探讨了跨语言大模型对⻬⽅法,包括参数调整对⻬和参数冻结对⻬。同时该综述也涵盖了多语⾔⼤模型的训练数据和未来⽅向,希望帮助研究者全面了解多语言大模型的研究现状。该工
阅读全文论文标题:Bridging Traffic State and Trajectory for Dynamic Road Network and Trajectory Representation Le
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南方科技大学南方科技大学是深圳市在中国高等教育改革发展的时代背景下于 2012
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴通义实验室AI搜索团队致力于AI搜索、RAG、Agent System
阅读全文独木不成林,但“人多嘴杂”也未必是好事!随着基于大型语言模型(LLM)的多智能体系统逐渐成为解决复杂问题的主流方案,一个令人头疼的问题也随之而来:多智能体之间的通信冗余。想象一下,一个团队里每个人都想
阅读全文本文介绍了 VideoPainter,一种用于视频修复的双分支框架,旨在实现高质量的视频内容恢复和编辑能力。通过构建大规模(390K 视频片段)视频修复数据集,结合轻量级上下文编码器(仅占骨干网络参数
阅读全文©作者 | 机器之心自回归解码已然成为大语言模型的推理标准。大语言模型每次前向计算需要访问它全部的参数,但只能得到一个 token,导致其生成昂贵且缓慢。近日,EAGLE 团队的新作《EAGLE-3:
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学香港科技大学(The Hong Kong University o
阅读全文搞科研,最怕的就是每天“眼睛读文献,脑袋想方案”。以为只要文献读的够多,准备就足够充分,就能找到好选题,写出好文章。实际上是在用“勤奋读文献”掩盖“不敢开始干”的焦虑。过来人都知道:科研成果是干出来的
阅读全文随着人工智能技术的飞速发展,图像到视频(I2V)生成已成为艺术与科技融合的前沿领域。然而,现有方法在将静态绘画转化为动态视频时,仍面临两大核心挑战:(1)不动:现有模型无法准确解读和执行文本提示中的运
阅读全文本文由加拿大滑铁卢大学魏聪、陈文虎教授团队与 Meta GenAI 共同完成。第一作者魏聪为加拿大滑铁卢大学计算机科学系二年级博士生,导师为陈文虎教授,陈文虎教授为通讯作者。近年来,视频生成技术在动作
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海交通大学上海交通大学人工智能学院(https://sai.sjtu.edu
阅读全文Advanced Science 青年科学家奖2025开放申请!Advanced Science 青年科学家奖 (Advanced Science Young Innovator Award)面向全球
阅读全文以 DeepSeek-R1 为代表的强化学习范式,近期在语言模型领域掀起了一次“推理革命”。而这一次,轮到视频了。最近,港中文联合清华团队正式发布了首个将 “R1 范式”系统性落地到视频推理领域的模型
阅读全文基于当前观察,预测铰链物体的运动,尤其是 part-level 级别的运动,是实现世界模型的关键一步。尽管现在基于 diffusion 的方法取得了很多进展,但是这些方法存在处理效率低,同时缺乏三维感
阅读全文