博士申请 | 香港中文大学(深圳)刘圳老师课题组招收大模型/机器学习全奖博士/硕士
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)数据科学学院专注于数据科学方向的人才培
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)数据科学学院专注于数据科学方向的人才培
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队来自阿里巴巴高德多模态团队,在NeurIPS/ICLR/CVPR/
阅读全文当前,通过 prompt 引导多个大语言模型(LLM)进行协作,如多智能体辩论(Multi-agent Debate),已被证明能显著增强模型的复杂推理能力。然而,基于“显式多轮信息交互“的多模型框架
阅读全文©作者 | 吴宇斌单位 | 摩尔线程研究方向 | GUI agent在强化学习(Reinforcement Learning,RL)中,on-policy 和 off-policy 是两种核心的学习策
阅读全文当前 GPT 类大语言模型的表征和处理机制,仅在输入和输出接口层面对语言元素保持可解释的语义映射。相比之下,人类大脑直接在分布式的皮层区域中编码语义,如果将其视为一个语言处理系统,它本身就是一个在全局
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡国立大学新加坡国立大学(National University of S
阅读全文©作者 | 李嘉诚研究方向 | 大模型预训练和对齐前段时间 K2 作为国际一线模型发布,优秀的效果、开源权重和新技术验证赢得海内外一片掌声,其技术报告中罕见地提到了部分数据构成的细节,例如对于信息密度
阅读全文©作者 | 张智龙单位 | 南京大学研究方向 | 强化学习和世界模型非常高兴我们的工作《Improving Reward Model Generalization from Adversarial P
阅读全文稀疏激活的混合专家模型(MoE)通过动态路由和稀疏激活机制,极大提升了大语言模型(LLM)的学习能力,展现出显著的潜力。基于这一架构,涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!休斯敦大学休斯敦大学的计算机系非常具有学术竞争力。于2024年,CSRanki
阅读全文近年来,GPT-4V 等视觉语言大模型(large vision-language model,LVLM)表现出卓越的多模态理解能力和通用性,尤其是在文档分析、GUI 自动化、机械臂控制等领域展现出令
阅读全文过去几年,做模型训练、推理、微调的人都有同一个痛点:显卡要么排不到,要么价格被炒到天上。而今年,显卡资源紧张问题愈发严峻——SFT、RLHF、MoE 以及多模态训练纷纷上阵,显存需求骤增,钱包压力也随
阅读全文通过使用控制变元(control variate)来校准每个客户端的本地梯度,Scaffold 已被广泛认为是缓解联邦学习中数据异质性影响的一种强大方案。但尽管 Scaffold 实现了显著的性能提升
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!度小满金融DXM ITDD 视觉和多模态团队:我们专注于图像、视频、文本信息的
阅读全文无论你是博士,还是硕士,肯定都因为发不出sci而自我怀疑过!是自己天资不够?不适合科研?还是努力还不够?其实都不是!无论是选题没有头绪,实验漏洞百出,还是论文改来改去依旧被拒。这都是因为你没有遇到一个
阅读全文持续学习旨在使学习系统不断学习流式数据中的知识。随着预训练技术的发展,预训练视觉-语言模型(如 CLIP)通过引入预训练知识促进了持续学习的发展。然而,CLIP 通过将视觉表征与类别名称匹配来进行判别
阅读全文在可验证强化学习(RLVR)的推动下,大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中,LLM 往往需要结合外部工具进行多轮交互,现有 RL 算法在平衡模型的长程推理与多轮工具交互能力
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!盛大集团盛大是一家全球性的私人投资控股集团,由中国网络互动娱乐先锋陈天桥及其家
阅读全文©作者 | 李嘉诚单位 | 字节跳动研究方向 | Retrieva & LLM近期,Google,字节跳动,阿里相继发布了他们最新的检索模型——gemini-embedding,seed1.5-emb
阅读全文©作者 | 机器之心每次打开导航的,导航软件在一秒内给出一个最速路线的时候,你有没有好奇过它是怎么找到这条路的?假如不考虑堵车、红绿灯等交通影响因素,仅找到一条最短最快的路线,那不论如何也逃不掉 Di
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港大学香港大学创立于1911年,坐落于繁华的香港岛西部,是香港的首间大学,发
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!京东我们是京东物流-X科技部-具身智能研发团队,目前正在搭建团队,对于想从事具
阅读全文©作者 | 何之源单位 | 微软亚洲研究院研究方向 | LLM efficiency我们近期提出了一项新工作 TriangleMix:一种可以在几乎不损失性能的前提下,大幅加速 LLM Prefill
阅读全文近日北航和 MAP 联合提出并开源了一个面向大模型(LLM)能力的新评测基准——IFEvalCode,聚焦于“可控代码生成”任务,支持多语言、跨编程语种、多维能力测评,并进一步提出了提升大模型可控性的
阅读全文©作者 | 胡翔、武威单位 | 蚂蚁技术研究院在大语言模型如火如荼的当下,长文本建模仍然是一个极具挑战的问题。纠其根源,一方面在于主流 LLMs 的架构 Transformers 中平方复杂度及随序列
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软Microsoft AI是微软公司于2016年成立的专注于人工智能研究与开
阅读全文©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络众所周知,生成速度慢是扩散模型一直以来的痛点,而为了解决这个问题,大家可谓“八仙过海,各显神通”,提
阅读全文为什么你的语音助手总翻车?当用户说“苹果/不大好吃”和“苹果不大/好吃”,这个苹果到底大不大、好不好吃?当用户说“夏天能穿多少穿多少”和“冬天能穿多少穿多少”,指的到底是少穿一些还是多穿一些?这些人类
阅读全文大型语言模型(LLMs)在上下文知识理解方面取得了令人瞩目的成功。近日,一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里夸克大模型团队在智能科技浪潮中迅速崛起,我们拥有处于上升阶段的核心
阅读全文