TPAMI 2025顶刊!基于脉冲驱动Transformer的高效且可扩展训练方法
©作者 | 中科院自动化所李国齐课题组脉冲神经网络(SNN)因其生物合理性和低功耗特性,被视为人工神经网络(ANN)的潜在替代方案。然而,SNN 在实际应用中面临性能差距和训练成本高的挑战。为此我们提
阅读全文©作者 | 中科院自动化所李国齐课题组脉冲神经网络(SNN)因其生物合理性和低功耗特性,被视为人工神经网络(ANN)的潜在替代方案。然而,SNN 在实际应用中面临性能差距和训练成本高的挑战。为此我们提
阅读全文We’re excited to announce that the test set for the ICDAR 2025 Competition on Historical Map Text De
阅读全文大模型时代,读论文这事儿真是越来越爽了~你敢信,这样式儿的论文并非中文原版,而是出自翻译软件之手的翻译版。原文长这样:不仅译文流畅,公式图表也丝毫不乱,原模原样清晰美观不说,各种图注表头该翻译也都能翻
阅读全文遗传算法、粒子群算法等作为经典的群体智能方法,自诞生以来便在优化问题领域得到广泛应用。然而,这类传统方法在大模型时代中是否仍然适用?上海人工智能实验室 OpenAGCI Team 联合东北大学数据挖掘
阅读全文©PaperWeekly 原创 · 作者 | 汤昊单位 | 北京大学博士研究方向 | 多模态大模型研究动机长期以来,细粒度感知任务(检测,分割等)的建模方式都比视觉-语言任务复杂的多,非常依赖于任务特
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!中关村人工智能研究院还在焦虑AI可能让你失业吗?羡慕大佬的 GitHub 高星
阅读全文2025各大顶会陆续出了DDL,有小伙伴压点提交ACL 2025的时候已经将近8500号了,照这个趋势下去加上12月的,应该能冲击12000。肝论文的各位同学们还好嘛?发过顶会的同学都知道,做科研最主
阅读全文本篇分享 AAAI 2025 论文 POI-Enhancer: An LLM-based Semantic Enhancement Framework for POI Representation L
阅读全文背景:RAG与长文本语言模型的权衡随着大型语言模型(LLMs)的快速发展,输入长度限制从最初的 4K token 到如今普遍支持的 128K 甚至百万级 token 输入,“长文本”(Long Con
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)香港科技大学是亚洲乃至全球领先的研究学府之一,并被认为是世
阅读全文©PaperWeekly 原创 · 作者 | 张逸骅单位 | 密歇根州立大学博士生研究方向 | 可信人工智能过去的两周里,DeepSeek 在社交媒体上宣告这是他们的开源周(OpenSourceWee
阅读全文香港大学近期重磅发布开源项目 AutoAgent,这是由黄超教授实验室开发的创新 AI 框架。它最大的特点是:只要用自然语言就能创建 AI 助手,让人工智能应用开发变得特别简单。项目开源仅三周就在 G
阅读全文©作者 | 温佳鑫单位 | 清华大学硕士生大模型应该以什么形式进行推理?自然语言是表示推理路径的最佳方案吗?2024 年 9 月,OpenAI 携 o1 模型吹响推理革命的号角,以惊人的思维链长度刷新
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!小红书小红书交易算法团队,主要负责小红书电商、直播侧的算法研发,涵盖交易搜索、
阅读全文©PaperWeekly 原创 · 作者 | 陈翰扬单位 | 伊利诺伊大学香槟分校研究方向 | 多模态大语言模型▲ EmbodiedBench | 从刷题到搬砖,通用多模态大模型离具身智能还有多远?多
阅读全文©作者 | 席浩诚单位 | UC伯克利博士生来源 | 机器之心近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。这表明,F
阅读全文©PaperWeekly 原创 · 作者 | 汪远单位 | 中国科学技术大学研究方向 | 图像生成当前,AI 图像生成技术迅猛发展,各类图文生成模型让用户能凭借简单文字描述创作出精美的图像。然而,这也
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港大学香港大学创立于1911年,坐落于繁华的香港岛西部,是香港的首间大学,发
阅读全文最近打开某乎、牛客等互联网论坛,“2025 届春招算法岗”相关话题热度居高不下。“2025 春招算法岗已经卷麻了”“算法岗竞争太激烈,感觉上岸无望”等帖子层出不穷,点进去一看,满是求职者们的焦虑与无奈
阅读全文简介本文提出轻量化多模态大模型 LLaVA-MoD,通过集成稀疏的专家混合(MoE)架构,优化小模型的网络结构,并提出 Dense-to-Sparse 蒸馏框架,结合两阶段蒸馏策略(模仿蒸馏+偏好蒸馏
阅读全文©作者 | 纪焘单位 | 复旦NLP实验室博士后研究方向| 大模型高效推理DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头
阅读全文技术革新临界点已至,大模型生态迎来爆发期当前,全球人工智能产业正经历从“暴力美学”到“精巧工程”的范式跃迁。DeepSeek 引领超强大模型的开源开放与普惠化浪潮之下,大模型技术已突破边界逐步渗透至千
阅读全文DeepSeek可谓是开年的AI界大明星,从论文方面来说,开年后就有意大利老铁已经用国产AI把顶刊SCI玩成了"消消乐"——投稿一天接收,中科院一区6.5分期刊直接盖章认证,这效率比外卖小哥抢单还离谱
阅读全文导读近年来,大语言模型(LLMs)在自然语言处理等多个领域展现了卓越的性能。随着这些模型的广泛应用,确保其安全性和对齐性已成为重中之重。然而,LLMs 仍面临越狱攻击的严峻挑战,现有的越狱攻击方法可大
阅读全文在数字化浪潮席卷而来的今天,视觉文档已然成为信息传递的重要载体。从学术报告中的复杂图表,到商业计划书里的精妙布局,再到医疗档案中的多维数据展示,这些富含视觉元素的文档,不仅仅是简单的文字堆砌,而是融合
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!达特茅斯学院达特茅斯学院(Dartmouth College),创建于1769
阅读全文很多科研人,现在都会借助AI工具进行学术创作/科研工作,无论是文献检索整理、内容修改润色,还是拓展创新维度,AI都能提升研究效率。但在使用DeepSeek、ChatGPT这类AI的过程中,总会遇到生成
阅读全文©PaperWeekly 原创 · 作者 | 张彧单位 | 德州农工大学助理教授随着学术会议论文提交数量的迅速增加,我们越来越依赖有效的论文-评审人匹配模型。此前在这一领域的研究考虑了多种因素来评估评
阅读全文©作者 | 汤轶文单位 | 上海科技大学、上海AI Lab研究方向 | 3D视觉,大模型高效迁移 许多近期的研究致力于开发大型多模态模型(LMMs),使 LLMs 能够解读多模态信息,如
阅读全文第二十四届中国计算语言学大会(The 24th China National Conference on Computational Linguistics, CCL 2025)将于2025年8月11
阅读全文