大模型不再是路痴!空间推理的答案是RAG:旅游规划、附近推荐全解锁
新智元报道 编辑:LRST【新智元导读】Spatial-RAG结合了空间数据库和大型语言模型(LLM)的能力,能够处理复杂的空间推理问题。通过稀疏和密集检索相结合的方式,Spatial-RAG可
阅读全文新智元报道 编辑:LRST【新智元导读】Spatial-RAG结合了空间数据库和大型语言模型(LLM)的能力,能够处理复杂的空间推理问题。通过稀疏和密集检索相结合的方式,Spatial-RAG可
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】巨头英伟达,即将收购阿里前副总裁贾扬清的初创Lepton AI,交易价值或达数亿美元!而Lepton AI,仅仅创立两年。就在刚刚,国内AI圈被这一
阅读全文新智元报道 编辑:KingHZ 犀牛【新智元导读】前英特尔CEO、科技行业大佬帕特·基辛格(Pat Gelsinger)再次出山,加入风投企业Playground Global,重点投入硬科技,
阅读全文新智元报道 编辑:编辑部 HNZ【新智元导读】近日,一则重磅消息引爆业内——vivo官宣成立机器人Lab,正式进军机器人行业!不是赶热点,不是盲目下场,30年积累,或让这枚「巨无霸」的入局在业内
阅读全文新智元报道 编辑:编辑部 HNZY【新智元导读】AI音乐,从此进入「会思考」的时代!刚刚,昆仑万维扔出一枚重磅炸弹——全球首款音乐推理大模型Mureka O1横空出世,实力碾压Suno,强势登顶
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】AI如何重塑孩子的未来?听力熊Teeni.AI首席科学家张驰携自进化智能体AppAgentX重磅亮相,要把AI打造成孩子成长路上的「最佳拍档」。这不
阅读全文新智元报道 编辑:LRST【新智元导读】OpenGS-SLAM是一种新的RGB-only SLAM系统,专门用于无界户外场景。它通过点图回归网络和3D高斯分布(3DGS)表示,实现了精准的相机定
阅读全文新智元报道 编辑:编辑部【新智元导读】685B的DeepSeek-V3新版本,就在昨夜悄悄上线了。参数量685B的V3,代码数学推理再次显著提升,甚至代码追平Claude 3.7,网友们实测后大
阅读全文新智元报道 编辑:LRS【新智元导读】块离散去噪扩散语言模型(BD3-LMs)结合自回归模型和扩散模型的优势,解决了现有扩散模型生成长度受限、推理效率低和生成质量低的问题。通过块状扩散实现任意长
阅读全文新智元报道 编辑:英智【新智元导读】本文介绍了当前最受科研人员青睐的AI模型,推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude 3.5 Sonn
阅读全文新智元报道 编辑:桃子 好困【新智元导读】氛围编程彻底火了。刚刚,没有任何Swift编程经验的Karpathy亲自代言,通过与ChatGPT多轮对话,仅用400行代码构建出自己的首个iOS应用。
阅读全文新智元报道 编辑:犀牛【新智元导读】随着AI智能体的爆发,Browser Use异军突起,刚刚融资1700万美元。它能让AI智能体轻松地「读懂」网站并自动完成复杂任务,引领了一波AI应用热潮。A
阅读全文新智元报道 编辑:LRST【新智元导读】视觉+语音=更强的语音识别!BPO-AVASR通过优化音视频输入和输出偏好,提升语音识别在真实场景中的准确性,解决了传统方法在噪声、口语化和视觉信息利用不
阅读全文新智元报道 编辑:JNY【新智元导读】最新一期TED采访中,奥特曼重申对OpenAI率先发布AGI的信念,并称没有多少人会关心。全程45分钟,他还重点分享了自己对AI未来的独特看法。奥特曼再谈A
阅读全文新智元报道 编辑:KingHZ【新智元导读】Epoch AI高级研究员预测:2030年实现人类水平的AI的可能性至少10%。他认为AI从监督学习到GenAI,模型范式转变迅捷,预测AI只能从第一
阅读全文新智元报道 编辑:KingHZ【新智元导读】Diffusion模型,学会了自我纠正!无需强化学习等后训练,扩散在语言建模中实现了自我纠错,达到了计算效率匹配的最优性能,找到了证据下界(ELBO)
阅读全文新智元报道 编辑:编辑部 HNZ【新智元导读】最近,国内这家公司让扫地机器人「长」出手臂,直接化身新物种!甚至,它还装上了具身大模型「大脑」,开始尝试理解真实的物理世界。这一次,扫地机器人行业被
阅读全文新智元报道 编辑:LRST【新智元导读】澳大利亚国立大学团队提出了ARINAR模型,与何凯明团队此前提出的分形生成模型类似,采用双层自回归结构逐特征生成图像,显著提升了生成质量和速度,性能超越了
阅读全文新智元报道 编辑:定慧【新智元导读】Nvidia刚刚发布了「世界生成」模型Cosmos-Transfer1,可以根据多种模态的空间控制输入(如分割、深度和边缘)生成世界模拟,使得世界生成具有高度
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】微软腾讯王炸组合正式官宣了!1000+精选安卓应用涌入Windows生态,让你的电脑秒变「大屏手机」,彻底打破PC与移动世界的次元壁。你,是否曾这
阅读全文新智元报道 编辑:JNZ【新智元导读】就在今天凌晨,OpenAI的全新音频模型上线了!语音智能体的时代正式开启了!现在可以利用新的语音模型,指导GPT-4o的说话语气:想温柔就温柔,让疯狂就疯狂
阅读全文新智元报道 编辑:KingHZ【新智元导读】有25万块GPU的CoreWeave,已提交上市文件,计划IPO。虽然有英伟达等支持,但CoreWeave估值350亿美元,并不被媒体看好。而科技媒体
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】前脚被谷歌点名感谢空间训练平台,后脚又开源了空间模型!杭州六小龙群核科技发了一个空间理解开源模型SpatialLM,让机器人刷一段视频,就能理解物理
阅读全文新智元报道 编辑:编辑部 HNX【新智元导读】波士顿动力的Atlas机器人又双叒叕来了!从最初的液压「电缆尾巴」到现在全电动AI增强版,这个机器人不仅会翻跟头、跳街舞,还学会了倒立侧翻,甚至开始
阅读全文新智元报道 编辑:LRST【新智元导读】EgoNormia基准可以评估视觉语言模型在物理社会规范理解方面能力,从结果上看,当前最先进的模型在规范推理方面仍远不如人类,主要问题在于规范合理性和优先
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】万众瞩目的Blackwell Ultra终于登场亮相,专为DeepSeek R1这样的推理模型打造,性能直达Hoper的40倍!而下一代GPU「R
阅读全文新智元报道 编辑:KingHZ 定慧【新智元导读】在美国,媒体调查称近40%中学生、近50%大学生用AI作弊拿高分。ChatGPT已成为美国学生的「作弊黑科技」,从作业到论文,无所不包,而且难以
阅读全文新智元报道 编辑:LRST【新智元导读】通过收集六名志愿者一周的多模态生活数据,研究人员构建了300小时的第一视角数据集EgoLife,旨在开发一款基于智能眼镜的AI生活助手。项目提出了EgoB
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】全球首个开源多模态推理大模型来了!38B参数模型性能直逼DeepSeek-R1,同尺寸上横扫多项SOTA。而这家中国公司之所以选择无偿将技术思路开源
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】AI如何赋能千行百业?最近,中绿讯科中国重磅发布了生态级通用平台——AI生态平台。这一平台以自研「泰山大模型群」为基座,集成了多个技术组件,为企业
阅读全文