MiniMax-Text-01:超长上下文的多项效果与效率大模型
一直在找寻各种Rag的办法,包括reranker都搬上阵,准确性一直是反复折腾的重点和痛点,直到看到了这个大模型:从新型线性注意力到改进版混合专家架构,再到并行策略和通信技术的优化,MiniMax 解
阅读全文一直在找寻各种Rag的办法,包括reranker都搬上阵,准确性一直是反复折腾的重点和痛点,直到看到了这个大模型:从新型线性注意力到改进版混合专家架构,再到并行策略和通信技术的优化,MiniMax 解
阅读全文《对DogsVsCats例子的调优模型训练过程》(一)文章中,我们对DogsVsCats0.py进行了训练调优,猫狗的识别准确率从84.5%提升到了93.84%,提升幅度很大。但有一个问题,DogsV
阅读全文这是一个以【狗猫识别】为例子的调优训练过程,要利用《趋动云》平台(virtaicloud.com)上算力开发环境。趋动云(VirtAI Cloud)是一个面向企业、科研和个人AI开发者的开发和训练平台
阅读全文Ragflow对知识库导入内容的解析过程十分的漫长,曾多少次都在不断地反复和怀疑中渡过,没有一个教程对它的解析过程进行详细说明,让我十分地郁闷和不解,难道这都不是个问题了,还是只有我这个小白把它当成了
阅读全文这个问题,我相信很多人在使用Cherry Studio的过程中都遇到过,即当构建一个知识库时,会将大量的上传文件放置到C:\Users\administrator\AppData\Ro
阅读全文因为工作的需要,要求在内网中的wps中部署deepseek,跟互联网隔离,那就着手打造吧。原以为网上资料多,应该问题不难,但发现不是那么回事。按资料索骥“在wps中添加宏代码的”走下来,
阅读全文