全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    AI绘画的未来已来!不用折腾工作流,轻松生成连续剧

    作者:王抖抖发布日期:2025-06-07 20:17:11

    最近黑森林工作室推出了FLUX.1 Kontext,这是一款可以支持上下文的新工具,主要优点:一致性:在多个场景和环境中保留图像的元素本地编辑:对图像中特定元素针对性修改,不影响其余元素样式参考:保留

    阅读全文
  • 文章封面

    新版DeepSeek-R1-0528本地部署!改善幻觉、优化写作,8b小模型门槛低

    作者:王抖抖发布日期:2025-05-30 15:38:10

    阅读全文
  • 文章封面

    比威尔史密斯吃意面更难!谷歌Veo3挑战体操动作

    作者:王抖抖发布日期:2025-05-24 12:29:30

    AI视频已经攻克了“威尔史密斯吃意面”,下一座高山是“体操动作”,因为涉及到复杂的物理规则和人体解剖。 那么,目前最强的视频工具谷歌Veo3能否完成任务? 答案是:依旧不能!但在目前的工具当中是表

    阅读全文
  • 文章封面

    Google Veo 3太强了,把AI视频生成推上了新台阶!

    作者:王抖抖发布日期:2025-05-21 21:23:01

    谷歌发布了AI视频模型工具Veo 3,生成视频的同时可同步嵌入音效,且视频表现也比本已很强的Veo 2更进一步! 目前Veo 3暂未对公众开放,但可通过订阅Goolge AI会员获取访问权限。

    阅读全文
  • 文章封面

    想被甜妹夸,被雌小鬼骂,现在AI都能满足你!

    作者:王抖抖发布日期:2025-05-18 11:23:12

    语音模型经过一段时间的发展,现在效果相当成熟,国产AI同样表现亮眼。MiniMax日前发布的语音大模型Speech-02在国际权威的两项语音评测榜单上,超过OpenAI和ElevenLabs登顶,而且

    阅读全文
  • 文章封面

    即梦生图尺度这么大了?

    作者:王抖抖发布日期:2025-05-16 19:24:01

    阅读全文
  • 文章封面

    GPT-4o生图15个特别提示词,包含多种爆火效果!

    作者:王抖抖发布日期:2025-05-13 10:22:56

    之前GPT-4o生成吉卜力画风,着实火了一阵。其实GPT-4o的生图能力远不止于此,今天就来介绍一些特别的提示词,其中有的效果估计你已经见过(却不知怎么生成)!注:所有参考提示词中括号【 】里面

    阅读全文
  • 文章封面

    超越DeepSeek,最强开源模型"千问3"四种本地部署方法

    作者:王抖抖发布日期:2025-04-30 11:10:23

    阿里开源了当前最强的千问3(Qwen3)模型,包含从0.6B到235B的非常全面的规格,总有一款适合你。官方宣称其亮点在于:1、显著增强的推理能力,在数学、代码生成和常识逻辑推理方面超越之前的模型;2

    阅读全文
  • 文章封面

    媲美Flux!国产开源生图模型HiDream本地部署

    作者:王抖抖发布日期:2025-04-26 10:30:51

    HiDream-I1是HiDream-ai(HiDream-ai)开源的文生图模型,17B参数,在多个基准测试中表现出色,许多网友实测认为:不逊于Flux。目前HiDream已获得ComfyUI官方原

    阅读全文
  • 文章封面

    可灵2.0版详细测试:动态出色,价格昂贵!

    作者:王抖抖发布日期:2025-04-16 11:24:50

    可灵刚刚推出了2.0版重大更新,作为目前主流视频生成工具,可灵这次更新颇受关注。下面就和1.6版进行详细对比测试(每个案例生成四次,选取表现最好的一次):一、文生视频1、提示词:一只白色的猫从街边的矮

    阅读全文
  • 文章封面

    开源数字人HeyGem部署教程,口播、带货、动画样样行

    作者:王抖抖发布日期:2025-04-09 20:02:06

    市面上效果优秀的数字人产品,通常价格昂贵(比如HeyGen),不过近期硅基智能开源了一款工具HeyGem,可作为平替。看下效果,让老黄念一段“英伟达耍猴”的新闻消息:接下来就讲讲本地部署方法(Wind

    阅读全文
  • 文章封面

    Midjourney V7刚刚上线!新增草稿模式,支持连续对话

    作者:王抖抖发布日期:2025-04-04 16:33:41

    阅读全文
  • 文章封面

    《星际穿越》吉卜力画风重绘

    作者:王抖抖发布日期:2025-03-29 13:26:48

    最近很火的GPT4o转绘,让每个人都有了当“艺术家”的机会。比如简单制作一个吉卜力画风的《星际穿越》预告片! 图像转绘:GPT4o 图生视频:可灵Kling 其实GPT的新绘图功能远不止这一种,理

    阅读全文
  • 文章封面

    ChatGPT推出"用嘴P图",平面设计真要失业了

    作者:王抖抖发布日期:2025-03-27 11:52:31

    AI领域竞争加剧,或许是受到此前Gemini 2.0 Flash的刺激(点击看文章),OpenAI一改墨迹的作风,直接推出GPT4o的图像生成模式。新功能对Plus、Pro、Team、免费用户全量开放

    阅读全文
  • 文章封面

    Wan2.1+LoRA 解锁各种特效:挤压、膨胀、切蛋糕、变身...

    作者:王抖抖发布日期:2025-03-26 13:17:21

    相信很多人都玩过一些闭源视频工具(如可灵、Pika)的特效功能,膨胀、挤压、变身...通过阿里开源的万相Wan2.1加上合适的LoRA,这些不难实现,比如把这个宇树机器人挤扁:下面就讲讲具体操作过程。

    阅读全文
  • 文章封面

    一张图直接生成分镜,Gemini树立了业界新标杆

    作者:王抖抖发布日期:2025-03-17 22:06:55

    最近谷歌发布了Gemini 2.0 Flash的图像生成模型,可以通过自然语言与AI沟通,达成各种生图功能。一、使用方法目前可以通过谷歌Ai Studio登录,免费使用(需要畅通的网络):登录之后在模

    阅读全文
  • 文章封面

    阿里又整了一波大的:视频生成一体化模型VACE!

    作者:王抖抖发布日期:2025-03-11 22:29:59

    根据官方发布,功能非常丰富,包括:根据参考物体的路径和动作生成视频、对视频内容进行替换、多图参考生成视频。 此外还有视频重新渲染,包括:保留结构、保留动作、保留场景、保留主体、视频扩展...丰富程度

    阅读全文
  • 文章封面

    阿里还是太低调:32B模型打平DeepSeek-R1满血版,竟没上热搜?

    作者:王抖抖发布日期:2025-03-06 16:07:56

    今天很多人在炒一款“通用智能体”Manus,不过我觉得阿里刚开源的QwQ-32B新推理模型,更值得上热搜。作为一款中型推理模型,QwQ-32B仅有320亿参数,却可以达到DeepSeek-R1满血版(

    阅读全文
  • 文章封面

    GPT-4.5可以用了,无推理速度快,高情商,价格贵

    作者:王抖抖发布日期:2025-02-28 09:56:03

    阅读全文
  • 文章封面

    最强开源视频模型?阿里"万相2.1"本地部署教程

    作者:王抖抖发布日期:2025-02-27 21:01:10

    继腾讯混元之后,阿里也宣布开源旗下视频生成模型:万相2.1(Wan2.1),称其具有SOTA级别的性能,其亮点包括:1、优于现有开源模型,甚至可以“与一些闭源模型相媲美”。2、是第一个能够同时生成中英

    阅读全文
  • 文章封面

    让DeepSeek威力加倍!教你本地搭建知识库

    作者:王抖抖发布日期:2025-02-26 12:39:06

    对于本地部署的DeepSeek,怎样让它的答案更高效?此时就要用到知识库。本文使用的方案是Ollama+Docker+Dify。注意:首先请确保你已经安装了Git和Python,并保持“网络畅通”。一

    阅读全文
  • 文章封面

    Grok3语音自带成人模式,还是老马会玩

    作者:王抖抖发布日期:2025-02-24 12:48:46

    阅读全文
  • 文章封面

    实测马斯克Grok 3:能力不输DeepSeek,会画图,尺度大!

    作者:王抖抖发布日期:2025-02-19 11:34:16

    马斯克发布了号称“地球上最聪明人工智能”的Grok 3,目前X会员已经可以使用。下面就看看实际表现:网页端从X的边栏就能找到入口:主界面是这样,目前仍属Beta版:一、基础对话和深度搜索首先来测两道“

    阅读全文
上一页