全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    Nano Banana正式公布,果然是谷歌大杀器!AI实验室和Gemini可用!

    作者:王抖抖发布日期:2025-08-26 23:31:58

    阅读全文
  • 文章封面

    生成逼真"黑神话钟馗"手办,神秘且强大的"纳米香蕉"三种使用方式

    作者:王抖抖发布日期:2025-08-25 17:27:54

    本账号文章即日起均搭配AI语音播客,点击收听一、神秘的纳米香蕉AI图像生成领域最近发生趣事:一款名为Nano Banana(纳米香蕉)的工具突然出现在X平台、论坛、Discord,并获得用户广泛赞誉。

    阅读全文
  • 文章封面

    DeepSeek V3.1发布,现已可用!把V3与R1统一为更智能的模型

    作者:王抖抖发布日期:2025-08-21 17:08:44

    阅读全文
  • 文章封面

    用Gemini一句话生成有声绘本,秒变绘本大师

    作者:王抖抖发布日期:2025-08-14 20:15:11

    本账号文章即日起均搭配AI语音播客,点击收听AI时代,许多创作降低到零门槛,比如绘本生成,利用谷歌的Gemini可以轻松做到。你可以直接进入Gemini的Storybook页面:https://gem

    阅读全文
  • 文章封面

    都说GPT-5拉跨,但它能打败“弱智吧”段子!

    作者:王抖抖发布日期:2025-08-09 11:27:45

    本账号文章即日起均搭配AI语音播客,点击收听GPT-5刚发布一天,网友们已经对它进行了大量测试,评价“褒贬不一”,负面主要集中在:1、模型自动切换,熟悉的GPT-4o、o3都没了。2、一些简单问题竟然

    阅读全文
  • 文章封面

    GPT5“新王降临”?OpenAI发布会内容速读

    作者:王抖抖发布日期:2025-08-08 08:43:51

    本账号文章即日起均搭配AI语音播客,点击收听北京时间8月8日凌晨,OpenAI发布三款新模型:GPT-5、GPT-5 mini 和 GPT-5 nano,这些模型在多个方面都有显著提升。发布会上关于新

    阅读全文
  • 文章封面

    中文生成能力不输即梦!阿里开源Qwen-Image本地部署教程及测试

    作者:王抖抖发布日期:2025-08-07 21:35:34

    本账号文章即日起均搭配AI语音播客,点击收听阿里开源又出硬货:刚发布的Qwen-Image,官方宣称“在复杂文本渲染和精确图像编辑方面取得显著进展”,并且取得ComfyUI的原生支持。一、能力测试首先

    阅读全文
  • 文章封面

    OpenAI终于Open了,发布两款强力开源模型!5分钟快速本地部署

    作者:王抖抖发布日期:2025-08-06 23:38:04

    阅读全文
  • 文章封面

    "用嘴P视频"功能上线,这世界还有真实可言吗?

    作者:王抖抖发布日期:2025-07-31 21:46:14

    本账号文章即日起均搭配AI语音播客,点击收听Runway Gen一度是AI视频生成的领头羊,不过最近一年被各种赶超。本以为它要被市场淘汰,没想到这次憋出个大的:名为Runway Aleph的“上下文视

    阅读全文
  • 文章封面

    AI视频进化到这种地步了?教你用可灵+海螺生成动作大片!

    作者:王抖抖发布日期:2025-07-30 19:16:31

    本账号文章即日起均搭配AI语音播客,点击收听AI视频发展迅速,前几个月许多作品还像“动态PPT”的拼接,现在已经可以初步呈现各种激烈的动作场面(虽然仍不完美),比如这段《龙珠》的真人风格影片:怎么制作

    阅读全文
  • 文章封面

    “世界最强模型”Grok 4实测:差强人意

    作者:王抖抖发布日期:2025-07-11 23:10:06

    马斯克的旗下xAI发布了Grok 4,号称“世界最强模型”,到底强不强,还是不能看广告,而要看疗效。在模型切换到Grok 4之后,最大的区别就是原来Grok 3下方的“深度搜索”不见了,因为Grok

    阅读全文
  • 文章封面

    用谷歌Veo3制作“动物扇耳光大赛”,大熊猫被迫营业!

    作者:王抖抖发布日期:2025-07-10 16:46:24

    之前介绍过,谷歌Veo3的文生视频功能非常强劲,今天分享一个有趣的提示词,可以创造现实中不可能存在的“扇耳光大赛”场景(使用Google Flow工具)。例如:A professional slap

    阅读全文
  • 文章封面

    Midjourney可以生成视频了,并非最好,但性价比极高!

    作者:王抖抖发布日期:2025-06-19 23:09:51

    沉寂了很长时间之后,Midjourney终于顺应时代,推出了视频模型“V1”版。V1专注于图生视频(没有文生视频功能),目前仅在Midjourney官方网站可用(需要会员)。网址:https://ww

    阅读全文
  • 文章封面

    全网爆火的“时空穿越”视频,制作方法+进阶技巧

    作者:王抖抖发布日期:2025-06-17 22:34:04

    最近大家肯定经常看到这样的视频:看着高大上,其实生成方法极其简单,即通过最新的谷歌Veo3工具,输入类似下面的提示词:提示词:身着现代雨衣的中国女记者,与全副武装的中国三国时期蜀国士兵,在泥泞的山路上

    阅读全文
  • 文章封面

    即梦AI视频3.0 Pro亮相,真能“拳打可灵、脚踢Veo3”?

    作者:王抖抖发布日期:2025-06-12 22:12:52

    不少网友发现,即梦已经推出视频3.0 Pro(基于Seedance 1.0 Pro视频模型),这是字节最新最强的视频模型。那么它能否和可灵/Veo3一拼呢?立刻来实测:一、文生视频1、提示词:一只白色

    阅读全文
  • 文章封面

    AI绘画的未来已来!不用折腾工作流,轻松生成连续剧

    作者:王抖抖发布日期:2025-06-07 20:17:11

    最近黑森林工作室推出了FLUX.1 Kontext,这是一款可以支持上下文的新工具,主要优点:一致性:在多个场景和环境中保留图像的元素本地编辑:对图像中特定元素针对性修改,不影响其余元素样式参考:保留

    阅读全文
  • 文章封面

    新版DeepSeek-R1-0528本地部署!改善幻觉、优化写作,8b小模型门槛低

    作者:王抖抖发布日期:2025-05-30 15:38:10

    阅读全文
  • 文章封面

    比威尔史密斯吃意面更难!谷歌Veo3挑战体操动作

    作者:王抖抖发布日期:2025-05-24 12:29:30

    AI视频已经攻克了“威尔史密斯吃意面”,下一座高山是“体操动作”,因为涉及到复杂的物理规则和人体解剖。 那么,目前最强的视频工具谷歌Veo3能否完成任务? 答案是:依旧不能!但在目前的工具当中是表

    阅读全文
  • 文章封面

    Google Veo 3太强了,把AI视频生成推上了新台阶!

    作者:王抖抖发布日期:2025-05-21 21:23:01

    谷歌发布了AI视频模型工具Veo 3,生成视频的同时可同步嵌入音效,且视频表现也比本已很强的Veo 2更进一步! 目前Veo 3暂未对公众开放,但可通过订阅Goolge AI会员获取访问权限。

    阅读全文
  • 文章封面

    想被甜妹夸,被雌小鬼骂,现在AI都能满足你!

    作者:王抖抖发布日期:2025-05-18 11:23:12

    语音模型经过一段时间的发展,现在效果相当成熟,国产AI同样表现亮眼。MiniMax日前发布的语音大模型Speech-02在国际权威的两项语音评测榜单上,超过OpenAI和ElevenLabs登顶,而且

    阅读全文
  • 文章封面

    即梦生图尺度这么大了?

    作者:王抖抖发布日期:2025-05-16 19:24:01

    阅读全文
  • 文章封面

    GPT-4o生图15个特别提示词,包含多种爆火效果!

    作者:王抖抖发布日期:2025-05-13 10:22:56

    之前GPT-4o生成吉卜力画风,着实火了一阵。其实GPT-4o的生图能力远不止于此,今天就来介绍一些特别的提示词,其中有的效果估计你已经见过(却不知怎么生成)!注:所有参考提示词中括号【 】里面

    阅读全文
  • 文章封面

    超越DeepSeek,最强开源模型"千问3"四种本地部署方法

    作者:王抖抖发布日期:2025-04-30 11:10:23

    阿里开源了当前最强的千问3(Qwen3)模型,包含从0.6B到235B的非常全面的规格,总有一款适合你。官方宣称其亮点在于:1、显著增强的推理能力,在数学、代码生成和常识逻辑推理方面超越之前的模型;2

    阅读全文
  • 文章封面

    媲美Flux!国产开源生图模型HiDream本地部署

    作者:王抖抖发布日期:2025-04-26 10:30:51

    HiDream-I1是HiDream-ai(HiDream-ai)开源的文生图模型,17B参数,在多个基准测试中表现出色,许多网友实测认为:不逊于Flux。目前HiDream已获得ComfyUI官方原

    阅读全文
  • 文章封面

    可灵2.0版详细测试:动态出色,价格昂贵!

    作者:王抖抖发布日期:2025-04-16 11:24:50

    可灵刚刚推出了2.0版重大更新,作为目前主流视频生成工具,可灵这次更新颇受关注。下面就和1.6版进行详细对比测试(每个案例生成四次,选取表现最好的一次):一、文生视频1、提示词:一只白色的猫从街边的矮

    阅读全文
  • 文章封面

    开源数字人HeyGem部署教程,口播、带货、动画样样行

    作者:王抖抖发布日期:2025-04-09 20:02:06

    市面上效果优秀的数字人产品,通常价格昂贵(比如HeyGen),不过近期硅基智能开源了一款工具HeyGem,可作为平替。看下效果,让老黄念一段“英伟达耍猴”的新闻消息:接下来就讲讲本地部署方法(Wind

    阅读全文
  • 文章封面

    Midjourney V7刚刚上线!新增草稿模式,支持连续对话

    作者:王抖抖发布日期:2025-04-04 16:33:41

    阅读全文
  • 文章封面

    《星际穿越》吉卜力画风重绘

    作者:王抖抖发布日期:2025-03-29 13:26:48

    最近很火的GPT4o转绘,让每个人都有了当“艺术家”的机会。比如简单制作一个吉卜力画风的《星际穿越》预告片! 图像转绘:GPT4o 图生视频:可灵Kling 其实GPT的新绘图功能远不止这一种,理

    阅读全文
  • 文章封面

    ChatGPT推出"用嘴P图",平面设计真要失业了

    作者:王抖抖发布日期:2025-03-27 11:52:31

    AI领域竞争加剧,或许是受到此前Gemini 2.0 Flash的刺激(点击看文章),OpenAI一改墨迹的作风,直接推出GPT4o的图像生成模式。新功能对Plus、Pro、Team、免费用户全量开放

    阅读全文
  • 文章封面

    Wan2.1+LoRA 解锁各种特效:挤压、膨胀、切蛋糕、变身...

    作者:王抖抖发布日期:2025-03-26 13:17:21

    相信很多人都玩过一些闭源视频工具(如可灵、Pika)的特效功能,膨胀、挤压、变身...通过阿里开源的万相Wan2.1加上合适的LoRA,这些不难实现,比如把这个宇树机器人挤扁:下面就讲讲具体操作过程。

    阅读全文
下一页