主要观点总结
文章介绍了近期AI领域的大事件,包括FLUX生态的快速发展和多个新模型、Figure 02人形机器人的发布、Deep Live Cam实现的实时直播换脸技术,以及其他公司的动态如阿里发布的新模型、谷歌的Gemini降价等。文章还提到了多位创始人的动态和一些产品的更新情况。
关键观点总结
关键观点1: FLUX生态的快速发展和新模型发布
包括Controlnet模型、Lora模型的训练脚本的发布,以及新组织的InstantX训练的Canny模型。社区开始利用这些训练脚本训练Lora,全面的FLUX的Comfyui工作流也支持FLUX Lora、ControlNet的加载。
关键观点2: Figure 02人形机器人的发布
Figure 02被认为是世界上最先进的Al硬件,具有语音对话、AI驱动的视觉系统、高级手部功能、内置大语言模型等特性。
关键观点3: Deep Live Cam实现的实时直播换脸技术
只需一张图片即可实现实时直播换脸,但该技术存在风险,可能被用于欺诈或假冒。
关键观点4: 其他公司和产品动态
包括阿里发布的新模型Qwen2-Audio和Qwen2-Math系列,谷歌的Gemini 1.5 Flash降价,Mistral发布的La Plateforme和Agents平台等。
文章预览
8.05~8.11,又是刺激的一周。 这周的AI大事件,就都在这里啦。 1.FLUX的周边生态发展迅速 链接:https://x.com/javilop/status/1821814987737735344 前段时间由于SD3的问题,开源的图片生态发展一度停滞,值得关注的 新项目和模型几乎没有。 FLUX上周发布后这个态势被快速改变了,由于其优秀的图片质量,高昂的训练成本并没有阻止开源社区。 而且由于在其偏向真实的美学调教风格,也使生成的发布会写实图片在 推上的热度爆发使得FLUX模型快速出圈。再加上Runway把那张AI生成的照片变成视频让更多人对现在图像和视频模型的发展进度有了更多的了解。 目前Xlabs已经发布了基于FLUX的Controlnet模型和Lora模型的训练脚本。 https://github.com/XLabs-AI/x-flux 他们还顺便发布了一个FLUX的Canny Controlnet模型,另外这里还有 Instant ID作者的新组织InstantX训练的一个Canny模型也可以试试。
………………………………