文章预览
01 🌟 KEEP:修复视频中的人脸 - 低清视频中的人脸修复成高清 🔗 https://jnjaby.github.io/projects/KEEP/ 02 🌟 图片增强空间合集 - 收集了HuggingFace上可运行的图片增强空间,包括提升分辨率和修复老照片 🔗 https://huggingface.co/collections/ysharma/enhance-your-images-66c6f47c365d51bd77911aed 03 🌟 LongVILA:针对长上下文的视觉-语言模型的全栈解决方案 - VILA的升级版,能理解长视频,跟Gemini肯定还是比不了,但是在开源里面算非常好的了,274K上下文的准确率达到了99.5% 🔗 https://github.com/NVlabs/VILA 04 🌟 综述:LLM如何生成可控文字 - 如何控制LLM生成符合条件的文字,条件包括:安全性、情感、主题一致性、语言风格 - 主要方法:模型重训练、微调、强化学习、提示工程、潜在空间操作、解码时干预 🔗 https://arxiv.org/abs/2408.12599 05 🌟 Hyper-SD版FLUX Dev - 仅需8步或16步即可
………………………………