|
视频生成的测试时Scaling时刻!清华开源Video-T1,无需重新训练让性能飙升 机器之心 · 公众号 · AI · 6 天前 · 访问文章快照 |
|
刚刚,GPT-4o原生图像生成上线,P图、生图也就一嘴的事 机器之心 · 公众号 · AI · 6 天前 · 访问文章快照 |
|
挖掘DiT的位置解耦特性,Personalize Anything免训练实现个性化图像生成 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
一文读懂MCP与AI工具生态的未来,它会是AI智能体的「万能插头」吗? 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
棋盘变战场,大模型却呆了?普林斯顿、UT Austin新基准SPIN-Bench曝AI智商瓶颈 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
统一细粒度感知!北大&阿里提出UFO:无需SAM,16个token让MLLM实现精准分割 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗? 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |
|
「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞 机器之心 · 公众号 · AI · 1 周前 · 访问文章快照 |