专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
今天看啥  ›  专栏  ›  智东西

腾讯逆袭!发布混元T1正式版,实战不输DeepSeek-R1,便宜3/4

智东西  · 公众号  · 科技媒体  · 2025-03-22 00:57
    

文章预览

腾讯思考模型来了,摒弃纯Transformer架构。 作者 |   程茜 编辑 |   漠影 智东西3月22日报道,昨夜,腾讯正式将混元大模型系列的深度思考模型升级为混元-T1正式版。 T1是腾讯自研的强推理模型,吐字速度达到 60~80token/s ,在实际生成效果表现中远快于DeepSeek-R1。 该模型的前身是,今年2月中旬混元团队在腾讯元宝APP上线的基于混元中等规模底座的混元T1-Preview(Hunyuan-Thinker-1-Preview)推理模型。 相比于T1-Preview,T1正式版基于腾讯混元3月初发布的业界 首个超大规模Hybrid-Transformer-Mamba MoE大模型TurboS快思考基座 ,通过大规模后训练扩展了推理能力,并进一步对齐人类偏好,这也是 工业界首次将混合Mamba架构无损应用于超大型推理模型 。 T1在多个公开数据集的评测结果显示,在MMLU-pro、CEval、AIME、Zebra Loigc等 中英文知识和竞赛级数学、逻辑推理指标上基 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览