8月23日 AI 头条｜英伟达发布 80 亿参数新 AI 模型，可在 RTX 工作站上部署

硅星GenAI · 公众号 · · 2024-08-23 18:29

主要观点总结

本文介绍了近期英伟达发布的新AI模型，以及其他与人工智能相关的新闻和论文。英伟达发布了一个80亿参数的新AI模型，可在RTX工作站上部署。此外，百度文心大模型的日调用量和日均Tokens使用量均居国内最高。前Character.AI联合创始人将担任谷歌Gemini联合技术负责人。Perplexity AI计划第四季度开始投放广告。McAfee推出了全球首款人工智能自动深度伪造检测器。快手可灵AI会员订阅计划价格调整。AI初创公司Opkey获得了4700万美元融资。今日重点论文包括Waymo的《Transfusion》，解决多模态模型处理问题；俄罗斯高等经济大学的《Extreme Compression of Large Language Models via Additive Quantization》，研究大语言模型极端压缩问题；Cohere的论文探究预训练数据加入代码数据的影响；以及Meta的《Actions Speak Louder than Words: Trillion-Parameter Sequential Transducers for Generative Recommendations》，解决大规模推荐系统中深度学习推荐模型无法随计算能力扩展的问题。

关键观点总结

关键观点1: 英伟达发布新AI模型

英伟达发布了一个具备高精度和高计算效率的80亿参数新AI模型，可在GPU加速的数据中心、云和工作站上运行。

关键观点2: 百度文心大模型的高调用量和使用量

百度文心大模型日调用量超6亿次，日均处理Tokens文本约1万亿，均为国内最高，半年增长超10倍。

关键观点3: 前Character.AI联合创始人将担任谷歌新职位

前Character.AI联合创始人Noam Shazeer将担任谷歌Gemini联合技术负责人，共同开发Gemini，旨在保持与ChatGPT的竞争性。

关键观点4: Perplexity AI投放广告的计划

人工智能搜索初创公司Perplexity AI计划第四季度在其搜索应用程序上投放广告，主要广告类别包括科技、健康和制药等。

关键观点5: McAfee推出新的检测器

安全软件公司McAfee推出了全球首款人工智能自动深度伪造检测器McAfee Deepfake Detector，可以在部分型号电脑上使用。

关键观点6: 快手可灵AI会员订阅计划调整

快手可灵AI宣布会员订阅计划价格调整，提供多种会员档次和功能，包括视频和图片生成等。

关键观点7: AI初创公司Opkey获得融资

Opkey获得4700万美元的B轮融资，利用AI技术提供测试服务，建立了一个人工智能平台，帮助企业持续测试财务、人力资源等软件。

关键观点8: 今日重点论文概述

介绍了多篇与人工智能相关的论文，包括解决多模态模型处理问题、研究大语言模型极端压缩问题、探究预训练数据加入代码数据的影响以及解决大规模推荐系统中深度学习推荐模型无法随计算能力扩展的问题等。

文章预览

划重点: 英伟达发布 80 亿参数新 AI 模型，可在 RTX 工作站上部署李彦宏：文心大模型日调用量超6亿，日均Tokens使用量约1万亿前 Character.AI 联合创始人确认将担任谷歌 Gemini 联合技术负责人 Perplexity AI计划在四季度开始投放广告 McAfee 宣布推出全球首款人工智能自动深度伪造检测器快手可灵 AI 会员订阅计划价格调整，首月 19 元起 AI 初创公司 Opkey 获 4700 万美元融资资讯详情：英伟达发布 80 亿参数新 AI 模型，可在 RTX 工作站上部署据英伟达官方消息，英伟达近日发布 Mistral-NeMo-Minitron 8B 小语言 AI 模型，具备精度高、计算效率高等优点，可在 GPU 加速的数据中心、云和工作站上运行模型。英伟达表示通过宽度剪枝（width-pruning）Mistral NeMo 12B，并知识蒸馏（knowledge distillation）轻度重新训练后获得 Mistral-NeMo-Minitron 8B，相关成果发表在《Compact Language Models ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博