今天看啥  ›  专栏  ›  DataFunTalk

电子书上新 |《Data for AI 实践之路:从数据治理到智能应用》

DataFunTalk  · 公众号  · 互联网安全 科技自媒体  · 2024-11-08 13:00

主要观点总结

本文介绍了多个技术领域的文章,包括数据平台、数据集成、语言模型、多模态算法、实时语音交互、大数据治理以及大数据集群管理平台等。读者可以通过关注公众号获取电子书领取方式。

关键观点总结

关键观点1: 腾讯欧拉平台数据血缘架构及应用介绍

腾讯欧拉平台是一站式数据平台,包含资产工厂、治理引擎和数据发现等子产品。通过数据血缘子模块实现从数据生产到应用的全链路覆盖,支持任务、表、字段级别的血缘关系,并应用于数据治理和成本洞察等场景。

关键观点2: 字节跳动BitSail开源数据集成引擎的架构演进和实践

BitSail支持多种数据源间的离线和实时数据同步,服务于字节跳动内部业务。文章探讨了BitSail的CDC解决方案和新功能以及未来发展方向。

关键观点3: 语言模型在广告推荐业务中的应用探索

文章从BERT到LLM的语言模型在广告推荐业务中的应用进行了探索,包括广告业务需求、模型适用场景以及实际应用案例和未来展望。

关键观点4: 多模态算法在京东内容算法的应用实践

多模态算法在京东电商内容应用中用于提升内容分发效率和用户体验。文章涉及京东的内容理解能力以及多模态技术在视频分发业务的具体应用。

关键观点5: 网易伏羲AI Agent的创新应用

介绍了网易伏羲在手游《永劫无间》中推出的多模态实时交互的语音AI队友,能自主跑图、战斗等,提升游戏体验。

关键观点6: 阿里云DataWorks在湖仓融合数据治理与大模型应用方面的探索

DataWorks支持数据入湖、湖仓融合统一数据开发和治理,并通过大模型技术提升数据开发效率。文章还提到了智能SQL编程助手和AI增强分析功能。

关键观点7: 蚂蚁集团的大数据治理架构与实践分享

分享了蚂蚁集团在大数据治理方面的经验和实践,包括数据治理概况、数据质量治理和数据计存治理,并对未来趋势进行了思考。

关键观点8: B站大数据集群管理平台BMR的实践与创新

介绍了B站大数据集群管理平台BMR的实践与创新,包括集群管理、元仓建设等模块,提升了业务场景需求承接能力和运维效率。


文章预览

领取方式如下: 点击下方标签,关注 DataFunSummit公众号 关注上方公众号,私信回复 『DataforAI』 获取领取方式 资料目录及介绍: 腾讯欧拉平台数据血缘架构及应用 腾讯欧拉平台是一款基于DataOps理念的一站式数据平台,包含资产工厂、治理引擎和数据发现三个子产品。平台通过数据血缘子模块,实现从数据生产到应用的全链路覆盖,支持任务、表、字段级别的血缘关系,并应用于数据治理、成本洞察等多个场景。 字节跳动数据集成引擎 BitSail 开源架构演进和实践 介绍了字节跳动开源的数据集成引擎BitSail的架构演进和实践应用。BitSail支持多种数据源间的离线和实时数据同步,服务于字节跳动内部业务,并经过海量数据验证。文章还探讨了BitSail的新功能、CDC解决方案以及未来发展方向。 从 Bert 到 LLM:360 广告推荐业务中语言模型的应用探索 360广告 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览