
会员
多模态大模型:算法、应用与微调
更新时间:2024-09-11 17:38:30 最新章节:封底
书籍简介
本书详尽地覆盖了多模态大模型的算法原理和应用实战,提供了丰富的微调技术细节和实际案例,适合对多模态大模型有兴趣的技术人员深入学习及应用。本书分为两篇:算法原理篇:详细介绍了先进的深度学习模型,包括Transformer、GPT系列、深度生成模型,从基本架构、训练方法到特定应用,包括但不限于Seq2Seq结构、位置编码、注意力机制、残差连接、变分自编码器、GAN、ViT、CLIP、StableDiffusion、各模型训练实践的知识点。此外,探讨了预训练模型的涌现能力、模型参数和通信数据量的估算,以及分布式训练的各种技术,如数据并行、模型并行和混合精度训练等。应用实战篇:聚焦于深度学习模型的实际应用,特别是文本和图像生成,以及代码生成的应用实战。通过具体实战项目,如利用StableDiffusion进行图像生成和CodeLlama进行代码生成,提供了微调技术的详细细节,介绍了LangChain等大模型应用框架。
品牌:机械工业出版社
上架时间:2024-06-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
刘兆峰
同类热门书
最新上架
- 会员本书从写作与ChatGPT的基础知识讲起,结合创作者的实际写作经历与写作教学经历,介绍了用ChatGPT写作的基础技巧、进阶写作的方法、不同文体的写作方法、写作变现的秘诀,让读者理解写作技巧与变现思路。计算机14.7万字
- 会员近年来,在自然语言处理领域,基于预训练语言模型的方法已形成全新范式。本书内容分为基础知识、预训练语言模型,以及实践与应用3个部分,共9章。第一部分全面、系统地介绍自然语言处理、神经网络和预训练语言模型的相关知识。第二部分介绍几种具有代表性的预训练语言模型的原理和机制(涉及注意力机制和Transformer模型),包括BERT及其变种,以及近年来发展迅猛的GPT和提示工程。第三部分介绍了基于Lang计算机12.7万字
- 会员本书聚焦如何高效运用DeepSeek这一前沿AI工具,帮助读者在技术浪潮中把握机遇。全书从DeepSeek发展历程切入,系统解析DeepSeek在信息处理、创意生成与决策辅助中的核心能力,并结合生活管理、职场协作、学习优化、社交互动等场景,通过真实案例讲解其应用方法。同时,针对内容创作、自媒体运营、副业变现等需求,书中提供了可落地的策略与案例,助力读者实现效率提升与价值创造。书中不仅提供技术使用技计算机5.5万字
- 会员随着ChatGPT等人工智能和语言模型不断进步,了解这些技术的含义和潜在陷阱比以往任何时候都更加重要。作为享誉全球的跨技术和设计学科思想家,前田约翰利用他的丰富经验,为企业、产品设计师和决策者提供了可行的指导。通过深思熟虑和偶尔异想天开的例子,他构造了一个可以描述任何机器学习系统的关键功能的框架,并展望了可以如何使用它们来创造富有包容性和改变世界的产品。对任何想要深入了解机器如何“思考”以及未来可计算机9.6万字
- 会员本书配套周志华教授所著的《机器学习》教材,通过大量习题考查读者对机器学习相关知识点的理解与掌握。全书分为两个部分:第一部分习题对应《机器学习》第1~10章的内容,包括绪论、模型评估与选择、线性模型、决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习;第二部分包含6章应用专题,通过综合题的形式对知识点进行多角度考查,包括线性模型的优化与复用、面向类别不平衡数据的分类、神经网络计算机19.3万字
- 会员本书共有10章,包括51个实操案例解析和80个行业案例分析。书中内容从技能线和案例线展开介绍。技能线:从人工智能的相关技术入手,不仅介绍了AI训练师的发展历程和行业动态,还重点讲述了AI训练师的职业技能提升方法。案例线:不仅涵盖了AI领域的各个方面,而且非常注重算法与模型的实际应用,通过分析大量的经典案例,可以让读者更好地掌握AI训练的相关技能。计算机11.6万字
- 会员本书立足于AIGC技术前沿与发展趋势,全面阐述了AIGC的概念内涵、底层技术与应用场景,详细梳理全球科技巨头在AIGC领域的战略布局,并辅之以大量生动有趣的案例,深度剖析AIGC在各行业领域的应用场景,旨在引导读者真切感受AIGC革命浪潮蕴含的商业创造力。全书分为五个部分,共18章。第一部分主要厘清AIGC技术的起源与演变,阐述席卷全球的AIGC背后的技术架构以及AIGC的应用场景;第二部分重点剖计算机11.4万字