- “云计算教父”Andy Jassy重磅发布自研模型Amazon Nova六大模型及两大前沿方向
- 计算、存储、数据和模型推理等基础构建单元持续创新
- 引领业界的强大生成式AI助手Amazon Q重大发布
- 最广泛和深入的分析服务重大发布
2024亚马逊云科技re:Invent全球大会第二天,亚马逊云科技CEO Matt Garman邀请“云计算教父”亚马逊CEO Andy Jassy同台,围绕亚马逊云科技在云计算核心领域(计算、存储、数据、模型推理)的重大创新,全新划时代生成式AI基础模型Amazon Nova的横空出世及生成式AI应用构建服务Amazon Bedrock重大发布,持续巩固亚马逊云科技在全球云计算领域的绝对实力和领导者地位,拉大技术代差。
“云计算教父”亚马逊CEO Andy Jassy发布高性价比Amazon Nova六大基础模型及两大前沿方向
新发布的Amazon Nova基础模型共包括四大模型:可用于简单任务的超高性价比文字处理Micro模型;三种多模态模型——低成本的Lite模型;兼具准确性、速度和成本的Pro模型;用于复杂的推理任务同时也可进行蒸馏定制的Premier模型。
功能方面,Nova模型支持微调(Fine-tuning),蒸馏(Distillation)训练更小的模型。Nova模型与Amazon Bedrock知识库深度集成,可用于RAG,以根据自己的数据生成响应。
性能层面,Amazon Nova模型与同类模型相比,Nova在所有基准测试中都是相等或更好,极具竞争力。
Nova Lite的同级别比较:
与OpenAI的GPT-4o Mini进行比较,Nova在19项基准测试中有17项相等或更好;
与Gemini 1.5 Flash进行比较,在21项基准测试中有17项相等或更好;
与Claude 3.5 Haiku进行比较,在12个项目中的10个项目基准测试中相等或更好。
Nova Pro的同级别比较:
与GPT-4o进行比较,在20个基准中的17个基准上相等或更好;
与Gemini 1.5 Pro进行比较,在21项基准测试中有16项相等或更好;
与Claude 3.5 Sonnet V2进行比较,Pro模型在一半的基准上相等或更好,即使在其他未超越的指标中,Pro模型也非常有竞争力。
发布图像生成模型Amazon Nova Canvas:
功能方面,通过自然语言文本,可生成工作室质量的图像,允许使用自然语言或文本来进行图像的编辑。通过内置的控件提供了色彩方案和布局方案。可追溯的水印以及内容审核帮助客户负责任地使用人工智能,以消除有害内容的产生。
性能方面,与业界生图主流模型DALL·E 3和Stable Diffusion 3.5 Large模型的相比:在两个最重要的变量(图像质量和指令跟随)方面,Nova Canvas模型表现更优。
发布视频生成模型 Amazon Nova Reel:
功能方面,让客户可以创建工作室级别质量的视频,完全控制摄像机的运动,包括平移运动、360度旋转和缩放。同时内置人工智能的安全和负责任使用控制,包括添加水印和内容审核等。目前支持6秒视频生成,两分钟的视频的功能也将在之后推出。
未来:在2025年一季度左右,亚马逊云科技将提供语音到语音的模型,允许输入语音,获得流畅的语音输出。在2025年年中左右,将提供多模态输入到多模态输出的前沿模型,支持文本、语音、图像及视频。
作为亚马逊云科技人工智能及生成式AI技术的深度使用方,Andy介绍了亚马逊在各领域如何应用生成式AI技术。零售业务,个性化推荐、购物代理Rufus等,提升购物体验。库存管理,机器人结合人工智能优化了包装和运输的处理时间和成本。智能家居,Alexa通过多模型架构提升语音交互能力。Amazon Lens,利用计算机视觉辅助购物搜索。此外,亚马逊还构建了服饰尺码模型等提升用户体验。
以构建单元为基础进行持续创新
根据客户需求进行创新,始终是亚马逊云科技发展和前行的动力。初创公司,推动着亚马逊不断创新。在2025年,亚马逊云科技将向全球创业公司提供10亿美元的支持计划,继续支持初创公司发展。在创立初始,亚马逊云科技就认为捆绑式的解决方案,即便“好用”,也不应该是我们追求的全部。亚马逊云科技将几乎所有技术能力分解为独立的组件——“构建单元”(building blocks),以易用、高性价比的组件形式服务客户,以满足客户各种场景的需求。亚马逊云科技也是在这个理念下持续创新,直至今日。
构建单元一:模型推理
模型推理将成为每个应用程序的一部分,并需要一个可大规模提供推理的平台——这就是亚马逊云科技独一无二的Amazon Bedrock。Bedrock是构建和扩展生成式AI应用的最简单方式,它提供生成式AI集成到应用所需的一切。许多领先公司如Salesforce、SAP等也在深度集成Bedrock,为他们的客户提供生成式AI应用。
有些模型具备专业知识但成本高、速度慢,有些模型成本低、速度快但能力有限。模型蒸馏可解决这个问题,通过大型模型获取数据和答案,来训练一个较小的专业模型,但这需要机器学习专家,过程十分复杂。为简化这一过程,亚马逊云科技发布模型蒸馏功能。蒸馏的模型可以提升推理速度高达500%,成本降低75%。用户只需提供应用示例提示,Bedrock会为用户自动完成蒸馏过程,最终获得一个定制的、具备专业知识、合理延迟和合理性价比的蒸馏模型。
今天,将生成式AI深度集成到企业应用并投入生产仍面临挑战。在企业级场景下”偶尔出错”也是不被允许的,准确性至关重要。发布自动推理检查功能,有助于检测幻觉、提供可验证的证据证明大型语言模型的准确性。自动推理不是猜测或预测准确性,而是依靠可靠的数学技术来明确验证是否符合专家创建的自动推理政策,从而提高透明度。
单个Agent能够执行简单的多步骤任务,然而客户希望能够通过整合数百个Agents执行复杂任务,这在技术上极其困难。发布Bedrock multi-agent collaboration以支持复杂工作流程。它可确定哪些Agent访问机密信息,按顺序触发或并行执行任务。如果多个Agents返回信息,它可在其间解决分歧,将它们分配到不同任务,并确保所有协作都针对专用Agent。
构建单元二:计算
发布基于英伟达的Blackwell芯片P6系列实例并将于明年初推出。P6实例将比当前GPU快2.5倍,并将广泛使用。
正式推出Amazon EC2 Trn2实例,相较GPU实例,Trn2实例的性价比高出30%至40%。Trn2实例集成16个Trainium2芯片,由高带宽低延迟的NeuronLink技术实现互连。单节点提供20.8 pFLOPS FP8算力,专为生成式AI训练和推理而构建。Adobe、Poolside、Databricks、Qualcomm等创新公司已大规模投入使用Trainium2。
来自Apple公司的机器学习和人工智能高级总监Benoit Dupin介绍了Apple公司如何使用亚马逊云科技Graviton3、Inferentia2以及Trainium2等高性价比芯片,构建Apple Intelligence等人工智能服务。
Matt宣布将在2025年推出Trainium3芯片。Trainium3是亚马逊云科技基于3纳米先进工艺制造的首款芯片,是Trainium2性能的两倍,同时能效提升40%。
构建单元三:存储
全新发布Amazon S3 Tables,专为Iceberg设计的全新型存储类别,以应对快速增长的数据湖需求。Amazon S3 Tables可提高所有Iceberg表的性能和可扩展性。针对存储在S3中的Parquet文件类型,可获得3倍的查询性能及每秒事务量10倍提升。这使得S3完全重新定义了面向数据湖的对象存储,提供更好的性能、成本和规模扩展能力。
当达到PB或EB级别存储规模时,元数据(Metadata)就变得非常重要。元数据可帮助组织了解存储在S3中的对象的信息,从而找到所需的数据。基于此,亚马逊云科技正式发布Amazon S3 Metadata服务,可自动从对象中提取元数据,并近实时地将其存储在新的S3 Tables桶中(Iceberg表),以支持后续使用分析工具进行元数据查询。当对象发生变化时,S3会自动在几分钟内更新相应的元数据。为客户解决了大规模数据分析中的元数据管理挑战,让他们能够高效发现和利用数据而不必从事重复性的基础设施构建工作。这是亚马逊云科技在数据湖和分析领域持续创新的又一力作。
构建单元四:数据库
全新发布Amazon Aurora DSQL,具有免运维体验的分布式SQL数据库,可在全球范围内实现跨区域部署,并无限扩展,具备99.999%的多区域高可用性及强数据一致性,同时兼顾低延迟,是迄今为止最快的全球化部署的分布式SQL数据库,比Google Spanner快4倍。
同时,针对NoSQL数据库,亚马逊云科技也发布了Amazon DynamoDB global tables的多区域强一致性功能。至此,无论客户需要SQL还是NoSQL,亚马逊云科技都可以提供在全球可快速扩展的高可用数据库,支持数据强一致支持,并具备极低的读写延迟。
强大生成式AI助手Amazon Q重大发布
根据亚马逊云科技的观察和调研,大多数开发人员大量时间都花在了除代码编写以外的端到端的开发上。基于开发人员的痛点,Amazon Q Developer全新推出三个Agent,用于生成单元测试、文档和代码审查,可以帮助解决这个问题。Amazon Q现在可以支持端到端的全面单元测试,准确的文档生成以及代码审查,大幅减少花费在这些非常重要但无差异的任务上的时间,让开发人员能够花更多时间在那些创造性任务上。
宣布Amazon Q Developer与GitLab的深度集成,Q Developer的功能将深深植根于GitLab平台中,帮助支持他们人工智能助手Duo。Q Developer将在GitLab工作流中本地可用,并将添加越来越多的功能。
实际上,大量的开发人员时间都花在维护、现代化和修补现有应用程序上。在此前发布的对于Java应用程序迁移的功能后,再次发布将.NET应用迁移为Linux应用,将VMWare工作负载迁移为云原生架构,以及IBM等大型机应用程序的迁移服务。
Amazon Q Business可连接不同的业务系统、企业数据源,无论这些数据源来自亚马逊云科技、第三方应用程序,所有这些数据都可以在安全和隐私的前提下进行更好的搜索,并跨越各种数据库与所有企业数据进行对话。
Q Business为企业数据创建了一个索引。它从Adobe、Microsoft Office、SharePoint、Gmail、Salesforce、ServiceNow等源索引过去一年的数据,并且持续更新这个索引并对所有这些数据保持高度安全,同时维护用户权限。本次发布将QuickSight和Q Business的数据全部结合的新功能,通过QuickSight和Q Business以及与之相关联的系统,例如Salesforce系统数据拉入QuickSight报告快速得到更加全面的QuickSight仪表板,使QuickSight作为BI工具变得更加强大。
而通过全新的Q Business API,独立软件开发商可在自有软件中集成Amazon Q index,使得应用程序变得更强大、更个性化。
发布Q Business Automate功能,帮助创建跨团队和应用程序的自动任务,通过使用一系列高级Agent来创建、编辑和维护工作流程,使它们更有弹性。在启动工作流程后,会有一个Q Agent不断监控它,以确保它能够自动调整并修复任何发生的更改。
最广泛和深入的分析服务重大发布
Matt在发布会中指出,Amazon SageMaker被越来越多客户用来处理和准备他们的数据,用于机器学习的工作负载。亚马逊云科技思考如何构建一个整合的体验,将数据、分析、人工智能及数据治理融为一体。基于此,亚马逊云科技从产品及品牌方面重新定义Amazon SageMaker,将其定位为所有数据、分析和人工智能需求的中心。
全新发布Amazon SageMaker Unified Studio,提供整合的数据和人工智能开发环境,允许客户访问组织中的所有数据,并使用最适合的工具。它将目前亚马逊云科技各种服务:1)Amazon EMR、Amazon Glue、Amazon Redshift、Amazon Bedrock中独立的Studio,2)查询编辑器,3)各种可视化工具,整合到现存的Amazon SageMaker Studio中。
全新发布面向应用程序的Zero-ETL,帮助客户无需构建和管理数据管道,便可分析存储在业界流行的第三方SaaS应用程序中的数据。并全新发布Amazon SageMaker Lakehouse,兼容Apache Iceberg,针对所有结构化和非结构化数据源提供单一界面,跨不同数据源提供简单统一的数据接入与访问控制。
我们正处于一个重大时刻,也是创新的最佳时机。前所未有的丰富且强大的工具能够帮助您实现创新。在亚马逊云科技,我们持续创造,助力您更好创新。
本文链接:http://www.xihao.site/showinfo-1-63049.html年度SOTA性价比王者模型Nova横空出世,四大领域拉开技术代差