网站标签|RSS订阅 欢迎来到本站-鸟儿博客,我们的网址是:www.baidu.com

广告区域

广告区域

Meta蓄势待发:Llama 3开源大模型7月亮相,AI行业迎来新变革

30 分类:网络热点 | 来源:互联网 | 时间:2024年03月03日
【Meta计划于今年7月发布最新的开源大模型Llama 3,预计将带来性能的显著提升,并可能在多模态支持方面取得进展,同时继续保持开源策略以推动人工智能行业的开放发展。】Sora的讨论激发了对人工智能未来发展的广泛猜测。一些人认为Sora可能成为实现通用人工智能(AGI)的关键一步,而其他人则认为它仅仅是在Transformer架构和扩散模型结合上迈出了新的技术路线。尽管对Sora的期待各异,但大模型之间的竞争远未结束。在这场竞争中,Meta的Llama模型以其开源特性成为一股不可忽视的力量。去年7月,Meta推出了性能更强大的Llama 2,并将其开源协议从仅限研究使用转变为免费商用,这一转变不仅催生了许多基于Llama 2的衍生模型,也重塑了大模型领域的竞争格局。然而,AI技术的迅速发展意味着Llama 2的优势并未持续太久。法国的Mistral模型在2月推出了与GPT-4相媲美的闭源大模型,而谷歌的Gemma开源模型也在性能上超越了Llama 2。面对这些挑战,Meta的CEO马克・扎克伯格在今年1月宣布,Meta AI已经开始训练Llama 3,预计将在今年7月正式发布。扎克伯格在Instagram上的宣布视频中暗示,Meta的AI算力资源将是支持Llama 3大规模预训练的关键。据悉,Meta计划到2024年底拥有350,000块英伟达H100 GPU,这将使其算力资源达到近600,000块H100,足以支持Llama 3的复杂训练需求。Llama 3的参数规模尚未公布,但预计将延续Llama系列的多个参数版本。有传言称,最大版本的Llama 3将拥有超过1400亿参数,直接对标GPT-4等领先模型。此外,Llama 3将在处理争议问题时提供更好的回答,这可能需要改进模型的上下文理解能力。在Llama 2中,Meta已经将上下文长度翻倍,使模型在推理过程中能够处理更多的Token上下文。随着大模型厂商纷纷转向多模态研究,Meta也有望在Llama 3中加入对图像和音频的支持,以实现文字、图片、声音和视频的多模态生成。虽然扎克伯格在官宣视频中只确认了Llama 3将包含代码生成功能,但他也在谈论人工智能与元宇宙结合的可能性,暗示了Meta在多模态能力上的野心。开源策略对于Meta来说至关重要。Llama 3是否会继续开源,将对整个人工智能行业产生重大影响。作为开源大模型的领军者,Meta已经联合多家企业和研究机构成立了AI联盟,以推动开源大模型生态的建设。扎克伯格和Meta首席人工智能科学家Yann LeCun都表达了对开源的支持,认为开源能够加速技术进步并防止人工智能系统被少数公司控制。Meta的愿景是通过开源推动人工智能的全面发展,从推理到规划、编码、记忆等各个领域。尽管Llama 3可能不会实现AGI,但Meta正朝着这一目标迈进。Llama 3的成功与否,将取决于其性能提升和开源策略的执行,以及如何应对来自谷歌等竞争对手的挑战。在Llama 3发布之前,大模型的未来仍然充满变数。和讯自选股写手风险提示:以上内容仅作为作者或者嘉宾的观点,不代表和讯的任何立场,不构成与和讯相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。和讯竭力但不能证实上述内容的真实性、准确性和原创性,对此和讯不做任何保证和承诺。
« 上一篇 下一篇 »

发表评论