红帽认为,开源AI的最低标准应当是将开源许可证下的模型权重与开源软件组件相结合
三十多年前,红帽便洞察到开源开发和许可证能够推动更优质软件的诞生,从而加速IT创新。经过三千万行代码的积淀,Linux不仅成为了最成功的开源软件,也成长为至今最成功的软件之一。我们对开源原则的承诺延续至今,既体现在我们的商业模式中,也深深扎根于我们的企业文化中。我们坚信,若采用正确的方法,这些理念同样能够在人工智能(AI)领域产生深远的影响。然而,技术界对于“正确的方法”究竟是什么,依然存在广泛的争议。
AI,特别是推动生成式AI(Gen AI)发展的大型语言模型(LLM),不能简单地与开源软件类比。与软件不同,AI模型主要由模型权重构成,这些权重是决定模型如何处理输入以及它如何在各个数据点之间建立联系的数值参数。训练后的模型权重是通过广泛的训练过程生成的,这一过程涉及大量精心准备、混合和处理的训练数据。
尽管模型权重与软件不同,但在某些方面,它们履行的职能类似于代码。我们可以将数据类比为模型的源代码。在开源领域,源代码通常被定义为修改软件的“首选形式”。然而,单靠训练数据无法承担这一角色,因为训练数据通常体积庞大,且复杂的预训练过程使得每一项训练数据与训练后权重及模型最终行为之间的联系显得间接且微弱。
目前,许多AI模型的改进和增强并不涉及访问或修改原始训练数据。相反,它们通常通过修改或微调模型权重来实现,这些过程也可用于优化模型性能。要确保这些模型改进能自由进行,模型权重必须以开源许可证发布,并且用户应在开源许可证下享有全部权限。
红帽对开源AI的看法
红帽认为,开源AI的最低标准是将开源许可证下的模型权重与开源软件组件相结合。这是开源AI的起点,而非最终目标。我们鼓励开源社区、监管机构和行业在训练和微调AI模型时,继续朝着更大的透明度和与开源开发原则对齐的方向努力。
这是红帽作为开源软件生态系统成员,如何在实践中参与开源AI的观点。与开源倡议组织(OSI)提出的《开源AI定义》(OSAID)不同,我们的看法并非正式定义。到目前为止,我们的观点主要是关于如何实现开源AI,并确保它对广泛的社区、企业和供应商都能实现可访问性。
我们通过在开源社区中的工作将这一观点付诸实践,其中包括由红帽主导的InstructLab项目,以及我们与IBM研究院合作的Granite开源许可证模型系列。InstructLab大大降低了非数据科学家对AI模型的贡献门槛。通过InstructLab,各行各业的领域专家可以将他们的技能和知识贡献到InstructLab,这些贡献不仅用于内部使用,还能推动一个共享的、广泛可访问的开源AI模型供上游社区使用。
Granite 3.0模型系列覆盖了从代码生成、自然语言处理到从庞大数据集中提取洞察的广泛AI应用场景,所有这些都在一个宽松的开源许可证下进行。我们帮助IBM研究院将Granite代码模型系列引入开源世界,并继续从开源视角以及作为我们红帽AI产品的一部分支持这个模型系列。
近期DeepSeek的宣布引起广泛关注,它展示了开源创新对AI的影响,不仅局限于模型层面,还延伸到了更广的领域。而针对DeepSeek的做法,外界存在一定疑虑,特别是其模型的许可证未能明确说明模型的生产过程,这进一步突显了透明度的重要性。尽管如此,这一颠覆性创新也验证了我们对AI未来的看法:一个开放的AI生态,聚焦于更小巧、优化且开放的模型,这些模型能够根据特定企业的数据和使用场景,在全球范围内、跨越混合云环境进行定制。
扩展开源AI,超越模型
开源技术和开发原则始终是我们AI产品的核心,正如它们在红帽AI产品组合中所起的作用一样。红帽OpenShift AI基于Kubernetes、KubeFlow以及符合Open Container Initiative(OCI)标准的容器,融合了众多云原生开源技术。而红帽企业Linux AI(RHEL AI)则整合了来自IBM的开源许可证Granite LLM系列和InstructLab开源项目。
红帽在开源AI领域的工作不仅限于InstructLab和Granite模型系列,它还涵盖了实现和有效利用AI所需的各种工具和平台。我们积极参与并推动越来越多的上游项目和社区,同时自主发起了多个项目,包括(但不限于):
· RamaLama:简化本地管理和服务AI模型的开源项目;
· TrustyAI:为构建更负责任的AI工作流提供的开源工具包;
· Climatik:帮助减少AI在能源消耗方面负面影响的项目,推动AI的可持续发展;
· Podman AI Lab:专注于为开源LLM模型提供实验支持的开发者工具包;
· Neural Magic:收购这家公司进一步推动了我们的AI愿景,使企业能够将更小、更优化的AI模型(包括开源许可证模型)与其数据进行对接,无论数据存储在哪里,都能跨越混合云环境进行无缝连接。IT组织可以借助vLLM推理服务器来支持这些模型的决策和输出,从而构建一个以透明性和支持技术为基础的AI堆栈。
对红帽而言,开源AI在混合云中得到了真正的生命。混合云为每个AI工作负载选择最合适的环境提供了灵活性,从而能够优化性能、成本、可扩展性和安全性需求。我们的平台、目标和企业都支持这一努力,我们期待与行业伙伴、客户以及更广泛的开源社区携手合作,持续推动开源AI创新。
在AI领域,拓展开放合作的潜力巨大。我们展望的未来不仅关注模型的透明度,还包括训练过程的开放。无论是下周、下个月,还是更快(AI发展迅速),我们将继续支持并推动AI的自主化与开放性,突破开源AI的边界。(作者:Chris Wright)
早春“针织衫”才是刚需,选款和搭配都总结好了,照着穿真减龄早春的季节,温度回升,我们的衣衫也变得轻薄起来。尤其是在温暖的南方地区,春季的氛围也是越来越浓烈。轻薄、软糯、甜美的针织衫,也成为女性必备单【详细】
40岁女人衣品更重要,简约优雅不失时尚,基础款穿出高级感世人都说40岁男人是一朵花,其实这个年龄段女性,也是有自己优势。这种具体表现在,就是自己得体穿着,姣好气质。衣品上代表你对生活审美,以及自己时【详细】