在人工智能时代的迅猛发展中ღ◈★,定义清晰的“开源人工智能”标准将为未来的技术创新提供关键支持ღ◈★。最近ღ◈★,开源促进会发布的草案定义旨在解决当前人工智能领域中“开源”使用不当的问题ღ◈★,为开发者提供明确的指导ღ◈★。本文深入探讨了该定义如何有望创造一个既服务于公共利益ღ◈★,又为人工智能时代提供真正开放工具箱的未来城人电影7kღ◈★。我们将看到像 EleutherAI 和 Allen 研究所等非营利组织的工作如何为人工智能的开放生态系统注入动力ღ◈★,并推动技术的可持续发展ღ◈★。同时ღ◈★,我们也将讨论主要商业参与者如何调整策略尊龙凯时app下载ღ◈★!ღ◈★,采纳新的定义尊龙凯时人生就是博平台ღ◈★,以确保开源人工智能的长期发展和稳定性ღ◈★。这不仅关乎技术本身ღ◈★,还涉及到我们数字基础设施的未来以及全球范围内的创新能力ღ◈★。如果你对人工智能的未来充满好奇ღ◈★,或者希望了解开源技术如何塑造我们的数字世界ღ◈★,这篇文章将为你提供深入的洞察与启发ღ◈★。
几周前发布的一份约 500 字的文件将深刻影响互联网的未来ღ◈★。开源促进会(Open Source Initiative, OSI) 发布了一份接近最终版本的开源人工智能定义ღ◈★,该定义将解放广大的人工智能开发者社区ღ◈★,带来一场如同互联网创建般蓬勃发展的人工智能创新浪潮尊龙凯时人生就是博平台ღ◈★。开源软件是当今互联网基础设施和大多数应用程序的基石ღ◈★。这是因为开源软件的先驱们将其定义为始终可以自由使用和修改的软件ღ◈★。这推动了开源软件的广泛应用ღ◈★,并为我们的数字生活提供了创新动力ღ◈★。
此时发布恰当其时ღ◈★。我们看到ღ◈★,一波又一波的人工智能模型——其中许多来自最大的科技公司——打着“开源”的旗号ღ◈★,却未能体现最初开源软件定义的精神ღ◈★。虽然这可能看似只是语义上的问题ღ◈★,但名正言顺至关重要ღ◈★。围绕开源人工智能的草率用词可能会扼杀未来数万亿美元的创新ღ◈★,并让人工智能的发展掌控在少数大公司手中ღ◈★。
如果没有一个真正开放的人工智能开发精神和社区ღ◈★,损失将是巨大的ღ◈★。哈佛大学最近的一项研究表明ღ◈★,开源软件已创造了约 8 万亿美元的经济价值ღ◈★。所有这些创新都源自于 1998 年撰写的最初关于开源的定义ღ◈★:任何自称开源的软件都可以自由使用尊龙凯时人生就是博平台ღ◈★、研究开源计算机ღ◈★,ღ◈★、修改和共享ღ◈★。这意味着ღ◈★,你可以基于开源软件构建企业ღ◈★、政府服务——几乎任何事情ღ◈★,而无需担心将来有人会向你收费或改变该软件的使用条款ღ◈★。
我们将在人工智能领域看到同样的好处ღ◈★,但前提是开发人员能够自由使用凯时尊龙ღ◈★、研究城人电影7kღ◈★、修改和共享人工智能系统的所有元素ღ◈★。这里的“人工智能系统的所有元素”这一说法尤为关键ღ◈★。人工智能和软件之间存在一些重要的区别ღ◈★。人工智能系统包括由正在运行的人工智能模型和用于创建模型的基础训练数据构成的软件代码ღ◈★。开源促进会的新定义认为ღ◈★,代码和模型必须是开放的ღ◈★,数据必须是透明且可复现的ღ◈★。如果我们想开启下一个创造与创新的时代ღ◈★,我们就需要人工智能实验室(包括大型商业公司)在将其发布的内容称为“开源”之前ღ◈★,接受这一定义ღ◈★。否则ღ◈★,开发者可能会避开开放模型ღ◈★,整个开源生态系统可能会过早停滞ღ◈★。
大型科技公司纷纷推出大型语言模型(Large Language Modelღ◈★,LLM)ღ◈★,其中最引人注目的是 Meta 的 Llamaღ◈★,这些模型被称为开源模型ღ◈★。它们使构建人工智能应用变得更加容易ღ◈★,无需承担从头构建的高昂成本ღ◈★。我们已经看到许多有价值的人工智能应用ღ◈★,从药物发现到医学教育ღ◈★,都是基于这些模型构建的城人电影7kღ◈★。这确实是朝着正确方向迈出的一步ღ◈★,但需要注意的是ღ◈★:这些人工智能模型并非真正开放的ღ◈★。
在本周早些时候的一篇《经济学人》评论文章中ღ◈★,马克·扎克伯格和 Spotify 首席执行官丹尼尔·埃克将开源人工智能定义为“以宽松许可方式公开发布其权重的模型”ღ◈★,并以 Llama 为例ღ◈★。这种狭义的定义为 Meta 等公司留了一定的余地ღ◈★,如果他们的人工智能模型不再符合自身利益ღ◈★,可能会改变方向ღ◈★,停止发布其部分人工智能模型ღ◈★。如果出现这种情况城人电影7kღ◈★,基于这些模型开发的开发者可能会发现自己的产品无法运行ღ◈★,或者至少会受到严重限制——例如服务中断和创新受阻航空研究ღ◈★。ღ◈★。这不禁让人担心ღ◈★,基于这些模型的应用程序是否具有长期生存能力ღ◈★,甚至整个充满活力的开源人工智能生态系统的可持续性ღ◈★。
今年 2 月ღ◈★,Mozilla 和哥伦比亚大学召集顶尖专家探讨了在人工智能时代ღ◈★,开放性应具有什么样的含义ღ◈★。由此产生的论文指出ღ◈★,在人工智能领域狭隘和草率使用“开源”一词所带来的风险ღ◈★。它还对类似于 Llama 许可证的“伪开源”许可证提出了质疑ღ◈★,因为该许可证只允许每月用户少于 7 亿的产品免费使用尊龙凯时人生就是博平台ღ◈★。你能想象在开放软件基础上建立一家初创公司ღ◈★,但一旦业务成功ღ◈★,软件就会被限制使用吗?这正是这种许可证可能带来的后果ღ◈★。
该定义草案旨在应对这些风险——明确划定什么算作开源人工智能尊龙凯时人生就是博平台ღ◈★,以便开发人员清楚知道他们可以依赖什么ღ◈★。这将为人工智能实验室构建不会消失或最终关闭的开源人工智能模型注入动力系统实验室ღ◈★,ღ◈★。
例如ღ◈★,EleutherAI 的 GPT-NeoX-20B 在 Apache 2.0 许可证下发布ღ◈★,允许任何人使用该模型ღ◈★。同样尊龙凯时人生就是博平台ღ◈★,Allen 研究所的 OLMo 模型提供了用于开发该模型的代码ღ◈★、数据ღ◈★、权重和评估套件的全面访问权限ღ◈★,使研究人员能够深入研究和改进它ღ◈★。与 Meta 的 Llama 不同ღ◈★,这些模型允许研究人员全面研究和测试人工智能系统的内部运作ღ◈★,并根据自身需求进行调整先进计算机ღ◈★。
值得注意的是尊龙凯时人生就是博平台ღ◈★,像 Eleuther 和 AI2 这样的实验室都是非营利组织ღ◈★,这让开发人员相信这些资源将持续可用并不断更新ღ◈★,从而确保基于这些模型的产品的可持续性ღ◈★。基于同样的持久支持原则ღ◈★,Linux 和 Apache 等开源项目才能在全球服务器中如此流行ღ◈★。开发人员相信ღ◈★,Linux 和 Apache 基金会将继续为公众利益维护其软件的运行ღ◈★。
这些非营利组织的工作有望创造一个人工智能的未来凯时尊龙人生就是博ღ◈★,尊龙凯时 - 人生就是搏!ღ◈★,ღ◈★,既能服务于更广泛的公共利益ღ◈★,又能为人工智能时代提供一个真正开放的工具箱ღ◈★。政策制定者ღ◈★、慈善家以及更广泛的科技界应当积极支持这样的倡议城人电影7kღ◈★。主要的商业参与者应当以这些项目为榜样ღ◈★,调整他们的方法ღ◈★,使之更加符合开源促进会的新定义ღ◈★。如果我们能够做到这一点ღ◈★,我们就能让任何人——任何社区——都能塑造ღ◈★、享受和信任人工智能ღ◈★。我们数字基础设施的未来以及我们的创新能力都取决于此尊龙凯时人生就是博平台ღ◈★。
Mark Surman是 Mozilla 基金会的总裁ღ◈★,该全球非营利组织不仅开发 Firefox 浏览器ღ◈★,还倡导更开放ღ◈★、公平的互联网ღ◈★。Mark 目前专注于 Mozilla 的两个主要项目ღ◈★:投资负责任的科技初创公司(Mozilla Ventures)以及创建更可信的人工智能基础技术(Mozilla.ai)ღ◈★。在加入 Mozilla 之前ღ◈★,Mark 花了 15 年时间领导各类组织和项目ღ◈★,推动互联网和开源技术用于社会赋能ღ◈★。