专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELM

admin 2024年5月1日22:53:42评论16 views字数 746阅读2分29秒阅读模式

科技巨头苹果公司最近又新推出了一款名为OpenELM的开源大语言模型,与市面上其他LLM产品不同的是,OpenELM设计为直接在本地设备上运行,而无需云计算。以往LLM产品常为用户所诟病的一点就是隐私保护和数据安全,而通过将数据保留在本地进行处理,毫无疑问能够保障更高的安全性。

专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELM

据了解,OpenELM系列有八个模型,其中一半使用苹果的CoreNet库进行了预训练(原始模型),另一半经过了特定指令微调以增强其效用(更适合开发AI助手和聊天机器人),所有八款OpenELM模型都能处理至多2048词。这一系列模型现在可通过Hugging Face Hub(一个供AI开发人员分享及合作的热门平台)访问。

专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELM

这些模型的其中一个显著特点是它们使用了分层缩放策略,优化了Transformer 模型各层之间的参数分配。这种方法不仅节省了计算资源,还提高了在相对较小数据量上的训练性能。例如,在所需的预训练token数量减半的前提下,OpenELM相比于以前的模型(如OLMo),准确率仍提高了2.36%。

值得一提的是,苹果不仅公开了OpenELM模型的源代码,还发布了用于训练它们的CoreNet库。此外,该公司还附带了详细说明使得可以复制神经网络的权重系数,如此程度的透明度水平并不常见。通过发布源代码、模型权重、训练材料及日志,苹果表示其目标是“以最先进的语言模型赋予并丰富开放研究社区”。

论文链接:https://arxiv.org/pdf/2404.14619

编辑:左右里

资讯来源:Apple官网、Applemagazine

转载请注明出处和本文链接



专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELM
专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELM

球分享

专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELM

球点赞

专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELM

球在看

专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELM
“阅读原文一起来充电吧!

原文始发于微信公众号(看雪学苑):专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELM

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2024年5月1日22:53:42
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELMhttp://cn-sec.com/archives/2702694.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息