参考消息网2月27日报道据香港《南华早报》网站2月25日报道,中国人工智能(AI)初创企业深度求索披露了其低成本、高性能模型的技术细节,驳斥了有关其虚报成本的指控,也赢得了开源社区的欢呼。
这家总部位于杭州的公司正在如其所承诺的,于本周陆续开源五个AI基础设施项目。它在24日和25日分别开源了名为和的项目,这两个项目旨在从芯片中获取最佳性能,以实现经济高效的模型训练和推理任务。
美国旧金山AI行业解决方案提供商龙鳞工业公司的首席技术官斯蒂芬·皮门特尔在社交平台X上发帖表示,深度求索公司将这项技术及其在模型训练方面所做的工作开源,“有力驳斥了外界常说的‘他们在训练程序上撒谎’的论调”。
开源开发者对深度求索公司的项目纷纷表示赞赏。“深度求索公司正再次拓展AI基础设施的极限。”X平台上一名评论人士说。
深度求索公司此前发布了两个开创性的开源AI模型:V3大语言模型和R1推理模型,它们可以与美国AI巨头——包括微软支持的开放人工智能研究中心()和亚马逊支持的公司——最出色的模型相媲美。
深度求索公司的预算有限,远低于其规模更大的竞争对手,这导致有人称该公司在开发成本方面误导公众。
帕尔默·勒基就是持怀疑态度的人之一,他是虚拟现实公司奥克卢斯的创始人,该公司已被元宇宙平台公司收购。勒基上个月称深度求索公司的预算是“假的”,但承认它“确实表现不俗”。
深度求索公司在其技术报告中表示,这种具有成本效益的培训的秘诀是一系列创新的结合,从混合专家模型到多头潜在注意力机制。
这份报告称,本周推出的和开源项目表明,该公司继续在内存带宽、计算速度和芯片间通信速度方面最大限度地发挥芯片的性能,凸显了它以性能较弱芯片和较低训练成本,拓展AI模型训练边界的能力。(编译/朱丽)
1月28日拍摄的手机应用程序界面(美联社)
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
加入IP合伙人(站长加盟) | 全面包装你的品牌,搭建一个全自动交付的网赚资源独立站 | 晴天实测8个月运营已稳定月入3W+
限时特惠:本站每日持续更新海量内部创业教程,一年会员只需98元,全站资源免费无限制下载点击查看会员权益
站长微信: qtw123cn
