问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

树莓派 Zero“硬核改造”：8 年老设备实现本地运行大语言模型

创作时间:

作者:

@小白创作中心

树莓派 Zero“硬核改造”：8 年老设备实现本地运行大语言模型

引用

1

来源

1.

https://k.sina.cn/article_1826017320_6cd6d02802001dz2e.html

近年来，本地运行大语言模型（LLM）的趋势愈发明显，越来越多的人开始在个人电脑或系统上部署这些模型。近日，越南开发者Binh Pham在树莓派Zero上成功运行大语言模型的创新实验引发了广泛关注。

越南开发者Binh Pham最近尝试使用树莓派Zero（Raspberry Pi Zero）进行了一项创新实验。他成功地将这款设备改造为一个小型USB驱动器，使其能够在本地运行LLM，无需任何额外设备。这一项目主要得益于llama.cpp和llamafile的支持，这两者结合了指令集和一系列轻量级软件包，旨在提供一种离线的轻量级聊天机器人体验。

然而，由于树莓派Zero已经问世八年，其硬件性能有限，因此将llama.cpp移植到该设备并非易事。首先，Pham将设备连接到USB接口，并为其3D打印了一个外壳。

在解决了硬件问题后，项目又因树莓派Zero W的512MB内存限制而变得更加复杂。在尝试将llama.cpp编译到该设备时，Pham遇到了失败，此前也无人尝试在树莓派Zero或One上编译该软件。

问题的根源在于树莓派Zero的CPU采用的是ARMv6架构。为了克服这一障碍，Pham不得不对llama.cpp的ARMv8指令集进行转换，并移除所有基于现代硬件的优化或注释。

在成功修改llama.cpp源代码后，Pham将注意力转向软件的运行和用户体验的优化。他构建了一个基于文本文件输入的LLM实现，这些文本文件作为主要的提示，而LLM则会根据这些提示生成故事，并以完整的输出文件形式返回。

为了测试性能，Pham设置了64个token的限制，并对15M到136M不等的多个模型进行了基准测试。其中，Tiny15M模型的每个token处理速度为223毫秒，而较大的Lamini-T5-Flan-77M模型的每个token处理速度为2.5秒，SmolLM2-136M模型的每个token处理速度为2.2秒。

这些token处理速度表明，该设备在许多实际应用场景中可能会显得过慢。尽管这一项目具有创新性，但在实际应用中，使用老旧的轻量级硬件运行本地LLM并不具备太多实用价值。相比之下，使用更复杂的模型，例如在树莓派5上运行Deepseek，可能会是更好的选择。

热门推荐

心神不宁老是害怕怎么回事

心神不宁老是害怕怎么回事

财务新手必知：所得税费用的基本概念与计算

财务新手必知：所得税费用的基本概念与计算

提高产品的易用性、可用性与无障碍设计概念分享

提高产品的易用性、可用性与无障碍设计概念分享

茴香巧妙入菜，打造美味不腻的菜肴

茴香巧妙入菜，打造美味不腻的菜肴

斗拱新生，古建筑智慧在现代设计中的华丽变身

斗拱新生，古建筑智慧在现代设计中的华丽变身

书法投稿尺寸指南：从手卷到斗方的创作尺寸详解

书法投稿尺寸指南：从手卷到斗方的创作尺寸详解

鱼肉的营养价值及功效

鱼肉的营养价值及功效

跨省通勤•京津冀协同发展11年特别报道①｜北京居民高剑：“打”个高铁去雄安上班

跨省通勤•京津冀协同发展11年特别报道①｜北京居民高剑：“打”个高铁去雄安上班

如何了解基金市场的现状？这些现状对投资决策有何启示？

如何了解基金市场的现状？这些现状对投资决策有何启示？

互联网产品经理的岗位职责

互联网产品经理的岗位职责

销售如何完成各项目标

销售如何完成各项目标

经常做梦是好是坏

经常做梦是好是坏

疝气到底是什么病？

疝气到底是什么病？

罗马王政时代（上）：军事民主制度下的社会结构与政治机构

罗马王政时代（上）：军事民主制度下的社会结构与政治机构

量化系统开发：选择合适的编程语言

量化系统开发：选择合适的编程语言

怎么算自己的阴历生日如何算自己的阴历生日

怎么算自己的阴历生日如何算自己的阴历生日

揭秘蝴蝶翅膀之美：探索结构与色彩背后的科学原理及创意应用

揭秘蝴蝶翅膀之美：探索结构与色彩背后的科学原理及创意应用

透明干燥剂颗粒有毒吗

透明干燥剂颗粒有毒吗

精品水果生意的甜蜜暴击：水果为什么越来越甜了

精品水果生意的甜蜜暴击：水果为什么越来越甜了

公安系统招聘考试备考指南：从笔试到面试全方位攻略

公安系统招聘考试备考指南：从笔试到面试全方位攻略

日本小说《丑男真战士》将要动画化！讲述“长相丑陋的肥胖勇者”异世界冒险故事！

日本小说《丑男真战士》将要动画化！讲述“长相丑陋的肥胖勇者”异世界冒险故事！

砍柴犯法：法律解读与实践应对

砍柴犯法：法律解读与实践应对

小天鹅在湖北竹山“休整”觅食

小天鹅在湖北竹山“休整”觅食

不粘锅能放洗碗机吗？家居清洁与保养指南

不粘锅能放洗碗机吗？家居清洁与保养指南

生产总值的构成和影响因素有哪些？这些影响因素如何推动经济增长？

生产总值的构成和影响因素有哪些？这些影响因素如何推动经济增长？

睡觉或运动时突然抽筋，真的是因为缺钙吗？

睡觉或运动时突然抽筋，真的是因为缺钙吗？

睡眠不足第二天血压高？原因、治疗与预后全解析

睡眠不足第二天血压高？原因、治疗与预后全解析

家装中双控开关的正确接线方法是什么？错误接线会带来哪些安全隐患？

家装中双控开关的正确接线方法是什么？错误接线会带来哪些安全隐患？

巢湖的区域划分是如何进行的？这种划分对当地居民生活有何实际意义？

巢湖的区域划分是如何进行的？这种划分对当地居民生活有何实际意义？

建筑设计师与房地产专家必备的10种住宅3D渲染类型

建筑设计师与房地产专家必备的10种住宅3D渲染类型

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号