探索HuggingFace空间：获取永久地址与运行指南

文章主题：部署, Hugging Face, 地址, 永久地址

“分享一个简单的部署 ChatGLM2-6B 模型到 Huggingface Space 在线空间的方法。”

—

在这篇文章：终于部署成功！GPU 云环境搭建 ChatGLM2-6B 坎坷路中，用线上云算力的资源部署了一套 ChatGLM2-6B，最后显示一行提示：

“This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)”

这个地址仅有效72小时，若要获取永久地址，必须执行gradio deploy命令，将其部署至huggingface的服务器中。

开一个命令终端，试试部署到 Huggingface。‍‍

提示需要登录到 huggingface_hub 的 token。

打开 Hugging Face 网站，点击个人账户的设置部分（Profile）。

找到左边菜单中的“Access Tokens”，然后点击 “New token”。

截图中我的账号已经创建了好一个 token，见：没有硬件资源？免费使用Colab搭建你自己的Stable Diffiusion在线模型！保姆级教程，这次直接复制使用。

粘贴 token 到终端窗口，对询问“Add token as git credential? (Y/n)” 回复：“Y”，等了一会儿，给了我一闷棍：‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

别看满屏幕的字，有用的信息就两个：“Connection aborted.”，“Connection reset by peer”。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

联想到之前部署的时候，帮助文档里 Huggingface 赫然在列：‍‍‍

估计是无法直接连接了，怎么办？‍‍‍‍‍

—

想了半天，打开我的腾讯云账号，一咬牙，一跺脚，买了一个月的硅谷云服务器。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

终端登录，git 克隆 ChatGLM2-2B 仓库，然后执行 gradio deploy 命令。

出乎我的意外，居然也是同样的连接错误。看来虽然服务器地址不一样，还是执行了同样的网络策略。哭！

部署看起来简单，虽然只有一行命令，但是因为网络的连接问题，进展陷入了死胡同。

问问 ChatGLM，有没有什么好的解决方案。‍‍

看起来正确，感觉 ChatGLM2-6B 还真是不弱。国产之光，ChatGPT 国内产品的平替真不是白叫的。感兴趣的朋友，可以看 ChatGLM2-6B 初体验。

最后想到，既然是执行发布命令，连接到 Huggingface Space 空间去操作，其实把仓库克隆到本地电脑（有代理），再执行发布命令，是不是一样可行？‍‍‍‍‍‍‍

这个方案成功了，命令行下执行完 git 克隆命令，输入 token 之后，顺利进入下一步。部署命令 “gradio deploy” 会在 Huggingface 上创建一个你的仓库空间：‍‍‍‍‍‍‍‍‍

在苹果设备上创建一个新的Spaces Repo存储库，其路径位于用户目录下的Documents文件夹内，具体位置为/Users/huangyong/Documents/ChatGLM2-6B。

请记住，在回答后续问题时，除了硬件配置以外，其他都可以回车采用默认值。‍‍‍‍‍

在硬件领域，我们提供丰富的选择，包括CPU基础版（cpu-basic）、CPU升级版（cpu-upgrade）、T4小型版（t4-small）、T4中型版（t4-medium）、A10G小型版（a10g-small）、A10G大型版（a10g-large）以及A100大型版（a100-large）。对于CPU基础版，它提供了稳定且高效的性能，是各类应用的理想之选。

‍‍‍‍‍‍‍

这个地方输入：t4-medium，才能让 ChatGLM2-6B 跑起来。‍‍‍‍‍‍

在查阅ChatGLM-6B的官方文档时，我注意到其中提到了一些有关量化模型的设置。根据这些信息，似乎有可能通过优化配置让较少的硬件资源得以运行。然而，具体细节方面我并未投入足够的精力去深入研究。

第一次运行的时候，就按了回车，选择默认 cpu-basic 硬件配置，就没运行起来。‍

如果直接输入：t4-medium，会提示需要添加一个付款方式：You must add a payment method to your account 。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

当时我没关注这条提示信息，直接用基本配置 cpu-basic 部署，结果就是失败。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

RuntimeError：Found no NVIDIA driver。

如果硬件配置选择 t4-small，会卡在第5个 Checkpoint。‍‍‍‍‍

没有任何错误提示，也是卡这里郁闷了很久。也不报错，最后猜测是不是硬件资源里面内存不够，把空间升级到 medium，就能顺利运行起来了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

启动后，点右上角：“App”。

‍

Huggingface Space 提供一个永久的空间地址供访问：

作为一位专业的文章写作高手，我将重新组织原文内容并赋予其新的生命。原文链接为：https://huggingface.co/spaces/foghuang/ChatGLM2-6B。ChatGLM2-6B 是一个基于语言模型的人工智能助手，由清华大学 KEG 实验室与智谱 AI 公司于 2023 年共同训练推出。该助手具备良好的中文理解能力和生成能力，可以针对用户的问题和要求提供适当的答复和支持。在实际应用中，ChatGLM2-6B 可以用于智能客服、智能问答、智能推荐等领域，为用户提供更加便捷和高效的服务体验。

Space 上面还有很多好玩的，使用人工智能模型的应用，大家有兴趣可以点开试用。像下面的第一个就是文本和语音互转的应用。‍‍‍‍‍‍‍‍‍‍‍‍

https://huggingface.co/spaces

—

Huggingface Space 部署总结：‍‍‍‍‍

HF 注册账号；‍‍‍‍‍‍‍‍‍

添加 token；

添加支付方式，国内借记卡，信用卡均可；

能访问 HF 的环境；

默认情况下，硬件最小配置选择： t4-medium；

启动成功后，点 space 的 App，可以看到运行界面；

HF 提供永久地址，可以让应用被外部用户访问。

往期热门文章推荐：

ChatGLM2-6B 初体验

性能提升571%，32K超长上下文，推理速度提升42%，允许商用，国产开源大模型推出了二代 ChatGLM2-6B

不允许还有人不知道可以免费用 ChatGPT 的网站，ChatGPT3 和 4，Claude 和 Claude+ 一网打尽

没有硬件资源？免费使用Colab搭建你自己的Stable Diffiusion在线模型！保姆级教程

拥抱未来，学习 AI 技能！关注我，免费领取 AI 学习资源。

部署, Hugging Face, 地址, 永久地址

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复